はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ ベンチマーク

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 345件)

AGIに最も近いAI「o3」登場──米OpenAI まずは「mini」を25年1月末に公開

2024/12/20 このエントリーをはてなブックマークに追加 30 users Instapaper Pocket Tweet Facebook Share Evernote Clip AGI 米OpenAI mini 汎用人工知能 ハイスコア

米OpenAIは12月20日(現地時間)、新たなAIモデル「o3」を発表した。12日間に渡って開催してきた配信イベント「12 Days of OpenAI」の最終日となる12日目に発表した。同社が一般公開している中で最高性能の「o1」よりも性能が高く、汎用人工知能(AGI)としての性能を評価するベンチマークでもこれまでにないハイスコア... 続きを読む

【Ubuntu日和】 【第66回】6年前のPC、Ubuntuをインストールして使い続けるか、買い替えるか。ベンチマークから占うことにした。

2024/12/20 このエントリーをはてなブックマークに追加 14 users Instapaper Pocket Tweet Facebook Share Evernote Clip Ubuntu Ubuntu日和 第66回

続きを読む

動画生成AI「Veo 2」──米Googleが突如発表 性能は“Sora超え”とアピール 「物理学や人間の動きを理解している」

2024/12/16 このエントリーをはてなブックマークに追加 22 users Instapaper Pocket Tweet Facebook Share Evernote Clip 動画生成AI アピール 物理学 性能 米Meta

米Googleは12月16日(現地時間)、動画生成AI「Veo 2」を発表した。最大4Kの解像度で数分尺の動画を作成できる。米Metaのベンチマーク「MovieGenBench」で他の動画生成AIと性能を比べたところ、米OpenAIの動画生成AI「Sora Turbo」などよりも高い性能を記録したとしている。 続きを読む

科学論文の調査に特化したAIモデル「OpenScholar」がベンチマークでGPT-4oを上回る、科学研究の大幅な効率化に期待

2024/11/22 このエントリーをはてなブックマークに追加 20 users Instapaper Pocket Tweet Facebook Share Evernote Clip chatgpt GPT-4o 論文 科学文献 ワシントン大学

近年は生命分子の構造と相互作用を予測するAIモデル「AlphaFold 3」がリリースされたり、「ChatGPTのおかげで論文を読む手間が99%減った」と研究者が報告したりするなど、科学研究におけるAIの活用はますます重要なものになっています。新たに、ワシントン大学とアレン人工知能研究所の研究チームが、科学文献の調査に... 続きを読む

Ryzen 7 9800X3Dをベンチマーク:Ryzen 7 9700Xや7800X3Dと徹底比較してみた | ちもろぐ

2024/11/17 このエントリーをはてなブックマークに追加 14 users Instapaper Pocket Tweet Facebook Share Evernote Clip ちもろぐ 徹底 Ryzen 7 9700X 7800X3D

最強のゲーミングCPUとウワサされる「Ryzen 7 9800X3D」を、読者さんの助太刀でなんとか1つ買えました。 ライバルに挙げられる「Ryzen 7 9700X」や「Ryzen 7 7800X3D」など、全部で8個のCPUとベンチマークや実際のゲームプレイで徹底比較します。 (公開:2024/11/17 | 更新:2024/11/17) この記事の目次 Toggle やかも... 続きを読む

OpenAIのCEOが「o2が博士号レベルのベンチマークで105%のスコアを達成」とSNSに投稿、次期AIモデルはGPT-4oでも53.6%しか記録できなかった高難度テストで約2倍のスコアを達成か

2024/11/03 このエントリーをはてなブックマークに追加 19 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI SAMA サム GPT-4o CEO

OpenAIのサム・アルトマンCEOが自身のXアカウントに「o2がGPQAで105%のスコアを達成したと聞いた」と2024年11月3日(日)に投稿しました。「o2」の正式名称は不明ですが、OpenAIが開発中の次世代AIモデルが驚異的な性能を備えている可能性が濃厚となっています。 i heard o2 gets 105% on GPQA— Sam Altman (@sama) Novem... 続きを読む

【Hothotレビュー】 すべてが新しい「Core Ultra 200S」をベンチマーク。Ryzenとの勝負の行方は?

2024/10/24 このエントリーをはてなブックマークに追加 16 users Instapaper Pocket Tweet Facebook Share Evernote Clip Ryzen Hothotレビュー 行方 Core Ultra

続きを読む

連番IDを使うと会社が潰れる。(訳: 連番とUUIDのベンチマークを取ってみた❤️)

2024/10/06 このエントリーをはてなブックマークに追加 237 users Instapaper Pocket Tweet Facebook Share Evernote Clip UUID 連番 会社

大いなる流れには逆らえない あるAI研究者が言っていた、私の仕事もいつか AI に奪われるという言葉が非常に印象的だった。 私は一時期自分のキャリアに危機感を覚えAIに関する情報を集めていた。そのとき見つけたYoutube動画でこのようなことが語られていたのである。 ではなぜ彼らは研究を続けるのかと思うかもしれな... 続きを読む

GoogleがTensor G4はベンチマーク性能が低いのは意図的だと開き直る

2024/08/21 このエントリーをはてなブックマークに追加 5 users Instapaper Pocket Tweet Facebook Share Evernote Clip Tensor G ベンチマーク性能 Google Pixel

GoogleがTensor G4はベンチマーク性能が低いのは意図的だと開き直る Googleが8月14日に発表したPixel 9シリーズでは新しいチップセットとしてTensor G4を搭載し、Googleの説明では電力効率や性能向上に伴いアプリ起動やバッテリー持続時間が改善したとしています。しかし、実際のベンチマークでは競合のSnapdragon 8 Gen... 続きを読む

「Ryzen 9 9950X」「Ryzen 9 9900X」は“約束された”最強のCPUになれたのか? ベンチマークで見えた利点と欠点 (1/6)

2024/08/14 このエントリーをはてなブックマークに追加 10 users Instapaper Pocket Tweet Facebook Share Evernote Clip CPU 欠点 利点 最強 Ryzen

2024年8月14日、AMDはSocket AM5向けCPU「Ryzen 9000シリーズ」の最上位モデル「Ryzen 9 9950X」および「Ryzen 9 9900X」の販売をグローバル市場において解禁した。国内における発売日は8月23日午前11時、予想価格はRyzen 9 9950Xが税込約11万9800円、Ryzen 9 9900Xは約8万8800円である。 先日国内販売が解禁された「Ryz... 続きを読む

OpenAIが無料で使えるAIモデル「GPT-4o mini」をリリース、マルチモーダルで画像や音声入力にも対応

2024/07/19 このエントリーをはてなブックマークに追加 12 users Instapaper Pocket Tweet Facebook Share Evernote Clip Intelli マルチモーダル GPT-4 OpenAI 後継

OpenAIが2024年7月18日に、コスト効率に優れた小型モデルの「GPT-4o mini」を発表しました。低コストでありながら、一部のベンチマークでGPT-4を上回るスコアを示したGPT-4o miniは、GPT-3.5の後継として無料ユーザーとChatGPT Plusのユーザーに提供が開始されています。 GPT-4o mini: advancing cost-efficient intelli... 続きを読む

ネットワーク パフォーマンスの解読: TCP と UDP のバルクフローのベンチマーク | Google Cloud 公式ブログ

2024/07/06 このエントリーをはてなブックマークに追加 191 users Instapaper Pocket Tweet Facebook Share Evernote Clip UDP TCP マルチモーダル Vertex 解読

Gemini 1.5 モデル をお試しください。Vertex AI からアクセスできる、Google のもっとも先進的なマルチモーダル モデルです。 試す ※この投稿は米国時間 2024 年 6 月 22 日に、Google Cloud blog に投稿されたものの抄訳です。 Google Cloud ネットワーキング チームは長年にわたり、お客様のネットワークの構築、修正... 続きを読む

デコンパイルに特化した大規模言語モデル「LLM4Decompile」の登場

2024/06/27 このエントリーをはてなブックマークに追加 57 users Instapaper Pocket Tweet Facebook Share Evernote Clip デコンパイル 要点 焦点 再コンパイル 精度向上

3つの要点 ✔️ デコンパイルに特化した初のオープンソースモデル「LLM4Decompile」を開発 ✔️ モデルに新しい学習目的を導入し、デコンパイルの精度向上を実現 ✔️ 再コンパイルと再実行可能性に焦点を当てたデコンパイルのための初の標準化されたベンチマークを構築 LLM4Decompile: Decompiling Binary Code with Large Langu... 続きを読む

CPU・2D・3D・メモリ・ディスクの5項目で徹底的にベンチマークするWindows版「PassMark PerformanceTest」Ver.11レビュー

2024/06/23 このエントリーをはてなブックマークに追加 10 users Instapaper Pocket Tweet Facebook Share Evernote Clip CPU メモリ ベンチ ディスク 2Dグラフィックス

「CPU」「2Dグラフィックス」「3Fグラフィックス」「メモリ」「ディスク速度」の5項目について、それぞれ複数のベンチマークを行って詳細な数値化を行ってくれるベンチマークソフトが「PassMark PerformanceTest」です。 かつて「Performance Test 7」および「Performance Test バージョン10.0」をレビューしたことがあ... 続きを読む

Apple M4のベンチマークスコアが高かった理由はARMv9化? IPCはM3から3%向上に留まる可能性

2024/05/11 このエントリーをはてなブックマークに追加 16 users Instapaper Pocket Tweet Facebook Share Evernote Clip IPC ベンチマークスコア Apple 新しいプロセッサ 性能

Apple M4のベンチマークスコアが高かった理由はARMv9化? IPCはM3から3%向上に留まる可能性 Appleが発表した新型iPad Proでは同社が開発した新しいプロセッサのApple M4を搭載し、発売前に登場したGeekbench 6のベンチマークでは同社のM3を20%以上超える性能を実現し、エンタープライズ向け製品であるM2 Max搭載のMac St... 続きを読む

Databricks、“オープン”な汎用LLM「DBRX」リリース 商用利用可

2024/03/28 このエントリーをはてなブックマークに追加 8 users Instapaper Pocket Tweet Facebook Share Evernote Clip Databricks マルチモーダル moe リリース 既存

米AI企業のDatabricksは3月27日(現地時間)、“オープンな”汎用LLM「DBRX」を発表した。同社によると、DBRXは標準的なベンチマークで既存のすべてのオープンモデルより優れたパフォーマンスを発揮するという。ただし、マルチモーダルではない。 DBRXは、オープンソースプロジェクトMegaBlocksに基づいて構築されたMoE(M... 続きを読む

Appleの研究者、マルチモーダルLLM「MM1」の論文発表 視覚タスクではGPT-4Vに匹敵

2024/03/18 このエントリーをはてなブックマークに追加 18 users Instapaper Pocket Tweet Facebook Share Evernote Clip moe MLLM マルチモーダルLLM パラメータ 混合

MM1は、画像とテキストのペア、画像とテキストの混合データ、テキストのみのデータの混合でトレーニングされている。Mixture-of-Experts(MoE)や教師あり微調整でパラメータを300億までスケールアップすることで、比較的コンパクトなサイズでも競合するMLLMに匹敵する結果をベンチマークで達成したとしている。 視覚タ... 続きを読む

「Speedometer 3.0」が発表 ~Webブラウザーの性能を測定するベンチマークの最新版/「WebKit」「Blink」「Gecko」の開発者が共同開発、近年のWebアプリのトレンドを反映

2024/03/12 このエントリーをはてなブックマークに追加 5 users Instapaper Pocket Tweet Facebook Share Evernote Clip blink Gecko WebKit Webブラウザー 反映

続きを読む

GPT-4を超えた? Claude 3が登場! Bedrockにも来ました。 - Qiita

2024/03/04 このエントリーをはてなブックマークに追加 14 users Instapaper Pocket Tweet Facebook Share Evernote Clip Bedrock Qiita Sonnet GPT-4 OPUS

ちなみにOpusはクラシック音楽の「楽曲番号」、Sonnetは「定型詩」、俳句は言わずもがなということで、Claudeという名前よろしくなんだかオシャレでハイソな感じの命名ですね。 複数のベンチマークでGPT-4を上回る賢さ (出典:Anthropic公式サイトより) レスポンスが速い Opus:Claude 2.1と同等速度を維持 Sonnet:Cl... 続きを読む

M3 Proに勝利。いまだに最強クラスのM1 Mac mini|Piyomaru

2024/02/27 このエントリーをはてなブックマークに追加 243 users Instapaper Pocket Tweet Facebook Share Evernote Clip 勝利 最強クラス コンビ M3 Pro 自作

自作の、地道で普通の内容のベンチマークを走らせてみたら、M1 Mac miniがMacBook Pro(M3 Pro、RAM 36GB)に勝ってしまった。どうしよう。 「頭がおかしい」と言う人がいるかもしれないので説明まず、Apple Siliconの第1世代である「M1」とは何か? それは、コンピュータの拡張性とか可能性を全部投げ捨てて、「コンピ... 続きを読む

Intelが特定ベンチマークのスコアを最大9%水増しする不正をしていたとして2600件以上のベンチマーク結果が事実上無効に

2024/02/19 このエントリーをはてなブックマークに追加 22 users Instapaper Pocket Tweet Facebook Share Evernote Clip Intel spec スコア Intelプロセッサ 事実上

性能テストの標準化団体の1つで、公平なベンチマークを行うために設立された非営利組織・SPECが、「Intelが自社プロセッサのベンチマーク結果を水増しするために特定のベンチマークのスコアを向上させるような最適化を行い、スコアを最大で9%水増ししていた」として、Intelプロセッサのベンチマーク結果2600件以上を事... 続きを読む

MSCI、中国企業66社を指数から除外-最新の四半期見直しで

2024/02/13 このエントリーをはてなブックマークに追加 11 users Instapaper Pocket Tweet Facebook Share Evernote Clip MSCI 四半期 時価総額 混乱 市場

MSCIは、市場の混乱に伴い中国株式市場の時価総額が大幅に減少していることを受け、世界的なベンチマークの組入銘柄から数十社の中国企業を除外する。 最新の四半期見直しではMSCI中国指数から66社が除外された。これは少なくとも2年ぶりの多さとなる。変更は2月29日の取引終了時点で実施、MSCI・ACWI... 続きを読む

Abacus AIがリリースしたオープンソースLLM「Smaug-72B」がHugging FaceのOpen LLM LeaderboardでトップとなりいくつかのベンチマークでGPT-3.5を上回ったことが明らかに

2024/02/08 このエントリーをはてなブックマークに追加 6 users Instapaper Pocket Tweet Facebook Share Evernote Clip オープンソースLLM Hugging Face アリババ

アリババのオープンソース言語モデル「Qwen-72B」を微調整して作られた「Smaug-72B」が2024年2月6日に登場し、同時にSmaug-72Bが「世界最高のオープンソース言語モデル」の座を獲得したことが明らかになりました。 abacusai/Smaug-72B-v0.1 · Hugging Face https://huggingface.co/abacusai/Smaug-72B-v0.1 Smaug-72B - ... 続きを読む

Gemini Pro のリリースの概要|npaka

2023/12/13 このエントリーをはてなブックマークに追加 10 users Instapaper Pocket Tweet Facebook Share Evernote Clip Gemini API 最初 バージョン npaka モデル

以下の記事が面白かったので、かるくまとめました。 ・It’s time for developers and enterprises to build with Gemini Pro 1. Gemini Pro のリリースの概要「Gemini Pro」の最初のバージョンが、「Gemini API」を介してアクセスできるようになりました。 ・「Gemini Pro」は、ベンチマークで他の同様のサイズのモデル... 続きを読む

GPT-4を超えた。 Geminiの使い方とその性能を解説|ChatGPT研究所

2023/12/07 このエントリーをはてなブックマークに追加 75 users Instapaper Pocket Tweet Facebook Share Evernote Clip GEMINI nano ジェミニ Ultra GPT-4

2023年12月7日、Google は GPT-4の最大の対抗馬とされていた「Gemini(ジェミニ)1.0」を発表しました。Geminiは3つのバージョンがあり、Nano, Pro, Ultra(一番性能が高い) となっています。GeminiはMMLU(大規模多目的言語理解)というベンチマークで人間の専門家を初めて上回る90.0%のスコアを達成する最強のモデルとな... 続きを読む

 
(1 - 25 / 345件)