タグ ベンチマーク
人気順 10 users 50 users 100 users 500 users 1000 usersAGIに最も近いAI「o3」登場──米OpenAI まずは「mini」を25年1月末に公開
米OpenAIは12月20日(現地時間)、新たなAIモデル「o3」を発表した。12日間に渡って開催してきた配信イベント「12 Days of OpenAI」の最終日となる12日目に発表した。同社が一般公開している中で最高性能の「o1」よりも性能が高く、汎用人工知能(AGI)としての性能を評価するベンチマークでもこれまでにないハイスコア... 続きを読む
【Ubuntu日和】 【第66回】6年前のPC、Ubuntuをインストールして使い続けるか、買い替えるか。ベンチマークから占うことにした。
動画生成AI「Veo 2」──米Googleが突如発表 性能は“Sora超え”とアピール 「物理学や人間の動きを理解している」
米Googleは12月16日(現地時間)、動画生成AI「Veo 2」を発表した。最大4Kの解像度で数分尺の動画を作成できる。米Metaのベンチマーク「MovieGenBench」で他の動画生成AIと性能を比べたところ、米OpenAIの動画生成AI「Sora Turbo」などよりも高い性能を記録したとしている。 続きを読む
科学論文の調査に特化したAIモデル「OpenScholar」がベンチマークでGPT-4oを上回る、科学研究の大幅な効率化に期待
近年は生命分子の構造と相互作用を予測するAIモデル「AlphaFold 3」がリリースされたり、「ChatGPTのおかげで論文を読む手間が99%減った」と研究者が報告したりするなど、科学研究におけるAIの活用はますます重要なものになっています。新たに、ワシントン大学とアレン人工知能研究所の研究チームが、科学文献の調査に... 続きを読む
Ryzen 7 9800X3Dをベンチマーク:Ryzen 7 9700Xや7800X3Dと徹底比較してみた | ちもろぐ
最強のゲーミングCPUとウワサされる「Ryzen 7 9800X3D」を、読者さんの助太刀でなんとか1つ買えました。 ライバルに挙げられる「Ryzen 7 9700X」や「Ryzen 7 7800X3D」など、全部で8個のCPUとベンチマークや実際のゲームプレイで徹底比較します。 (公開:2024/11/17 | 更新:2024/11/17) この記事の目次 Toggle やかも... 続きを読む
OpenAIのCEOが「o2が博士号レベルのベンチマークで105%のスコアを達成」とSNSに投稿、次期AIモデルはGPT-4oでも53.6%しか記録できなかった高難度テストで約2倍のスコアを達成か
OpenAIのサム・アルトマンCEOが自身のXアカウントに「o2がGPQAで105%のスコアを達成したと聞いた」と2024年11月3日(日)に投稿しました。「o2」の正式名称は不明ですが、OpenAIが開発中の次世代AIモデルが驚異的な性能を備えている可能性が濃厚となっています。 i heard o2 gets 105% on GPQA— Sam Altman (@sama) Novem... 続きを読む
【Hothotレビュー】 すべてが新しい「Core Ultra 200S」をベンチマーク。Ryzenとの勝負の行方は?
連番IDを使うと会社が潰れる。(訳: 連番とUUIDのベンチマークを取ってみた❤️)
大いなる流れには逆らえない あるAI研究者が言っていた、私の仕事もいつか AI に奪われるという言葉が非常に印象的だった。 私は一時期自分のキャリアに危機感を覚えAIに関する情報を集めていた。そのとき見つけたYoutube動画でこのようなことが語られていたのである。 ではなぜ彼らは研究を続けるのかと思うかもしれな... 続きを読む
GoogleがTensor G4はベンチマーク性能が低いのは意図的だと開き直る
GoogleがTensor G4はベンチマーク性能が低いのは意図的だと開き直る Googleが8月14日に発表したPixel 9シリーズでは新しいチップセットとしてTensor G4を搭載し、Googleの説明では電力効率や性能向上に伴いアプリ起動やバッテリー持続時間が改善したとしています。しかし、実際のベンチマークでは競合のSnapdragon 8 Gen... 続きを読む
「Ryzen 9 9950X」「Ryzen 9 9900X」は“約束された”最強のCPUになれたのか? ベンチマークで見えた利点と欠点 (1/6)
2024年8月14日、AMDはSocket AM5向けCPU「Ryzen 9000シリーズ」の最上位モデル「Ryzen 9 9950X」および「Ryzen 9 9900X」の販売をグローバル市場において解禁した。国内における発売日は8月23日午前11時、予想価格はRyzen 9 9950Xが税込約11万9800円、Ryzen 9 9900Xは約8万8800円である。 先日国内販売が解禁された「Ryz... 続きを読む
OpenAIが無料で使えるAIモデル「GPT-4o mini」をリリース、マルチモーダルで画像や音声入力にも対応
OpenAIが2024年7月18日に、コスト効率に優れた小型モデルの「GPT-4o mini」を発表しました。低コストでありながら、一部のベンチマークでGPT-4を上回るスコアを示したGPT-4o miniは、GPT-3.5の後継として無料ユーザーとChatGPT Plusのユーザーに提供が開始されています。 GPT-4o mini: advancing cost-efficient intelli... 続きを読む
ネットワーク パフォーマンスの解読: TCP と UDP のバルクフローのベンチマーク | Google Cloud 公式ブログ
Gemini 1.5 モデル をお試しください。Vertex AI からアクセスできる、Google のもっとも先進的なマルチモーダル モデルです。 試す ※この投稿は米国時間 2024 年 6 月 22 日に、Google Cloud blog に投稿されたものの抄訳です。 Google Cloud ネットワーキング チームは長年にわたり、お客様のネットワークの構築、修正... 続きを読む
デコンパイルに特化した大規模言語モデル「LLM4Decompile」の登場
3つの要点 ✔️ デコンパイルに特化した初のオープンソースモデル「LLM4Decompile」を開発 ✔️ モデルに新しい学習目的を導入し、デコンパイルの精度向上を実現 ✔️ 再コンパイルと再実行可能性に焦点を当てたデコンパイルのための初の標準化されたベンチマークを構築 LLM4Decompile: Decompiling Binary Code with Large Langu... 続きを読む
CPU・2D・3D・メモリ・ディスクの5項目で徹底的にベンチマークするWindows版「PassMark PerformanceTest」Ver.11レビュー
「CPU」「2Dグラフィックス」「3Fグラフィックス」「メモリ」「ディスク速度」の5項目について、それぞれ複数のベンチマークを行って詳細な数値化を行ってくれるベンチマークソフトが「PassMark PerformanceTest」です。 かつて「Performance Test 7」および「Performance Test バージョン10.0」をレビューしたことがあ... 続きを読む
Apple M4のベンチマークスコアが高かった理由はARMv9化? IPCはM3から3%向上に留まる可能性
Apple M4のベンチマークスコアが高かった理由はARMv9化? IPCはM3から3%向上に留まる可能性 Appleが発表した新型iPad Proでは同社が開発した新しいプロセッサのApple M4を搭載し、発売前に登場したGeekbench 6のベンチマークでは同社のM3を20%以上超える性能を実現し、エンタープライズ向け製品であるM2 Max搭載のMac St... 続きを読む
Databricks、“オープン”な汎用LLM「DBRX」リリース 商用利用可
米AI企業のDatabricksは3月27日(現地時間)、“オープンな”汎用LLM「DBRX」を発表した。同社によると、DBRXは標準的なベンチマークで既存のすべてのオープンモデルより優れたパフォーマンスを発揮するという。ただし、マルチモーダルではない。 DBRXは、オープンソースプロジェクトMegaBlocksに基づいて構築されたMoE(M... 続きを読む
Appleの研究者、マルチモーダルLLM「MM1」の論文発表 視覚タスクではGPT-4Vに匹敵
MM1は、画像とテキストのペア、画像とテキストの混合データ、テキストのみのデータの混合でトレーニングされている。Mixture-of-Experts(MoE)や教師あり微調整でパラメータを300億までスケールアップすることで、比較的コンパクトなサイズでも競合するMLLMに匹敵する結果をベンチマークで達成したとしている。 視覚タ... 続きを読む
「Speedometer 3.0」が発表 ~Webブラウザーの性能を測定するベンチマークの最新版/「WebKit」「Blink」「Gecko」の開発者が共同開発、近年のWebアプリのトレンドを反映
GPT-4を超えた? Claude 3が登場! Bedrockにも来ました。 - Qiita
ちなみにOpusはクラシック音楽の「楽曲番号」、Sonnetは「定型詩」、俳句は言わずもがなということで、Claudeという名前よろしくなんだかオシャレでハイソな感じの命名ですね。 複数のベンチマークでGPT-4を上回る賢さ (出典:Anthropic公式サイトより) レスポンスが速い Opus:Claude 2.1と同等速度を維持 Sonnet:Cl... 続きを読む
M3 Proに勝利。いまだに最強クラスのM1 Mac mini|Piyomaru
自作の、地道で普通の内容のベンチマークを走らせてみたら、M1 Mac miniがMacBook Pro(M3 Pro、RAM 36GB)に勝ってしまった。どうしよう。 「頭がおかしい」と言う人がいるかもしれないので説明まず、Apple Siliconの第1世代である「M1」とは何か? それは、コンピュータの拡張性とか可能性を全部投げ捨てて、「コンピ... 続きを読む
Intelが特定ベンチマークのスコアを最大9%水増しする不正をしていたとして2600件以上のベンチマーク結果が事実上無効に
性能テストの標準化団体の1つで、公平なベンチマークを行うために設立された非営利組織・SPECが、「Intelが自社プロセッサのベンチマーク結果を水増しするために特定のベンチマークのスコアを向上させるような最適化を行い、スコアを最大で9%水増ししていた」として、Intelプロセッサのベンチマーク結果2600件以上を事... 続きを読む
MSCI、中国企業66社を指数から除外-最新の四半期見直しで
MSCIは、市場の混乱に伴い中国株式市場の時価総額が大幅に減少していることを受け、世界的なベンチマークの組入銘柄から数十社の中国企業を除外する。 最新の四半期見直しではMSCI中国指数から66社が除外された。これは少なくとも2年ぶりの多さとなる。変更は2月29日の取引終了時点で実施、MSCI・ACWI... 続きを読む
Abacus AIがリリースしたオープンソースLLM「Smaug-72B」がHugging FaceのOpen LLM LeaderboardでトップとなりいくつかのベンチマークでGPT-3.5を上回ったことが明らかに
アリババのオープンソース言語モデル「Qwen-72B」を微調整して作られた「Smaug-72B」が2024年2月6日に登場し、同時にSmaug-72Bが「世界最高のオープンソース言語モデル」の座を獲得したことが明らかになりました。 abacusai/Smaug-72B-v0.1 · Hugging Face https://huggingface.co/abacusai/Smaug-72B-v0.1 Smaug-72B - ... 続きを読む
Gemini Pro のリリースの概要|npaka
以下の記事が面白かったので、かるくまとめました。 ・It’s time for developers and enterprises to build with Gemini Pro 1. Gemini Pro のリリースの概要「Gemini Pro」の最初のバージョンが、「Gemini API」を介してアクセスできるようになりました。 ・「Gemini Pro」は、ベンチマークで他の同様のサイズのモデル... 続きを読む
GPT-4を超えた。 Geminiの使い方とその性能を解説|ChatGPT研究所
2023年12月7日、Google は GPT-4の最大の対抗馬とされていた「Gemini(ジェミニ)1.0」を発表しました。Geminiは3つのバージョンがあり、Nano, Pro, Ultra(一番性能が高い) となっています。GeminiはMMLU(大規模多目的言語理解)というベンチマークで人間の専門家を初めて上回る90.0%のスコアを達成する最強のモデルとな... 続きを読む