タグ「ベンチマーク」

タグベンチマーク

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 25 / 304件)

AGIに最も近いAI「o3」登場──米OpenAI　まずは「mini」を25年1月末に公開

2024/12/20 30 users AGI 米OpenAI mini 汎用人工知能ハイスコア

米OpenAIは12月20日（現地時間）、新たなAIモデル「o3」を発表した。12日間に渡って開催してきた配信イベント「12 Days of OpenAI」の最終日となる12日目に発表した。同社が一般公開している中で最高性能の「o1」よりも性能が高く、汎用人工知能（AGI）としての性能を評価するベンチマークでもこれまでにないハイスコア... 続きを読む

【Ubuntu日和】【第66回】6年前のPC、Ubuntuをインストールして使い続けるか、買い替えるか。ベンチマークから占うことにした。

2024/12/20 14 users Ubuntu Ubuntu日和第66回

動画生成AI「Veo 2」──米Googleが突如発表　性能は“Sora超え”とアピール　「物理学や人間の動きを理解している」

2024/12/16 22 users 動画生成AI アピール物理学性能米Meta

米Googleは12月16日（現地時間）、動画生成AI「Veo 2」を発表した。最大4Kの解像度で数分尺の動画を作成できる。米Metaのベンチマーク「MovieGenBench」で他の動画生成AIと性能を比べたところ、米OpenAIの動画生成AI「Sora Turbo」などよりも高い性能を記録したとしている。続きを読む

科学論文の調査に特化したAIモデル「OpenScholar」がベンチマークでGPT-4oを上回る、科学研究の大幅な効率化に期待

2024/11/22 20 users chatgpt GPT-4o 論文科学文献ワシントン大学

近年は生命分子の構造と相互作用を予測するAIモデル「AlphaFold 3」がリリースされたり、「ChatGPTのおかげで論文を読む手間が99％減った」と研究者が報告したりするなど、科学研究におけるAIの活用はますます重要なものになっています。新たに、ワシントン大学とアレン人工知能研究所の研究チームが、科学文献の調査に... 続きを読む

Ryzen 7 9800X3Dをベンチマーク：Ryzen 7 9700Xや7800X3Dと徹底比較してみた | ちもろぐ

2024/11/17 14 users ちもろぐ徹底 Ryzen 7 9700X 7800X3D

最強のゲーミングCPUとウワサされる「Ryzen 7 9800X3D」を、読者さんの助太刀でなんとか1つ買えました。ライバルに挙げられる「Ryzen 7 9700X」や「Ryzen 7 7800X3D」など、全部で8個のCPUとベンチマークや実際のゲームプレイで徹底比較します。（公開：2024/11/17 | 更新：2024/11/17）この記事の目次 Toggle やかも... 続きを読む

OpenAIのCEOが「o2が博士号レベルのベンチマークで105％のスコアを達成」とSNSに投稿、次期AIモデルはGPT-4oでも53.6％しか記録できなかった高難度テストで約2倍のスコアを達成か

2024/11/03 19 users OpenAI SAMA サム GPT-4o CEO

OpenAIのサム・アルトマンCEOが自身のXアカウントに「o2がGPQAで105％のスコアを達成したと聞いた」と2024年11月3日(日)に投稿しました。「o2」の正式名称は不明ですが、OpenAIが開発中の次世代AIモデルが驚異的な性能を備えている可能性が濃厚となっています。 i heard o2 gets 105% on GPQA— Sam Altman (@sama) Novem... 続きを読む

【Hothotレビュー】すべてが新しい「Core Ultra 200S」をベンチマーク。Ryzenとの勝負の行方は？

2024/10/24 16 users Ryzen Hothotレビュー行方 Core Ultra

連番IDを使うと会社が潰れる。(訳: 連番とUUIDのベンチマークを取ってみた❤️）

2024/10/06 237 users UUID 連番会社

大いなる流れには逆らえないあるAI研究者が言っていた、私の仕事もいつか AI に奪われるという言葉が非常に印象的だった。私は一時期自分のキャリアに危機感を覚えAIに関する情報を集めていた。そのとき見つけたYoutube動画でこのようなことが語られていたのである。ではなぜ彼らは研究を続けるのかと思うかもしれな... 続きを読む

「Ryzen 9 9950X」「Ryzen 9 9900X」は“約束された”最強のCPUになれたのか？　ベンチマークで見えた利点と欠点 (1/6)

2024/08/14 10 users CPU 欠点利点最強 Ryzen

2024年8月14日、AMDはSocket AM5向けCPU「Ryzen 9000シリーズ」の最上位モデル「Ryzen 9 9950X」および「Ryzen 9 9900X」の販売をグローバル市場において解禁した。国内における発売日は8月23日午前11時、予想価格はRyzen 9 9950Xが税込約11万9800円、Ryzen 9 9900Xは約8万8800円である。先日国内販売が解禁された「Ryz... 続きを読む

OpenAIが無料で使えるAIモデル「GPT-4o mini」をリリース、マルチモーダルで画像や音声入力にも対応

2024/07/19 12 users Intelli マルチモーダル GPT-4 OpenAI 後継

OpenAIが2024年7月18日に、コスト効率に優れた小型モデルの「GPT-4o mini」を発表しました。低コストでありながら、一部のベンチマークでGPT-4を上回るスコアを示したGPT-4o miniは、GPT-3.5の後継として無料ユーザーとChatGPT Plusのユーザーに提供が開始されています。 GPT-4o mini: advancing cost-efficient intelli... 続きを読む

ネットワークパフォーマンスの解読: TCP と UDP のバルクフローのベンチマーク | Google Cloud 公式ブログ

2024/07/06 191 users UDP TCP マルチモーダル Vertex 解読

Gemini 1.5 モデルをお試しください。Vertex AI からアクセスできる、Google のもっとも先進的なマルチモーダルモデルです。試す ※この投稿は米国時間 2024 年 6 月 22 日に、Google Cloud blog に投稿されたものの抄訳です。 Google Cloud ネットワーキングチームは長年にわたり、お客様のネットワークの構築、修正... 続きを読む

デコンパイルに特化した大規模言語モデル「LLM4Decompile」の登場

2024/06/27 57 users デコンパイル要点焦点再コンパイル精度向上

3つの要点 ✔️ デコンパイルに特化した初のオープンソースモデル「LLM4Decompile」を開発 ✔️ モデルに新しい学習目的を導入し、デコンパイルの精度向上を実現 ✔️ 再コンパイルと再実行可能性に焦点を当てたデコンパイルのための初の標準化されたベンチマークを構築 LLM4Decompile: Decompiling Binary Code with Large Langu... 続きを読む

CPU・2D・3D・メモリ・ディスクの5項目で徹底的にベンチマークするWindows版「PassMark PerformanceTest」Ver.11レビュー

2024/06/23 10 users CPU メモリベンチディスク 2Dグラフィックス

「CPU」「2Dグラフィックス」「3Fグラフィックス」「メモリ」「ディスク速度」の5項目について、それぞれ複数のベンチマークを行って詳細な数値化を行ってくれるベンチマークソフトが「PassMark PerformanceTest」です。かつて「Performance Test 7」および「Performance Test バージョン10.0」をレビューしたことがあ... 続きを読む

Apple M4のベンチマークスコアが高かった理由はARMv9化？ IPCはM3から3%向上に留まる可能性

2024/05/11 16 users IPC ベンチマークスコア Apple 新しいプロセッサ性能

Apple M4のベンチマークスコアが高かった理由はARMv9化？ IPCはM3から3%向上に留まる可能性 Appleが発表した新型iPad Proでは同社が開発した新しいプロセッサのApple M4を搭載し、発売前に登場したGeekbench 6のベンチマークでは同社のM3を20%以上超える性能を実現し、エンタープライズ向け製品であるM2 Max搭載のMac St... 続きを読む

Appleの研究者、マルチモーダルLLM「MM1」の論文発表　視覚タスクではGPT-4Vに匹敵

2024/03/18 18 users moe MLLM マルチモーダルLLM パラメータ混合

MM1は、画像とテキストのペア、画像とテキストの混合データ、テキストのみのデータの混合でトレーニングされている。Mixture-of-Experts（MoE）や教師あり微調整でパラメータを300億までスケールアップすることで、比較的コンパクトなサイズでも競合するMLLMに匹敵する結果をベンチマークで達成したとしている。視覚タ... 続きを読む

GPT-4を超えた？ Claude 3が登場！ Bedrockにも来ました。 - Qiita

2024/03/04 14 users Bedrock Qiita Sonnet GPT-4 OPUS

ちなみにOpusはクラシック音楽の「楽曲番号」、Sonnetは「定型詩」、俳句は言わずもがなということで、Claudeという名前よろしくなんだかオシャレでハイソな感じの命名ですね。複数のベンチマークでGPT-4を上回る賢さ（出典：Anthropic公式サイトより）レスポンスが速い Opus：Claude 2.1と同等速度を維持 Sonnet：Cl... 続きを読む

M3 Proに勝利。いまだに最強クラスのM1 Mac mini｜Piyomaru

2024/02/27 243 users 勝利最強クラスコンビ M3 Pro 自作

自作の、地道で普通の内容のベンチマークを走らせてみたら、M1 Mac miniがMacBook Pro（M3 Pro、RAM 36GB）に勝ってしまった。どうしよう。「頭がおかしい」と言う人がいるかもしれないので説明まず、Apple Siliconの第1世代である「M1」とは何か？それは、コンピュータの拡張性とか可能性を全部投げ捨てて、「コンピ... 続きを読む

Intelが特定ベンチマークのスコアを最大9％水増しする不正をしていたとして2600件以上のベンチマーク結果が事実上無効に

2024/02/19 22 users Intel spec スコア Intelプロセッサ事実上

性能テストの標準化団体の1つで、公平なベンチマークを行うために設立された非営利組織・SPECが、「Intelが自社プロセッサのベンチマーク結果を水増しするために特定のベンチマークのスコアを向上させるような最適化を行い、スコアを最大で9％水増ししていた」として、Intelプロセッサのベンチマーク結果2600件以上を事... 続きを読む

ＭＳＣＩ、中国企業66社を指数から除外－最新の四半期見直しで

2024/02/13 11 users MSCI 四半期時価総額混乱市場

ＭＳＣＩは、市場の混乱に伴い中国株式市場の時価総額が大幅に減少していることを受け、世界的なベンチマークの組入銘柄から数十社の中国企業を除外する。最新の四半期見直しではＭＳＣＩ中国指数から66社が除外された。これは少なくとも２年ぶりの多さとなる。変更は２月29日の取引終了時点で実施、ＭＳＣＩ・ＡＣＷＩ... 続きを読む

Gemini Pro のリリースの概要｜npaka

2023/12/13 10 users Gemini API 最初バージョン npaka モデル

以下の記事が面白かったので、かるくまとめました。・It’s time for developers and enterprises to build with Gemini Pro 1. Gemini Pro のリリースの概要「Gemini Pro」の最初のバージョンが、「Gemini API」を介してアクセスできるようになりました。・「Gemini Pro」は、ベンチマークで他の同様のサイズのモデル... 続きを読む

GPT-4を超えた。 Geminiの使い方とその性能を解説｜ChatGPT研究所

2023/12/07 75 users GEMINI nano ジェミニ Ultra GPT-4

2023年12月7日、Google は GPT-4の最大の対抗馬とされていた「Gemini(ジェミニ)1.0」を発表しました。Geminiは3つのバージョンがあり、Nano, Pro, Ultra(一番性能が高い) となっています。GeminiはMMLU（大規模多目的言語理解）というベンチマークで人間の専門家を初めて上回る90.0%のスコアを達成する最強のモデルとな... 続きを読む

Googleが「人間の専門家レベルを超える最初のモデル」とする『Gemini』発表、GPT-4を凌駕 | AIDB

2023/12/07 85 users GEMINI AIDB LLM GPT-4 最初

マイページに保存最終更新日：2023/12/07 Googleは、人間の専門家のパフォーマンスを上回る最初の大規模言語モデル（LLM）として「Gemini」を発表しました。LLMの主要なベンチマークの一つであるMMLU（多領域の学術ベンチマーク）をはじめとするほとんどのベンチマークでGPT-4を凌駕しています。 Geminiは、画像、音声、... 続きを読む

3つのゲーマー向けLinuxがベンチマークでWindows 11を上回るスコアをたたき出す

2023/12/05 12 users スコア MacOS Linuxディストリビューション念頭

PCゲームの多くがLinuxを念頭に開発され、2023年8月にはゲーミングPCのOSのシェア率でLinuxがmacOSを上回るなど、Linuxはゲーマーコミュニティの間で人気のOSとなっています。ドイツのIT系ニュースサイト・ComputerBaseの調べにより、3つのLinuxディストリビューションがベンチマークでWindows 11をしのぐパフォーマンス... 続きを読む

【笠原一輝のユビキタス情報局】ライバル完封のSnapdragon X Elite、ベンチマークでその実力が明らかに

2023/10/30 16 users 笠原一輝ユビキタス情報局実力

Metaの大規模言語モデル「LLaMA」がChatGPTを再現できる可能性があるとさまざまなチャットAI用言語モデルのベンチマーク測定で判明

2023/05/31 12 users パラメーター Meta エディンバラ大学 Llama イギリス

近年は機械学習分野の研究がめまぐるしい勢いで進んでおり、数十億を超えるパラメーターを持つ大規模言語モデルが相次いで発表されています。イギリス・エディンバラ大学の大規模言語モデル研究者であるヤオ・フー氏らの研究チームが、独自のベンチマークに基づいて複数の大規模言語モデルのパフォーマンスを比較した結... 続きを読む

(1 - 25 / 304件)

次の25件 »