タグ「ベンチマーク」

タグベンチマーク

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 25 / 346件)

CodSpeedによる継続的ベンチーマーク

2025/01/03 6 users rust node.js 言語パフォーマンス説明しま

CodSpeedは継続的ベンチマークを行うためのサービスです。CodSpeedを使うことで、ベンチマークを自動で実施し可視化できます。CodSpeedは、ベンチマークの結果を比較できるため、コードの変更によるパフォーマンスの変化を追跡できます。対応言語はRustとPython及びNode.jsです。この記事ではRustを使う場合を説明しま... 続きを読む

AGIに最も近いAI「o3」登場──米OpenAI　まずは「mini」を25年1月末に公開

2024/12/20 30 users AGI 米OpenAI mini 汎用人工知能ハイスコア

米OpenAIは12月20日（現地時間）、新たなAIモデル「o3」を発表した。12日間に渡って開催してきた配信イベント「12 Days of OpenAI」の最終日となる12日目に発表した。同社が一般公開している中で最高性能の「o1」よりも性能が高く、汎用人工知能（AGI）としての性能を評価するベンチマークでもこれまでにないハイスコア... 続きを読む

【Ubuntu日和】【第66回】6年前のPC、Ubuntuをインストールして使い続けるか、買い替えるか。ベンチマークから占うことにした。

2024/12/20 14 users Ubuntu Ubuntu日和第66回

動画生成AI「Veo 2」──米Googleが突如発表　性能は“Sora超え”とアピール　「物理学や人間の動きを理解している」

2024/12/16 22 users 動画生成AI アピール物理学性能米Meta

米Googleは12月16日（現地時間）、動画生成AI「Veo 2」を発表した。最大4Kの解像度で数分尺の動画を作成できる。米Metaのベンチマーク「MovieGenBench」で他の動画生成AIと性能を比べたところ、米OpenAIの動画生成AI「Sora Turbo」などよりも高い性能を記録したとしている。続きを読む

科学論文の調査に特化したAIモデル「OpenScholar」がベンチマークでGPT-4oを上回る、科学研究の大幅な効率化に期待

2024/11/22 20 users chatgpt GPT-4o 論文科学文献ワシントン大学

近年は生命分子の構造と相互作用を予測するAIモデル「AlphaFold 3」がリリースされたり、「ChatGPTのおかげで論文を読む手間が99％減った」と研究者が報告したりするなど、科学研究におけるAIの活用はますます重要なものになっています。新たに、ワシントン大学とアレン人工知能研究所の研究チームが、科学文献の調査に... 続きを読む

Ryzen 7 9800X3Dをベンチマーク：Ryzen 7 9700Xや7800X3Dと徹底比較してみた | ちもろぐ

2024/11/17 14 users ちもろぐ徹底 Ryzen 7 9700X 7800X3D

最強のゲーミングCPUとウワサされる「Ryzen 7 9800X3D」を、読者さんの助太刀でなんとか1つ買えました。ライバルに挙げられる「Ryzen 7 9700X」や「Ryzen 7 7800X3D」など、全部で8個のCPUとベンチマークや実際のゲームプレイで徹底比較します。（公開：2024/11/17 | 更新：2024/11/17）この記事の目次 Toggle やかも... 続きを読む

OpenAIのCEOが「o2が博士号レベルのベンチマークで105％のスコアを達成」とSNSに投稿、次期AIモデルはGPT-4oでも53.6％しか記録できなかった高難度テストで約2倍のスコアを達成か

2024/11/03 19 users OpenAI SAMA サム GPT-4o CEO

OpenAIのサム・アルトマンCEOが自身のXアカウントに「o2がGPQAで105％のスコアを達成したと聞いた」と2024年11月3日(日)に投稿しました。「o2」の正式名称は不明ですが、OpenAIが開発中の次世代AIモデルが驚異的な性能を備えている可能性が濃厚となっています。 i heard o2 gets 105% on GPQA— Sam Altman (@sama) Novem... 続きを読む

【Hothotレビュー】すべてが新しい「Core Ultra 200S」をベンチマーク。Ryzenとの勝負の行方は？

2024/10/24 16 users Ryzen Hothotレビュー行方 Core Ultra

連番IDを使うと会社が潰れる。(訳: 連番とUUIDのベンチマークを取ってみた❤️）

2024/10/06 237 users UUID 連番会社

大いなる流れには逆らえないあるAI研究者が言っていた、私の仕事もいつか AI に奪われるという言葉が非常に印象的だった。私は一時期自分のキャリアに危機感を覚えAIに関する情報を集めていた。そのとき見つけたYoutube動画でこのようなことが語られていたのである。ではなぜ彼らは研究を続けるのかと思うかもしれな... 続きを読む

GoogleがTensor G4はベンチマーク性能が低いのは意図的だと開き直る

2024/08/21 5 users Tensor G ベンチマーク性能 Google Pixel

GoogleがTensor G4はベンチマーク性能が低いのは意図的だと開き直る Googleが8月14日に発表したPixel 9シリーズでは新しいチップセットとしてTensor G4を搭載し、Googleの説明では電力効率や性能向上に伴いアプリ起動やバッテリー持続時間が改善したとしています。しかし、実際のベンチマークでは競合のSnapdragon 8 Gen... 続きを読む

「Ryzen 9 9950X」「Ryzen 9 9900X」は“約束された”最強のCPUになれたのか？　ベンチマークで見えた利点と欠点 (1/6)

2024/08/14 10 users CPU 欠点利点最強 Ryzen

2024年8月14日、AMDはSocket AM5向けCPU「Ryzen 9000シリーズ」の最上位モデル「Ryzen 9 9950X」および「Ryzen 9 9900X」の販売をグローバル市場において解禁した。国内における発売日は8月23日午前11時、予想価格はRyzen 9 9950Xが税込約11万9800円、Ryzen 9 9900Xは約8万8800円である。先日国内販売が解禁された「Ryz... 続きを読む

OpenAIが無料で使えるAIモデル「GPT-4o mini」をリリース、マルチモーダルで画像や音声入力にも対応

2024/07/19 12 users Intelli マルチモーダル GPT-4 OpenAI 後継

OpenAIが2024年7月18日に、コスト効率に優れた小型モデルの「GPT-4o mini」を発表しました。低コストでありながら、一部のベンチマークでGPT-4を上回るスコアを示したGPT-4o miniは、GPT-3.5の後継として無料ユーザーとChatGPT Plusのユーザーに提供が開始されています。 GPT-4o mini: advancing cost-efficient intelli... 続きを読む

ネットワークパフォーマンスの解読: TCP と UDP のバルクフローのベンチマーク | Google Cloud 公式ブログ

2024/07/06 191 users UDP TCP マルチモーダル Vertex 解読

Gemini 1.5 モデルをお試しください。Vertex AI からアクセスできる、Google のもっとも先進的なマルチモーダルモデルです。試す ※この投稿は米国時間 2024 年 6 月 22 日に、Google Cloud blog に投稿されたものの抄訳です。 Google Cloud ネットワーキングチームは長年にわたり、お客様のネットワークの構築、修正... 続きを読む

デコンパイルに特化した大規模言語モデル「LLM4Decompile」の登場

2024/06/27 57 users デコンパイル要点焦点再コンパイル精度向上

3つの要点 ✔️ デコンパイルに特化した初のオープンソースモデル「LLM4Decompile」を開発 ✔️ モデルに新しい学習目的を導入し、デコンパイルの精度向上を実現 ✔️ 再コンパイルと再実行可能性に焦点を当てたデコンパイルのための初の標準化されたベンチマークを構築 LLM4Decompile: Decompiling Binary Code with Large Langu... 続きを読む

CPU・2D・3D・メモリ・ディスクの5項目で徹底的にベンチマークするWindows版「PassMark PerformanceTest」Ver.11レビュー

2024/06/23 10 users CPU メモリベンチディスク 2Dグラフィックス

「CPU」「2Dグラフィックス」「3Fグラフィックス」「メモリ」「ディスク速度」の5項目について、それぞれ複数のベンチマークを行って詳細な数値化を行ってくれるベンチマークソフトが「PassMark PerformanceTest」です。かつて「Performance Test 7」および「Performance Test バージョン10.0」をレビューしたことがあ... 続きを読む

Apple M4のベンチマークスコアが高かった理由はARMv9化？ IPCはM3から3%向上に留まる可能性

2024/05/11 16 users IPC ベンチマークスコア Apple 新しいプロセッサ性能

Apple M4のベンチマークスコアが高かった理由はARMv9化？ IPCはM3から3%向上に留まる可能性 Appleが発表した新型iPad Proでは同社が開発した新しいプロセッサのApple M4を搭載し、発売前に登場したGeekbench 6のベンチマークでは同社のM3を20%以上超える性能を実現し、エンタープライズ向け製品であるM2 Max搭載のMac St... 続きを読む

Databricks、“オープン”な汎用LLM「DBRX」リリース　商用利用可

2024/03/28 8 users Databricks マルチモーダル moe リリース既存

米AI企業のDatabricksは3月27日（現地時間）、“オープンな”汎用LLM「DBRX」を発表した。同社によると、DBRXは標準的なベンチマークで既存のすべてのオープンモデルより優れたパフォーマンスを発揮するという。ただし、マルチモーダルではない。 DBRXは、オープンソースプロジェクトMegaBlocksに基づいて構築されたMoE（M... 続きを読む

Appleの研究者、マルチモーダルLLM「MM1」の論文発表　視覚タスクではGPT-4Vに匹敵

2024/03/18 18 users moe MLLM マルチモーダルLLM パラメータ混合

MM1は、画像とテキストのペア、画像とテキストの混合データ、テキストのみのデータの混合でトレーニングされている。Mixture-of-Experts（MoE）や教師あり微調整でパラメータを300億までスケールアップすることで、比較的コンパクトなサイズでも競合するMLLMに匹敵する結果をベンチマークで達成したとしている。視覚タ... 続きを読む

「Speedometer 3.0」が発表～Webブラウザーの性能を測定するベンチマークの最新版／「WebKit」「Blink」「Gecko」の開発者が共同開発、近年のWebアプリのトレンドを反映

2024/03/12 5 users blink Gecko WebKit Webブラウザー反映

GPT-4を超えた？ Claude 3が登場！ Bedrockにも来ました。 - Qiita

2024/03/04 14 users Bedrock Qiita Sonnet GPT-4 OPUS

ちなみにOpusはクラシック音楽の「楽曲番号」、Sonnetは「定型詩」、俳句は言わずもがなということで、Claudeという名前よろしくなんだかオシャレでハイソな感じの命名ですね。複数のベンチマークでGPT-4を上回る賢さ（出典：Anthropic公式サイトより）レスポンスが速い Opus：Claude 2.1と同等速度を維持 Sonnet：Cl... 続きを読む

M3 Proに勝利。いまだに最強クラスのM1 Mac mini｜Piyomaru

2024/02/27 243 users 勝利最強クラスコンビ M3 Pro 自作

自作の、地道で普通の内容のベンチマークを走らせてみたら、M1 Mac miniがMacBook Pro（M3 Pro、RAM 36GB）に勝ってしまった。どうしよう。「頭がおかしい」と言う人がいるかもしれないので説明まず、Apple Siliconの第1世代である「M1」とは何か？それは、コンピュータの拡張性とか可能性を全部投げ捨てて、「コンピ... 続きを読む

Intelが特定ベンチマークのスコアを最大9％水増しする不正をしていたとして2600件以上のベンチマーク結果が事実上無効に

2024/02/19 22 users Intel spec スコア Intelプロセッサ事実上

性能テストの標準化団体の1つで、公平なベンチマークを行うために設立された非営利組織・SPECが、「Intelが自社プロセッサのベンチマーク結果を水増しするために特定のベンチマークのスコアを向上させるような最適化を行い、スコアを最大で9％水増ししていた」として、Intelプロセッサのベンチマーク結果2600件以上を事... 続きを読む

ＭＳＣＩ、中国企業66社を指数から除外－最新の四半期見直しで

2024/02/13 11 users MSCI 四半期時価総額混乱市場

ＭＳＣＩは、市場の混乱に伴い中国株式市場の時価総額が大幅に減少していることを受け、世界的なベンチマークの組入銘柄から数十社の中国企業を除外する。最新の四半期見直しではＭＳＣＩ中国指数から66社が除外された。これは少なくとも２年ぶりの多さとなる。変更は２月29日の取引終了時点で実施、ＭＳＣＩ・ＡＣＷＩ... 続きを読む

Abacus AIがリリースしたオープンソースLLM「Smaug-72B」がHugging FaceのOpen LLM LeaderboardでトップとなりいくつかのベンチマークでGPT-3.5を上回ったことが明らかに

2024/02/08 6 users オープンソースLLM Hugging Face アリババ

アリババのオープンソース言語モデル「Qwen-72B」を微調整して作られた「Smaug-72B」が2024年2月6日に登場し、同時にSmaug-72Bが「世界最高のオープンソース言語モデル」の座を獲得したことが明らかになりました。 abacusai/Smaug-72B-v0.1 · Hugging Face https://huggingface.co/abacusai/Smaug-72B-v0.1 Smaug-72B - ... 続きを読む

Gemini Pro のリリースの概要｜npaka

2023/12/13 10 users Gemini API 最初バージョン npaka モデル

以下の記事が面白かったので、かるくまとめました。・It’s time for developers and enterprises to build with Gemini Pro 1. Gemini Pro のリリースの概要「Gemini Pro」の最初のバージョンが、「Gemini API」を介してアクセスできるようになりました。・「Gemini Pro」は、ベンチマークで他の同様のサイズのモデル... 続きを読む

(1 - 25 / 346件)

次の25件 »