タグ ベンチマーク
人気順 5 users 50 users 100 users 500 users 1000 usersAppleの研究者、マルチモーダルLLM「MM1」の論文発表 視覚タスクではGPT-4Vに匹敵
MM1は、画像とテキストのペア、画像とテキストの混合データ、テキストのみのデータの混合でトレーニングされている。Mixture-of-Experts(MoE)や教師あり微調整でパラメータを300億までスケールアップすることで、比較的コンパクトなサイズでも競合するMLLMに匹敵する結果をベンチマークで達成したとしている。 視覚タ... 続きを読む
GPT-4を超えた? Claude 3が登場! Bedrockにも来ました。 - Qiita
ちなみにOpusはクラシック音楽の「楽曲番号」、Sonnetは「定型詩」、俳句は言わずもがなということで、Claudeという名前よろしくなんだかオシャレでハイソな感じの命名ですね。 複数のベンチマークでGPT-4を上回る賢さ (出典:Anthropic公式サイトより) レスポンスが速い Opus:Claude 2.1と同等速度を維持 Sonnet:Cl... 続きを読む
M3 Proに勝利。いまだに最強クラスのM1 Mac mini|Piyomaru
自作の、地道で普通の内容のベンチマークを走らせてみたら、M1 Mac miniがMacBook Pro(M3 Pro、RAM 36GB)に勝ってしまった。どうしよう。 「頭がおかしい」と言う人がいるかもしれないので説明まず、Apple Siliconの第1世代である「M1」とは何か? それは、コンピュータの拡張性とか可能性を全部投げ捨てて、「コンピ... 続きを読む
Intelが特定ベンチマークのスコアを最大9%水増しする不正をしていたとして2600件以上のベンチマーク結果が事実上無効に
性能テストの標準化団体の1つで、公平なベンチマークを行うために設立された非営利組織・SPECが、「Intelが自社プロセッサのベンチマーク結果を水増しするために特定のベンチマークのスコアを向上させるような最適化を行い、スコアを最大で9%水増ししていた」として、Intelプロセッサのベンチマーク結果2600件以上を事... 続きを読む
MSCI、中国企業66社を指数から除外-最新の四半期見直しで
MSCIは、市場の混乱に伴い中国株式市場の時価総額が大幅に減少していることを受け、世界的なベンチマークの組入銘柄から数十社の中国企業を除外する。 最新の四半期見直しではMSCI中国指数から66社が除外された。これは少なくとも2年ぶりの多さとなる。変更は2月29日の取引終了時点で実施、MSCI・ACWI... 続きを読む
Gemini Pro のリリースの概要|npaka
以下の記事が面白かったので、かるくまとめました。 ・It’s time for developers and enterprises to build with Gemini Pro 1. Gemini Pro のリリースの概要「Gemini Pro」の最初のバージョンが、「Gemini API」を介してアクセスできるようになりました。 ・「Gemini Pro」は、ベンチマークで他の同様のサイズのモデル... 続きを読む
GPT-4を超えた。 Geminiの使い方とその性能を解説|ChatGPT研究所
2023年12月7日、Google は GPT-4の最大の対抗馬とされていた「Gemini(ジェミニ)1.0」を発表しました。Geminiは3つのバージョンがあり、Nano, Pro, Ultra(一番性能が高い) となっています。GeminiはMMLU(大規模多目的言語理解)というベンチマークで人間の専門家を初めて上回る90.0%のスコアを達成する最強のモデルとな... 続きを読む
Googleが「人間の専門家レベルを超える最初のモデル」とする『Gemini』発表、GPT-4を凌駕 | AIDB
マイページに保存最終更新日:2023/12/07 Googleは、人間の専門家のパフォーマンスを上回る最初の大規模言語モデル(LLM)として「Gemini」を発表しました。LLMの主要なベンチマークの一つであるMMLU(多領域の学術ベンチマーク)をはじめとするほとんどのベンチマークでGPT-4を凌駕しています。 Geminiは、画像、音声、... 続きを読む
3つのゲーマー向けLinuxがベンチマークでWindows 11を上回るスコアをたたき出す
PCゲームの多くがLinuxを念頭に開発され、2023年8月にはゲーミングPCのOSのシェア率でLinuxがmacOSを上回るなど、Linuxはゲーマーコミュニティの間で人気のOSとなっています。ドイツのIT系ニュースサイト・ComputerBaseの調べにより、3つのLinuxディストリビューションがベンチマークでWindows 11をしのぐパフォーマンス... 続きを読む
【笠原一輝のユビキタス情報局】 ライバル完封のSnapdragon X Elite、ベンチマークでその実力が明らかに
Metaの大規模言語モデル「LLaMA」がChatGPTを再現できる可能性があるとさまざまなチャットAI用言語モデルのベンチマーク測定で判明
近年は機械学習分野の研究がめまぐるしい勢いで進んでおり、数十億を超えるパラメーターを持つ大規模言語モデルが相次いで発表されています。イギリス・エディンバラ大学の大規模言語モデル研究者であるヤオ・フー氏らの研究チームが、独自のベンチマークに基づいて複数の大規模言語モデルのパフォーマンスを比較した結... 続きを読む
k0kubun/ruby-jit-challenge 完了報告 - Smoky God Express
16.85倍はやい僕のJIT RubyKaigi 2023 お疲れ様でした。非常に面白かったですね。k0kubun さんのRJITについての発表が面白かったので ruby-jit-challange をやりました。無事完走できたので感想記事を書こうと思います(激ウマギャグ) ※: ベンチマークから rjit が抜かれてる理由は後述 RJIT / ruby-jit-challenge って... 続きを読む
スマホメーカーが発表会で「原神」を使う理由。性能アピールの背景にある「信用できない」"ベンチマークスコア" - はやぽんログ!
話題のオープンRPGの原神。筆者もデジタルカメラで動かしたりと楽しませてもらっているが、近年ではスマートフォンの発表会でも多く使われるようになった。 その理由はなぜなのか、簡単に考察してみる ブーストをはじめとした「不正行為」の横行で信用できなくなった"ベンチマークスコア" ベンチマークに代わり「原神」... 続きを読む
【Hothotレビュー】 傑出したゲーム性能と電力性能比が光る「Ryzen 9 7950X3D」をベンチマーク
CPU シュミレータを用いて継続的ベンチマークを安定化させる - mizdra's blog
id:mizdra は eslint-interactive というツールをメンテナンスしています。このツールを使うと、多数の ESLint エラーを効率的に修正できます (詳しくは以前書いた記事を見てください)。 www.mizdra.net eslint-interactive では「中規模〜大規模なコードベースであってもキビキビ動く」を大事にしてます。その一環とし... 続きを読む
Core i5 13600Kベンチマーク&レビュー:発売3週間の7600Xを一瞬で型落ちに【14コア】 | ちもろぐ
Zen 4世代のミドルクラス(7600Xと7700X)に対抗するべくインテルが投下した第13世代Raptor Lake「Core i5 13600K」をさっそく入手しました。 ほぼ同じ価格帯のRyzen 5 7600Xや、前世代のCore i5 12600Kからどれほど進化したのか? 実際にベンチマークを回して確認します。 (公開:2022/10/20 | 更新:2022/10/20) Spo... 続きを読む
React脳によるUIライブラリ書きやすさランキング - Qiita
前回のおさらい 前回の記事では、Reactに有利なベンチマークでUIライブラリに競ってもらいました。 こういうベンチマークに対しては、「実務では〜」みたいな反応が一定数出てくるのが自然の摂理です。 書きやすさランキング そこで、シリーズのまとめとして、より実務に近い指標として「書きやすさ」で競ってもらおうと... 続きを読む
Reactに有利なベンチマークを作ってみた - Qiita
皆さんこんにちは。現在、フロントエンドでは宣言的UIが大流行しており、そのためのライブラリもReactを筆頭に複数存在しています。 ライブラリが複数存在するところには当然のように比較や論争が起こるものですが、UIライブラリの場合はパフォーマンスがよく焦点となります。 筆者はReactの信者ですが、Reactは古株とい... 続きを読む
Samsungがテレビに「ベンチマーク測定値を不正に高性能にする機能」を仕込んでいたことが判明
これまでスマートフォンでのベンチマークでたびたび不正を働いてきたSamsungが、複数のテレビで「レビューアーが行うベンチマークを検出して実際よりも高性能に見せる」ことを意図した明らかな不正操作を行っていたことが、テレビやモニターのレビューをしているYouTuberや検証サイトにより突き止められました。 Samsung... 続きを読む
Amazon・Google・Microsoftのクラウドのパフォーマンスを比較した2022年度クラウドレポートが公開される
商用データベース管理システムを開発するソフトウェア企業のCockroach Labsが、クラウドのパフォーマンスをベンチマークで比較した「2022年度クラウドレポート」を公開しました。 2022 Cloud Report | Cockroach Labs https://www.cockroachlabs.com/guides/2022-cloud-report/ Cockroach Labsは2017年以降毎年クラウド... 続きを読む
【Hothotレビュー】 Mac Studio実機レビュー。Ryzen 9 5950X & RTX 3090搭載機ともベンチマークで対決させてみた
RDSがAuroraより速い!?について調べてみた - なからなLife
長くなりそうなので、先に要点だけ。 Twitterで 先日の「RDSの方がAuroraより速いケース」の件、とりあえず調べたい範囲のベンチマーク取れた。元記事って2000万件*5=1億件を1クライアントで処理してるのな。で、普通に?HammerDB TPC-Cで多重度上げてもRDSが速いケースがないか調べた。— atsuizo (@atsuizo) 2022年4月7... 続きを読む
Apple、Google、Microsoft、MozillaがWeb改善「Interop 2022」で協力
Apple、Google、Microsoft、MozillaがWeb改善「Interop 2022」で協力 Apple、Google、Microsoft、Mozillaは、Web改善の取り組み「Interop 2022」を発表した。昨年の「Compat 2021」にAppleが参加した形だ。同名のベンチマークでSafari、Chrome、Edge、FirefoxのWeb標準適応状態を評価する。 Webブラウザメーカーでもある... 続きを読む
Rust のパフォーマンスに何が影響を与えているのか - Qiita
動機 The Rust Performance Book という書きものを見つけました。いろいろなパフォーマンス改善テクニックが書かれているわけですが、実際に普段書いてる Rust コードの中で一体何がパフォーマンスに与える影響が大きいのか?という点が気になってベンチマークを取ってみました。 今回パフォーマンスを計測するプログラ... 続きを読む
結局useMemoはいつ使えばいいの? 僕の決定版 - Qiita
皆さんこんにちは。筆者の以前の記事では、ReactのuseMemoを無駄に使うことによるレンダリング速度のオーバーヘッドがどれくらいかをベンチマークによって示しました。 それによれば、スマートフォンを想定したとしても、useMemoだけで描画に目に見える影響を与える(16msくらいの遅延を発生させる)には万のオーダーのu... 続きを読む