タグ GPT-4o
人気順 5 users 50 users 100 users 500 users 1000 usersGPT-4oとo1とo1 proの翻訳の違いと物語生成性能を試す|shi3z
GPT-4oとo1($30/月)とo1 pro($200/月)で翻訳を比較しました。 翻訳の元にしたのは以下のツイートです。 The (true) story of development and inspiration behind the "attention" operator, the one in "Attention is All you Need" that introduced the Transformer. From personal email correspondence with the aut... 続きを読む
マルチモーダルLLMで複雑な画像を攻略:AOAIでGPT-4oをFine-tuning - Insight Edge Tech Blog
はじめに Insight EdgeのLLM Engineerの藤村です。 昨今、企業のDX推進に伴い、社内に蓄積された大量の画像データや文書の効率的な活用が求められています。弊社では、実務でLLMを活用する際、画像や表形式、複雑な図を含むドキュメントの理解が大きな課題となっています。この課題は多くの企業でも同様に直面していると... 続きを読む
科学論文の調査に特化したAIモデル「OpenScholar」がベンチマークでGPT-4oを上回る、科学研究の大幅な効率化に期待
近年は生命分子の構造と相互作用を予測するAIモデル「AlphaFold 3」がリリースされたり、「ChatGPTのおかげで論文を読む手間が99%減った」と研究者が報告したりするなど、科学研究におけるAIの活用はますます重要なものになっています。新たに、ワシントン大学とアレン人工知能研究所の研究チームが、科学文献の調査に... 続きを読む
オープンソースのコーディング支援AI「Qwen2.5-Coder」シリーズの性能はGPT-4oに匹敵、64GBのRAM&M2搭載MacBook Proでもローカル実行可能
中国・Alibabaグループが開発する大規模言語モデル(LLM)「Qwen」の研究チームが、コード生成や補完、数学の推論タスクに特化したLLM「Qwen2.5-Coder」の新モデルを2024年11月12日にリリースしました。Qwen2.5-Coderのコーディング機能はGPT-4oに匹敵し、パラメータ数も最大320億で、M2搭載MacBook Pro上でも実行できたこ... 続きを読む
25グラムの「AIレコーダー」が“仕事”を激変させる? サッと録音→GPT-4oですぐ要約 話題のガジェットを使ってみた
2024年12月、ウェアラブル型の“AIデバイス”が日本に上陸する。生成AIとボイスレコーダーを組み合わせた米Nicebuildの「PLAUD NotePin」(プラウド ノートピン)だ。本体価格は2万8600円。腕時計やピンバッジのように身に着けて会話を録音し、米OpenAIの大規模言語モデル(LLM)「GPT-4o」と連携して文字起こしや要約がで... 続きを読む
OpenAIのCEOが「o2が博士号レベルのベンチマークで105%のスコアを達成」とSNSに投稿、次期AIモデルはGPT-4oでも53.6%しか記録できなかった高難度テストで約2倍のスコアを達成か
OpenAIのサム・アルトマンCEOが自身のXアカウントに「o2がGPQAで105%のスコアを達成したと聞いた」と2024年11月3日(日)に投稿しました。「o2」の正式名称は不明ですが、OpenAIが開発中の次世代AIモデルが驚異的な性能を備えている可能性が濃厚となっています。 i heard o2 gets 105% on GPQA— Sam Altman (@sama) Novem... 続きを読む
[速報]GitHub CopilotでGemini 1.5 Pro、Claude 3.5 Sonnetが選択可能に。OpenAIのGPT-4o、o1-preview、o1-miniにも対応
基調講演では、GitHub Copilotの新機能としてAnthropicやGoogleの大規模言語モデルが選択可能になることが発表されました。 選択可能になるのはAnthropicのClaude 3.5 Sonnet、GoogleのGemini 1.5 Pro、OpenAIのGPT-4o、o1-preview、o1-miniです。 Claude 3.5 Sonnetは本発表と同時にGitHub Copilotで利用可能となり、Go... 続きを読む
DuolingoのAI英会話「MAX」がついに日本語対応。GPT-4o対応で英語力が伸びる理由を聞いた
2012年に正式リリースされ、現在までに全世界のMAU(月間アクティブユーザー)が1億360万人を超える語学学習アプリ「Duolingo(デュオリンゴ)」。42種類の異なる言語を扱い、合計100以上のコースを提供している。 9月25日には、ChatGPTの「GPT-4」および最新モデル「GPT-4o」を搭載した新プラン「Duolingo Max」(月額4490円、... 続きを読む
720億パラメーターでも「GPT-4o超え」、Ai2のオープンモデル
アレン人工知能研究所(Ai2)がマルチモーダル言語モデル「Molmo」ファミリーをリリースした。質の高いデータと効率的な訓練によって720億パラメーターのモデルでGPT-4oを上回る性能を示したという。 by Melissa Heikkilä2024.10.09 8 非営利研究機関のアレン人工知能研究所(Ai2)は、オープンソース・マルチモーダル言... 続きを読む
ChatGPT (o1-preview) にテストを渡してコードを実装させるとどうなるか試した
はじめに 前にも別のモデルでやってる ただ o1-preview は、やり取りを重ねるよりも一発で終わらせるほうがいいらしいので、最終的なテスト全体を渡すようにした。 情報の提示方法が異なると当然結果も変わるので、 gpt-4o でも同様なことを試した。 材料 プロンプトは以下。 基本的に最初にやったときと同じ。ペアプロ... 続きを読む
ChatGPTに「o1」登場 じっくり考えて賢さアップ、数学オリンピック予選で8割正答 プレビュー版はきょうから
o1では従来のモデルのようにユーザーの入力に対して即答せず、考える時間を設けるようになったことで思考プロセスを洗練している。国際数学オリンピックの予備試験で比較したところ、GPT-4oは13%しか正しく解けなかったがo1は83%正答したという。同社によるベンチマークテストでは、o1は物理学、数学、生物学で博士課... 続きを読む
全ベンチマークでGPT-4oを上回る世界トップのオープンソース大規模言語モデル「Reflection 70B」が登場、Llama 3.1 70B Instructをベースにリフレクションチューニングを施す
大規模言語モデル(LLM)が自分の間違いを修正できるように開発されたトレーニング手法の「リフレクションチューニング」を用いてトレーニングされたオープンソースのLLM「Reflection 70B」が発表されました。 HyperWrite debuts Reflection 70B, most powerful open source LLM | VentureBeat https://venturebeat.com/ai... 続きを読む
有料生成AIが無料・無制限使い放題の「リートン」に「GPT-4o mini」が実装/複雑な質問には「GPT-4o」、速さを求めるなら「GPT-4o mini」といった使い分けが可能に
tiktokenでgpt-3.5-turboとgpt-4oのトークン数を比較する
GMO NIKKOのT.Nです。 最近弊社のプロダクトで使用しているOpenAIのモデルを、 gpt-4oやgpt-4o-miniに切り替えました。 gpt-3.5-turboを使用していた時と比較して、 トークン数に変化があったので、 tiktokenの処理時間も含めて確認してみました。 確認方法 以下のようなプログラムで、 トークン数と処理時間の平均を確... 続きを読む
OpenAI、「GPT-4o」でもファインチューニング可能に
米OpenAIは8月20日(現地時間)、マルチモーダルAIモデル「GPT-4o」のファインチューニングの提供を開始したと発表した。すべての有料利用レベルのすべての開発者が利用できる。 ファインチューニングとは、LLMに独自のデータを追加で学習させ、新たな知識を持つモデルを作り出す技術。例えば企業独自の内部データを学習... 続きを読む
[アップデート]OpenAIから新しいモデル「chatgpt-4o-latest」が公開されました! | DevelopersIO
こんにちは、@TakaakiKakei です。 日本時間8月14日頃に、OpenAIが提供する最新の研究用モデルの「chatgpt-4o-latest」がAPI公開されました。 概要 「chatgpt-4o-latest」は、ChatGPTのGPT-4oの最新バージョンに継続的に更新される動的モデルです。このモデルは、開発者や研究者がOpenAIの最新の研究を探索できるように... 続きを読む
ついにご家庭にやってきたシンギュラリティ。AIサイエンティストが勝手に仮説を立て、実験して、論文を書く|shi3z
SakanaAIがまた面白い研究を発表した。その名も「AI Scientist(AI科学者)」 AIの研究をする科学者ではなく、科学者をやるAIである。 しかもすごいのは、基本的に難しいAIはすべてクラウド上で動作する(GPT-4oやOpenRouter対応LLMなど)ので、ご家庭で手軽に遊ぶことができる。AIの実験をする場合はGPUくらいは欲しいとこ... 続きを読む
数学を解ける言語モデル「Qwen2-Math」が登場、GPT-4o超えの数学性能
中国のAI研究チームが数学特化の大規模言語モデル「Qwen2-Math」を公開しました。Qwen2-MathはGPT-4oやGemini-1.5-Proなどのクローズドソースの大規模言語モデルをしのぐ数学性能を備えています。 Introducing Qwen2-Math | Qwen https://qwenlm.github.io/blog/qwen2-math/ QwenLM/Qwen2-Math: A series of math-specif... 続きを読む
「Copilot」は「GPT-4o」に ~「Visual Studio Code 1.92」が公開/コンソールなどパネルを上部に配置したり、既定ブラウザーを選べる2024年7月更新
AIが人間に代わってがっつり検索。「SearchGPT」がくるらしいのですが
AIが人間に代わってがっつり検索。「SearchGPT」がくるらしいのですが2024.08.05 07:00 Kyle Barr - Gizmodo US [原文] ( mayumine ) その名もSearchGPT! OpenAIから、GPT-4oを搭載した大規模検索エンジンが登場、ウェイティングリストで順番待ちの列に並ぶことができます。OpenAIは、これらの[検索]機能の最良のもの... 続きを読む
ChatGPTに見る「SFと科学」がお互いをインスパイアしてきた歴史
2024年5月、OpenAIのサム・アルトマンCEOは2013年のSFロマンス映画「her/世界でひとつの彼女」を引き合いに出してChatGPTの新モデル「GPT-4o」の斬新さを宣伝し、大きな話題となりました。このように、人々の想像力をかきたてるSF作品と現実世界の科学技術がお互いに影響を及ぼしてきた歴史を、アリゾナ州立大学で未来... 続きを読む
OpenAIが「GPT-4o mini」をリリース ~「GPT-3.5」は提供終了/「GPT-4o」に迫る性能で大幅に安価
OpenAI 「GPT-4o mini」発表、優れた推論力とコスト効率、GPT-3.5 Turboの置き換えに
米OpenAIは7月18日(現地時間)、「GPT-4o mini」を発表した。優れたマルチモーダル推論と低コストを両立させたGPT-4oの小型モデルである。18日より、Assistants API、Chat Completions API、Batch APIを利用するAPI顧客に、GPT-3.5 Turboに代わるテキストおよび視覚モデルとして展開を開始した。エンタープライズ顧客に... 続きを読む
【生成AI】知らないと後悔する、GPT-4oだけでシステム開発を300%効率化するハック - Qiita
都内のIT企業に勤めている、ソフトウェアエンジニアの D̷ELL と申します。 本稿はQiita Engineer Festa 2024の参加記事です。 本日は生成AI(GPT-4o)のAPIキーだけで、システム開発を300%効率化するハックを共有したいと思います。 なお、本稿はキャンペーンに参加しておりますので、楽しんで頂けたら「いいね」と「スト... 続きを読む
OpenAIが「大規模言語モデルが人間の知能にどれだけ近づいたか」を評価する基準を作成
GPT-4oなどの大規模言語モデルを開発するOpenAIが、大規模言語モデルの知能が人間レベルにどれだけ追いつけているのかを示すための評価スケールを作成したことを明らかにしました。 OpenAI Sets Levels to Track Progress Toward Superintelligent AI - Bloomberg https://www.bloomberg.com/news/articles/2024-07-11/o... 続きを読む