タグ GPT-4
新着順 10 users 50 users 100 users 500 users 1000 usersGPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは?
大規模言語モデル(LLM)をベースにしたAIは高い能力を発揮できる一方で、ウソにダマされやすいといった特徴があったり、算数の文章題への推論能力が小学生未満という研究結果があったりと、脆弱(ぜいじゃく)さについてもしばしば指摘されます。AIの能力の限界を示す「ストロベリー問題」という脆弱性について、機械学習エ... 続きを読む
DuolingoのAI英会話「MAX」がついに日本語対応。GPT-4o対応で英語力が伸びる理由を聞いた
2012年に正式リリースされ、現在までに全世界のMAU(月間アクティブユーザー)が1億360万人を超える語学学習アプリ「Duolingo(デュオリンゴ)」。42種類の異なる言語を扱い、合計100以上のコースを提供している。 9月25日には、ChatGPTの「GPT-4」および最新モデル「GPT-4o」を搭載した新プラン「Duolingo Max」(月額4490円、... 続きを読む
ヒントンさん、「受賞に本当に驚いている」「GPT-4をかなりよく使用している」──ノーベル物理学賞の会見一問一答
2024年のノーベル物理学賞を受賞した、AI研究の第一人者であるカナダ・トロント大学のジェフリー・ヒントンさん。発表会には電話で参加し、取材陣からの質問に答えた。 ヒントンさんは一時は米Googleのエンジニアリングフェローなども務めていたが、AIリスクへの懸念を理由に2023年に同社を退職している。質疑応答では、... 続きを読む
リコー、モデルマージで“GPT-4レベル”の大規模言語モデル開発 プライベートLLMの開発効率化に貢献
リコーは9月30日、モデルマージ技術によって高性能な日本語大規模言語モデル(LLM)を開発したと発表した。東京工業大学などが開発したLLM「Llama-3-Swallow-70B」をベースにしたAIモデルで、米OpenAIのLLM「GPT-4」と同等の性能を持つとしている。 モデルマージとは、複数の学習済みのLLMモデルを組み合わせて、より性... 続きを読む
「Duolingo Max」が日本上陸!GPT-4/GPT-4oを活用した「リリーとビデオ通話」機能が新たに登場!
「Duolingo Max」が日本上陸!GPT-4/GPT-4oを活用した「リリーとビデオ通話」機能が新たに登場!キャラクターの性格に合わせてAIモデルをトレーニング ”本格的でリアルな” 没入型の英語学習を実現 世界で最も人気のある語学学習アプリDuolingo(本社所在地:Pittsburgh, USA、以下「Duolingo」)は、生成AIを搭載した... 続きを読む
GPT-4oの価格が大幅値下げ、競合に対抗するOpenAIの静かなアップデート、その裏では驚愕のプロジェクトが進行中(AMP[アンプ]) - Yahoo!ニュース
大規模言語モデルをめぐる状況は、この1年で大きく変化した。1年ほど前まで、OpenAIのGPT-4が他モデルを圧倒するパフォーマンスを示していたが、その後、Anthropicやグーグルのモデル性能が大幅に向上、またメタのLlama3.1 405Bの登場でオープンソースモデルにも注目が集まるようになっている。 たとえば、Anthropicが20... 続きを読む
大規模言語モデルの仕組みが目で見てわかる「Transformer Explainer」
GPT-4やLlama、Claudeといった大規模言語モデルは、2017年にGoogleの研究者が発表した「Transformer」というフレームワークの上に構築されています。このTransformerをベースにしたAIモデルがどのように機能するのかを視覚化したツール「Transformer Explainer」が、ジョージア工科大学のPolo Club of Data Scienceによ... 続きを読む
GPT-4を超える日本語精度の国産フルスクラッチLLM「PLaMo」無料トライアル開始、期間中は商用利用も可能/既存モデルをベースに用いず開発、商用版を今秋発売へ
GPT-4を超える日本語性能のLLM、PFN子会社がフルスクラッチで開発 無料トライアルを開始
β版では、PLaMo-100Bをベースに指示学習やモデルマージを行い、文章生成能力を高めた。無料トライアルは個人・法人を問わずに提供し、商用利用も可能。同社は今後、トライアルの検証結果から改善や追加学習などを実施し、商用版の「PLaMo 1.0 Prime」を今秋に発売する。 関連記事 PFNが生成AI新会社「Preferred Elements... 続きを読む
生成AIの誤りを生成AIが見抜く、OpenAIの「CriticGPT」 その実力とは
OpenAIは2024年6月27日(米国時間)、同社の生成AI(人工知能)「ChatGPT」における応答の誤りを発見する「CriticGPT」を発表した。CriticGPTは、「GPT-4」をベースとするモデルで、ChatGPTが出力するコードの誤りを発見できるという。 OpenAIは「ChatGPTが生成したコードの人によるレビューにおいて、CriticGPTを使えば... 続きを読む
DeepLが次世代翻訳AIをリリース、翻訳性能はGPT-4超え
高精度な翻訳ツールを提供するDeepLが、翻訳性能を強化した次世代言語モデルの実装を発表しました。DeepLの次世代言語モデルはGoogle翻訳やGPT-4と比べて高い精度で翻訳が可能とのことです。 DeepLが翻訳でChatGPT-4、Google、Microsoftを上回る次世代LLMモデルを実装 https://www.deepl.com/ja/blog/next-gen-language-... 続きを読む
OpenAIが無料で使えるAIモデル「GPT-4o mini」をリリース、マルチモーダルで画像や音声入力にも対応
OpenAIが2024年7月18日に、コスト効率に優れた小型モデルの「GPT-4o mini」を発表しました。低コストでありながら、一部のベンチマークでGPT-4を上回るスコアを示したGPT-4o miniは、GPT-3.5の後継として無料ユーザーとChatGPT Plusのユーザーに提供が開始されています。 GPT-4o mini: advancing cost-efficient intelli... 続きを読む
翻訳性能はGPT-4やGoogle超え?DeepLが言語特化の次世代AIを発表
ELYZA、GPT-4を上回る性能の日本語LLMを開発
“GPT-4超え性能”の日本語特化型LLM AIスタートアップ・ELYZAが開発 国外プレイヤーとの競争も「諦めない」
東大発のAIスタートアップ企業であるELYZA(東京都文京区)は6月26日、GPT-4を超える性能を持つ日本語特化型の大規模言語モデル(LLM)「Llama-3-ELYZA-JP-70B」を開発したと発表した。AIモデル自体は公開しておらず、今後企業向けに提供していく予定。チャット形式で性能を試せるデモサイトは公開している。 Llama-3-EL... 続きを読む
「GPT-4」を上回る日本語性能のLLM「Llama-3-ELYZA-JP」を開発しました|ELYZA, Inc.
本記事のサマリーELYZA は、「Llama-3-ELYZA-JP」シリーズの研究開発成果を公開しました。700億パラメータのモデルは、日本語の生成能力に関するベンチマーク評価 (ELYZA Tasks 100、Japanese MT-Bench) で「GPT-4」を上回る性能を達成しました。各モデルは Meta 社の「Llama 3」シリーズをベースに日本語で追加学習を行... 続きを読む
OpenAIがGPT-4の思考を1600万個の解釈可能なパターンに分解できたと発表
GPT-4などの大規模言語モデルは非常に高い性能を有していますが、各モデルがどのような思考を経て応答を出力しているのかは開発者ですら把握できていません。新たに、OpenAIが大規模言語モデルの思考を読み取る手法を開発し、GPT-4の思考を1600万個の解釈可能なパターンに分解できたことを発表しました。 Extracting Con... 続きを読む
GNN-RAGで7BモデルでもGPT-4と同等の性能を引き出す
導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。普段はエンジニアとして、LLMを使用したチャットのサービスを提供しており、とりわけRAGシステムの改善は日々の課題になっています。 RAGのシステムでは一般的に、断片化されたテキストをEmbeddingによってベクトル化し、関連する情報を検索、そして質問に回答... 続きを読む
プログラマ視点での生成AIとの付き合い方
プログラミングについて、最近考えてることについてのポエム。 基本的に、 GPT-4 と Claude-3-Opus を使った経験を念頭に置いて話をする。機械学習エンジニアではないので、あくまで利用者に徹した視点での話。仕事で生成AIを使ったパイプラインを作ったりはしている。 生成AIの進化速度を予測しておく 今大事なことは、... 続きを読む
“株”選びにGPT-4の利益予測は使えるのか? “文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第48回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ “文学作品”を翻訳... 続きを読む
GPT-4は財務諸表から将来の収益の伸びを予測する点で人間のアナリストよりも優れていることが研究により明らかに
OpenAIが開発する大規模言語モデル(LLM)の「GPT-4」は、道徳テストで人間の大学生より優れたスコアをたたき出したり、セキュリティ勧告を読むことで実際の脆弱性を悪用できたりと、すでに一部の分野で人間の能力を超えることが示されています。そんなGPT-4が、プロのアナリストに匹敵する精度の財務諸表分析を行えること... 続きを読む
まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)
筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子(あすきこ)さん」 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話も... 続きを読む
まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性(アスキー) - Yahoo!ニュース
PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀です。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。 【もっと写真を見る】 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが... 続きを読む
謎の生成AI「gpt2」登場で騒然 次世代のGPT? アルトマンCEOも言及
生成AIブームの火付け役となった「ChatGPT」を提供する米OpenAIは、2023年3月に高性能な大規模言語モデル(LLM)「GPT-4」を提供して以来、次の高性能モデルについて沈黙を守り続けている。そんな中、LLMを比較できるWebサービス上にOpenAIのものらしき謎の高性能なLLMが現れた。同社のサム・アルトマンCEOも言及してお... 続きを読む
「GPT-4」を上回る性能で、グラフィカルな文書を読解するLLM技術
「GPT-4」を上回る性能で、グラフィカルな文書を読解するLLM技術:NTTの「tsuzumi」にも採用 NTTは2024年4月12日、大規模言語モデル(LLM)の活用により、文書に含まれる図表やグラフなども含めて理解し、自然言語での指示に従って読解/応答する「視覚読解技術」を実現したと発表した。 NTTは2024年4月12日、大規模言語... 続きを読む