タグ GPT-4
人気順 5 users 50 users 100 users 500 users 1000 usersGPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは?
大規模言語モデル(LLM)をベースにしたAIは高い能力を発揮できる一方で、ウソにダマされやすいといった特徴があったり、算数の文章題への推論能力が小学生未満という研究結果があったりと、脆弱(ぜいじゃく)さについてもしばしば指摘されます。AIの能力の限界を示す「ストロベリー問題」という脆弱性について、機械学習エ... 続きを読む
DuolingoのAI英会話「MAX」がついに日本語対応。GPT-4o対応で英語力が伸びる理由を聞いた
2012年に正式リリースされ、現在までに全世界のMAU(月間アクティブユーザー)が1億360万人を超える語学学習アプリ「Duolingo(デュオリンゴ)」。42種類の異なる言語を扱い、合計100以上のコースを提供している。 9月25日には、ChatGPTの「GPT-4」および最新モデル「GPT-4o」を搭載した新プラン「Duolingo Max」(月額4490円、... 続きを読む
ヒントンさん、「受賞に本当に驚いている」「GPT-4をかなりよく使用している」──ノーベル物理学賞の会見一問一答
2024年のノーベル物理学賞を受賞した、AI研究の第一人者であるカナダ・トロント大学のジェフリー・ヒントンさん。発表会には電話で参加し、取材陣からの質問に答えた。 ヒントンさんは一時は米Googleのエンジニアリングフェローなども務めていたが、AIリスクへの懸念を理由に2023年に同社を退職している。質疑応答では、... 続きを読む
大規模言語モデルの仕組みが目で見てわかる「Transformer Explainer」
GPT-4やLlama、Claudeといった大規模言語モデルは、2017年にGoogleの研究者が発表した「Transformer」というフレームワークの上に構築されています。このTransformerをベースにしたAIモデルがどのように機能するのかを視覚化したツール「Transformer Explainer」が、ジョージア工科大学のPolo Club of Data Scienceによ... 続きを読む
GPT-4を超える日本語精度の国産フルスクラッチLLM「PLaMo」無料トライアル開始、期間中は商用利用も可能/既存モデルをベースに用いず開発、商用版を今秋発売へ
生成AIの誤りを生成AIが見抜く、OpenAIの「CriticGPT」 その実力とは
OpenAIは2024年6月27日(米国時間)、同社の生成AI(人工知能)「ChatGPT」における応答の誤りを発見する「CriticGPT」を発表した。CriticGPTは、「GPT-4」をベースとするモデルで、ChatGPTが出力するコードの誤りを発見できるという。 OpenAIは「ChatGPTが生成したコードの人によるレビューにおいて、CriticGPTを使えば... 続きを読む
DeepLが次世代翻訳AIをリリース、翻訳性能はGPT-4超え
高精度な翻訳ツールを提供するDeepLが、翻訳性能を強化した次世代言語モデルの実装を発表しました。DeepLの次世代言語モデルはGoogle翻訳やGPT-4と比べて高い精度で翻訳が可能とのことです。 DeepLが翻訳でChatGPT-4、Google、Microsoftを上回る次世代LLMモデルを実装 https://www.deepl.com/ja/blog/next-gen-language-... 続きを読む
OpenAIが無料で使えるAIモデル「GPT-4o mini」をリリース、マルチモーダルで画像や音声入力にも対応
OpenAIが2024年7月18日に、コスト効率に優れた小型モデルの「GPT-4o mini」を発表しました。低コストでありながら、一部のベンチマークでGPT-4を上回るスコアを示したGPT-4o miniは、GPT-3.5の後継として無料ユーザーとChatGPT Plusのユーザーに提供が開始されています。 GPT-4o mini: advancing cost-efficient intelli... 続きを読む
翻訳性能はGPT-4やGoogle超え?DeepLが言語特化の次世代AIを発表
ELYZA、GPT-4を上回る性能の日本語LLMを開発
“GPT-4超え性能”の日本語特化型LLM AIスタートアップ・ELYZAが開発 国外プレイヤーとの競争も「諦めない」
東大発のAIスタートアップ企業であるELYZA(東京都文京区)は6月26日、GPT-4を超える性能を持つ日本語特化型の大規模言語モデル(LLM)「Llama-3-ELYZA-JP-70B」を開発したと発表した。AIモデル自体は公開しておらず、今後企業向けに提供していく予定。チャット形式で性能を試せるデモサイトは公開している。 Llama-3-EL... 続きを読む
「GPT-4」を上回る日本語性能のLLM「Llama-3-ELYZA-JP」を開発しました|ELYZA, Inc.
本記事のサマリーELYZA は、「Llama-3-ELYZA-JP」シリーズの研究開発成果を公開しました。700億パラメータのモデルは、日本語の生成能力に関するベンチマーク評価 (ELYZA Tasks 100、Japanese MT-Bench) で「GPT-4」を上回る性能を達成しました。各モデルは Meta 社の「Llama 3」シリーズをベースに日本語で追加学習を行... 続きを読む
OpenAIがGPT-4の思考を1600万個の解釈可能なパターンに分解できたと発表
GPT-4などの大規模言語モデルは非常に高い性能を有していますが、各モデルがどのような思考を経て応答を出力しているのかは開発者ですら把握できていません。新たに、OpenAIが大規模言語モデルの思考を読み取る手法を開発し、GPT-4の思考を1600万個の解釈可能なパターンに分解できたことを発表しました。 Extracting Con... 続きを読む
GNN-RAGで7BモデルでもGPT-4と同等の性能を引き出す
導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。普段はエンジニアとして、LLMを使用したチャットのサービスを提供しており、とりわけRAGシステムの改善は日々の課題になっています。 RAGのシステムでは一般的に、断片化されたテキストをEmbeddingによってベクトル化し、関連する情報を検索、そして質問に回答... 続きを読む
プログラマ視点での生成AIとの付き合い方
プログラミングについて、最近考えてることについてのポエム。 基本的に、 GPT-4 と Claude-3-Opus を使った経験を念頭に置いて話をする。機械学習エンジニアではないので、あくまで利用者に徹した視点での話。仕事で生成AIを使ったパイプラインを作ったりはしている。 生成AIの進化速度を予測しておく 今大事なことは、... 続きを読む
“株”選びにGPT-4の利益予測は使えるのか? “文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第48回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ “文学作品”を翻訳... 続きを読む
GPT-4は財務諸表から将来の収益の伸びを予測する点で人間のアナリストよりも優れていることが研究により明らかに
OpenAIが開発する大規模言語モデル(LLM)の「GPT-4」は、道徳テストで人間の大学生より優れたスコアをたたき出したり、セキュリティ勧告を読むことで実際の脆弱性を悪用できたりと、すでに一部の分野で人間の能力を超えることが示されています。そんなGPT-4が、プロのアナリストに匹敵する精度の財務諸表分析を行えること... 続きを読む
まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)
筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子(あすきこ)さん」 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話も... 続きを読む
まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性(アスキー) - Yahoo!ニュース
PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀です。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。 【もっと写真を見る】 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが... 続きを読む
「GPT-4」を上回る性能で、グラフィカルな文書を読解するLLM技術
「GPT-4」を上回る性能で、グラフィカルな文書を読解するLLM技術:NTTの「tsuzumi」にも採用 NTTは2024年4月12日、大規模言語モデル(LLM)の活用により、文書に含まれる図表やグラフなども含めて理解し、自然言語での指示に従って読解/応答する「視覚読解技術」を実現したと発表した。 NTTは2024年4月12日、大規模言語... 続きを読む
OpenAIのGPT-4はCVEのセキュリティ勧告を読むことで実際の脆弱性を悪用できることが明らかに
OpenAIが開発する大規模言語モデル(LLM)のGPT-4は、一般公開されている脆弱(ぜいじゃく)性を悪用してサイバー攻撃を成功させることが可能であることが最新の研究により明らかになりました。 [2404.08144] LLM Agents can Autonomously Exploit One-day Vulnerabilities https://arxiv.org/abs/2404.08144 GPT-4 can expl... 続きを読む
OpenAI、東京オフィス開設--日本語が3倍高速な「GPT-4のカスタムモデル」も発表
OpenAIの拠点は、米国サンフランシスコ、英国のロンドン、アイルランドのダブリンに続いて4カ所目。日本法人の代表には、2月までアマゾンウェブサービスジャパン(AWSジャパン)で代表執行役員社長を務めた長崎忠雄氏が就任した。 日本法人では年内に十数名の採用を予定している。主な業務は法人向け「ChatGPT Enterpris... 続きを読む
OpenAI、GPT-4の「日本語特化モデル」発表--処理速度3倍に
OpenAIは4月15日、アジア初の拠点となる東京オフィスの開設に合わせ、AIモデル「GPT-4」の日本語特化版「GPT-4 Customized for Japanese」を発表した。すでに早期アクセスが可能で、数ヶ月以内に広くAPIを公開予定。GPT-4 Turboに比べて日本語の処理速度が「3倍」としている。 GPT-4 Customized for Japaneseでは、日本... 続きを読む
GPT-4に日本語特化モデル OpenAI Japan始動会見で発表
米OpenAIは4月15日、大規模言語モデル「GPT-4」について、日本語に最適化したカスタムモデルを発表した。日本語のテキストを記述する能力が向上しており、「GPT-4 Turbo」より最大3倍高速とうたっている。今後数カ月以内にAPIをリリースするという。 関連記事 OpenAI、“怠けにくい”「GPT-4 Turbo」プレビューリリースや... 続きを読む