はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ GPT-4

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 94件)

GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは?

2024/10/19 このエントリーをはてなブックマークに追加 227 users Instapaper Pocket Tweet Facebook Share Evernote Clip Claude LLM 算数 推論能力 ウソ

大規模言語モデル(LLM)をベースにしたAIは高い能力を発揮できる一方で、ウソにダマされやすいといった特徴があったり、算数の文章題への推論能力が小学生未満という研究結果があったりと、脆弱(ぜいじゃく)さについてもしばしば指摘されます。AIの能力の限界を示す「ストロベリー問題」という脆弱性について、機械学習エ... 続きを読む

GPT-4を超える日本語精度の国産フルスクラッチLLM「PLaMo」無料トライアル開始、期間中は商用利用も可能/既存モデルをベースに用いず開発、商用版を今秋発売へ

2024/08/13 このエントリーをはてなブックマークに追加 148 users Instapaper Pocket Tweet Facebook Share Evernote Clip 既存モデル 商用版 ベース 商用利用 日本語精度

続きを読む

プログラマ視点での生成AIとの付き合い方

2024/05/31 このエントリーをはてなブックマークに追加 115 users Instapaper Pocket Tweet Facebook Share Evernote Clip 生成AI プログラマ視点 ポエム 念頭 付き合い方

プログラミングについて、最近考えてることについてのポエム。 基本的に、 GPT-4 と Claude-3-Opus を使った経験を念頭に置いて話をする。機械学習エンジニアではないので、あくまで利用者に徹した視点での話。仕事で生成AIを使ったパイプラインを作ったりはしている。 生成AIの進化速度を予測しておく 今大事なことは、... 続きを読む

まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)

2024/05/12 このエントリーをはてなブックマークに追加 306 users Instapaper Pocket Tweet Facebook Share Evernote Clip chatgpt LLM ローカルAI Command R 筆者

筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子(あすきこ)さん」 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話も... 続きを読む

GPT-4に日本語特化モデル OpenAI Japan始動会見で発表

2024/04/15 このエントリーをはてなブックマークに追加 169 users Instapaper Pocket Tweet Facebook Share Evernote Clip プレビューリリース 発表 カスタムモデル OpenAI API

米OpenAIは4月15日、大規模言語モデル「GPT-4」について、日本語に最適化したカスタムモデルを発表した。日本語のテキストを記述する能力が向上しており、「GPT-4 Turbo」より最大3倍高速とうたっている。今後数カ月以内にAPIをリリースするという。 関連記事 OpenAI、“怠けにくい”「GPT-4 Turbo」プレビューリリースや... 続きを読む

ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)

2024/03/22 このエントリーをはてなブックマークに追加 346 users Instapaper Pocket Tweet Facebook Share Evernote Clip chatgpt LLM Claude ライバル OpenAI

3月4日の公開以来、「Claudeやばくない?」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル(LLM)だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも... 続きを読む

高木浩光@自宅の日記 - Claude 3に例の「読了目安2時間」記事を解説させてみた

2024/03/11 このエントリーをはてなブックマークに追加 565 users Instapaper Pocket Tweet Facebook Share Evernote Clip 高木浩光 chatgpt Anthropic OPUS 進歩

■ Claude 3に例の「読了目安2時間」記事を解説させてみた Anthropicの先日出たばかりのClaude 3(Opus)が、ChatGPTのGPT-4を超えてきたと聞いて、自分の原稿を解説させてみたところ、確かに革新的な進歩が見られる。もはや内容を「理解」しているようにしか見えない。GPT-4では、昨年11月に試した時には、そうは見えず... 続きを読む

GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場

2024/03/09 このエントリーをはてなブックマークに追加 81 users Instapaper Pocket Tweet Facebook Share Evernote Clip Andro パーソナルAI 生成AI 基盤モデル 計算

AI企業・Inflectionが開発している生成AI「Pi」は、ユーザーひとりひとりに最適化された「パーソナルAI」です。そんなPiの能力を飛躍的に向上させた基盤モデルである「Inflection-2.5」をInflectionが発表しました。 Inflection-2.5: meet the world's best personal AI https://inflection.ai/inflection-2-5 PiはAndro... 続きを読む

マイクロソフト、GPT-4に任意のドキュメントなどを読み込ませて回答してもらえる「Azure OpenAI Service On Your Data」が正式サービスに

2024/02/28 このエントリーをはてなブックマークに追加 268 users Instapaper Pocket Tweet Facebook Share Evernote Clip マイクロソフト ドキュメント Azure OpenAI 修理

マイクロソフトは、GPT-35-TurboもしくはGPT-4に任意のデータソースを指定することでそのデータの内容を読み込み、質問に対して内容を基に回答できるようになる新機能「Azure OpenAI On Your Data」が正式サービスとなったことを発表しました。 例えば、社内規約や社内マニュアルなどを読み込ませると、「PCの修理を申し... 続きを読む

「社内のアレ分からん、教えてAI」を支援 Microsoftの“自社版ChatGPT作成サービス”、外部データ取り込み機能が正式リリース

2024/02/21 このエントリーをはてなブックマークに追加 202 users Instapaper Pocket Tweet Facebook Share Evernote Clip アレ 正式リリース 外部データ 機能 Rag

米Microsoftは2月20日(現地時間)、大規模言語モデル「GPT-4」などのAPIを同社のクラウド上で使える「Azure OpenAI Service」の外部データ連携機能「On Your Data」を正式リリースした。これまではパブリックプレビュー版として提供していた。 On Your Dataはいわゆる「RAG」(大規模言語モデルに外部データベースの情... 続きを読む

GPT-4にWebサイトを“自律的に”ハッキングさせる方法 AI自身が脆弱性を検出、成功率70%以上【研究紹介】

2024/02/21 このエントリーをはてなブックマークに追加 223 users Instapaper Pocket Tweet Facebook Share Evernote Clip 検出 脆弱性 AI自身 LLM Webサイト

米UIUC(イリノイ大学アーバナ・シャンペーン校)に所属する研究者らが発表した論文「LLM Agents can Autonomously Hack Websites」は、大規模言語モデル(LLM)を用いたAIエージェントに、自律的にWebサイトをハッキングさせる攻撃手法を提案した研究報告である。LLMエージェントがWebサイトに存在する脆弱性を事前に知... 続きを読む

AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】

2024/01/23 このエントリーをはてなブックマークに追加 157 users Instapaper Pocket Tweet Facebook Share Evernote Clip 米Meta 報酬 実験 米ニューヨーク大学 開発

TOPコラム海外最新IT情報AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】 AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】 2024年1月23日 米Metaと米ニューヨーク大学に所属する研究... 続きを読む

GPT-4にお礼を言わなくても回答は向上する「プロンプト26の原則」アブダビの研究者グループが発表 | Ledge.ai

2024/01/11 このエントリーをはてなブックマークに追加 593 users Instapaper Pocket Tweet Facebook Share Evernote Clip アブダビ Ledge.ai お礼 原則 プロンプト26

サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。 続きを読む

英語の学術論文をChatGPT-4で執筆する際の手順メモ|Kan Hatakeyama

2024/01/05 このエントリーをはてなブックマークに追加 265 users Instapaper Pocket Tweet Facebook Share Evernote Clip ChatGPT-4 Kan Hatakeyama 学術論文

はじめに英語の論文をGPT4に執筆させた際の手順を記します。 普段からChatGPTを使っている人にとっては、当たり前のやり取りしかしていないのですが、意外と使えていない方がnon-AI分野では多いので、丁寧にプロンプトを示していきます。 (ワークショップで解説する必要が出てきたので、そのためのメモ書きです) GPT-4に論文は... 続きを読む

GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説(生成AIウィークリー)(テクノエッジ) - Yahoo

2024/01/03 このエントリーをはてなブックマークに追加 120 users Instapaper Pocket Tweet Facebook Share Evernote Clip マルチモーダルモデル 生成AIウィークリー テクノエッジ

1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。2024年初っ端の第27回目は、「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大規模言語モデルの返答が向上する「プロンプト26の原則」をはじめとする5つの論文をお届けします。 画像から動く3Dシーンを生成する「Drea... 続きを読む

GPT-4、Microsoft 365 Copilot、日本語LLM… 2024年も追い続けたい「生成系AI」のおすすめ記事5選

2024/01/02 このエントリーをはてなブックマークに追加 77 users Instapaper Pocket Tweet Facebook Share Evernote Clip ログミーTech スク 日本語LLM 生成系AI 数々

GPT-4の発表から、より一層注目を浴びるようになった生成系AI。2023年には数々のイベントで生成系AIについて語られていました。そこで今回は、2023年に掲載したログミーTechの記事から、今あらためて読み返したい生成AI系の記事を5つピックアップしました。 「今の生成系AIは“人間人間したもの”を生み出している」 スク... 続きを読む

GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

2024/01/01 このエントリーをはてなブックマークに追加 831 users Instapaper Pocket Tweet Facebook Share Evernote Clip seamless TechnoEdge シームレス 礼儀 原則

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。2024年初っ端の第27回目は、「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大... 続きを読む

チャットアプリ「Microsoft Copilot」のiOS版を試してみた - iPhone Mania

2023/12/31 このエントリーをはてなブックマークに追加 69 users Instapaper Pocket Tweet Facebook Share Evernote Clip iPhone Mania iOS版 Opena OpenAI

OpenAIのGPT-4とDALL·E 3によって動作するチャットアシスタント「Microsoft Copilot」のiOSアプリが公開されました。アプリは無料でダウンロード可能となっていますが、実際に試してみました。 ■3行で分かる、この記事のポイント 1. チャットアシスタント「Microsoft Copilot」のiOSアプリが公開された。 2. 無料でOpenA... 続きを読む

これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開

2023/12/18 このエントリーをはてなブックマークに追加 1567 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI プロンプト プロンプトエンジニアリング 性能

OpenAIは、大規模言語モデル(GPT-4)でよりよい結果を出すためのプロンプトエンジニアリング(プロンプトのノウハウ)入門テキストを同社のウェブサイトで公開している。 同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体... 続きを読む

「面倒なことはChatGPTにやらせよう」 - あなたの日常を変える一冊! - karaage. [からあげ]

2023/12/13 このエントリーをはてなブックマークに追加 169 users Instapaper Pocket Tweet Facebook Share Evernote Clip KARAAGE chatgpt ChatGPT Plus

「面倒なことはChatGPTにやらせよう」はどんな本か? 「ChatGPTに面倒なことをやらせてしまおう」というタイトル通りの内容の本です。AIの小難しい理論的な話は最低限にして、実用・エンジニアリングに最大限に振っています。 特にChatGPT Plusの有料版に特化しています。GPT-4と様々な拡張機能と呼ばれる機能、具体的に... 続きを読む

GPT-4を超えた。 Geminiの使い方とその性能を解説|ChatGPT研究所

2023/12/07 このエントリーをはてなブックマークに追加 75 users Instapaper Pocket Tweet Facebook Share Evernote Clip GEMINI nano ジェミニ Ultra スコア

2023年12月7日、Google は GPT-4の最大の対抗馬とされていた「Gemini(ジェミニ)1.0」を発表しました。Geminiは3つのバージョンがあり、Nano, Pro, Ultra(一番性能が高い) となっています。GeminiはMMLU(大規模多目的言語理解)というベンチマークで人間の専門家を初めて上回る90.0%のスコアを達成する最強のモデルとな... 続きを読む

人だと正解率92%なのに、GPT-4だと15%になる新型テスト集「GAIA」 米Metaなどが開発

2023/12/07 このエントリーをはてなブックマークに追加 142 users Instapaper Pocket Tweet Facebook Share Evernote Clip GAIA Twitter seamless シームレス 執筆

このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Metaや米HuggingFaceなどに所属する研究者らが発表した論文「GAIA: a benchmark f... 続きを読む

Googleが「人間の専門家レベルを超える最初のモデル」とする『Gemini』発表、GPT-4を凌駕 | AIDB

2023/12/07 このエントリーをはてなブックマークに追加 85 users Instapaper Pocket Tweet Facebook Share Evernote Clip GEMINI AIDB LLM 最初 Google

マイページに保存最終更新日:2023/12/07 Googleは、人間の専門家のパフォーマンスを上回る最初の大規模言語モデル(LLM)として「Gemini」を発表しました。LLMの主要なベンチマークの一つであるMMLU(多領域の学術ベンチマーク)をはじめとするほとんどのベンチマークでGPT-4を凌駕しています。 Geminiは、画像、音声、... 続きを読む

もし明日、上司に「GPT-4を作れ」と言われたら? Stability AIのシニアリサーチサイエンティストが紹介する「LLM構築タイムアタック」

2023/12/04 このエントリーをはてなブックマークに追加 197 users Instapaper Pocket Tweet Facebook Share Evernote Clip 秋葉 シニアリサーチサイエンティスト 余地 上司 方々

GPT-4を作ってください」と言われたらどう答える? 秋葉拓哉氏:みなさん、こんにちは。秋葉と申します。それでは、発表させていただきたいと思います。 みなさん、さっそくですが、「GPT-4」ってすごいですよね。ここにいらっしゃっている方々はこれについては、もう疑いの余地なく、同意してくださるかなと思います... 続きを読む

ワンボタンミニゲームを自動的に作るためだけのGPTを作ってみた - ABAの日誌

2023/11/25 このエントリーをはてなブックマークに追加 92 users Instapaper Pocket Tweet Facebook Share Evernote Clip GPT Knowledge Aba Description

GPTsという、特定の役割を持った専用のGPTを作る仕組みが最近できた。といっても、従来のGPT-4にあらかじめ特定の指示 (description)と前提知識のファイル (knowledge)を与えられるだけで、今までできなかったことができるわけではない。だけど、特定のタスクをさせる時に、それらをいちいち指定する手間を省けるので、... 続きを読む

 
(1 - 25 / 94件)