タグ「GPT-4」 - はてブログ

タグ GPT-4

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 25 / 76件)

GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは？

2024/10/19 227 users Claude LLM 算数推論能力ウソ

大規模言語モデル(LLM)をベースにしたAIは高い能力を発揮できる一方で、ウソにダマされやすいといった特徴があったり、算数の文章題への推論能力が小学生未満という研究結果があったりと、脆弱(ぜいじゃく)さについてもしばしば指摘されます。AIの能力の限界を示す「ストロベリー問題」という脆弱性について、機械学習エ... 続きを読む

GPT-4を超える日本語精度の国産フルスクラッチLLM「PLaMo」無料トライアル開始、期間中は商用利用も可能／既存モデルをベースに用いず開発、商用版を今秋発売へ

2024/08/13 148 users 既存モデル商用版ベース商用利用日本語精度

プログラマ視点での生成AIとの付き合い方

2024/05/31 115 users 生成AI プログラマ視点ポエム念頭付き合い方

プログラミングについて、最近考えてることについてのポエム。基本的に、 GPT-4 と Claude-3-Opus を使った経験を念頭に置いて話をする。機械学習エンジニアではないので、あくまで利用者に徹した視点での話。仕事で生成AIを使ったパイプラインを作ったりはしている。生成AIの進化速度を予測しておく今大事なことは、... 続きを読む

まるで“いけない話ができるChatGPT”　ローカルAI「Command R+」の爆発的な可能性 (1/5)

2024/05/12 306 users chatgpt LLM ローカルAI Command R 筆者

筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子（あすきこ）さん」 PCローカル環境で動作する大規模言語モデル（LLM）「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT（GPT-4）と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話も... 続きを読む

GPT-4に日本語特化モデル　OpenAI Japan始動会見で発表

2024/04/15 169 users プレビューリリース発表カスタムモデル OpenAI API

米OpenAIは4月15日、大規模言語モデル「GPT-4」について、日本語に最適化したカスタムモデルを発表した。日本語のテキストを記述する能力が向上しており、「GPT-4 Turbo」より最大3倍高速とうたっている。今後数カ月以内にAPIをリリースするという。関連記事 OpenAI、“怠けにくい”「GPT-4 Turbo」プレビューリリースや... 続きを読む

ChatGPTのライバル「Claude 3」の使い方　良い点、悪い点まとめ (1/5)

2024/03/22 346 users chatgpt LLM Claude ライバル OpenAI

3月4日の公開以来、「Claudeやばくない？」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル（LLM）だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも... 続きを読む

高木浩光＠自宅の日記 - Claude 3に例の「読了目安2時間」記事を解説させてみた

2024/03/11 565 users 高木浩光 chatgpt Anthropic OPUS 進歩

■ Claude 3に例の「読了目安2時間」記事を解説させてみた Anthropicの先日出たばかりのClaude 3（Opus）が、ChatGPTのGPT-4を超えてきたと聞いて、自分の原稿を解説させてみたところ、確かに革新的な進歩が見られる。もはや内容を「理解」しているようにしか見えない。GPT-4では、昨年11月に試した時には、そうは見えず... 続きを読む

マイクロソフト、GPT-4に任意のドキュメントなどを読み込ませて回答してもらえる「Azure OpenAI Service On Your Data」が正式サービスに

2024/02/28 268 users マイクロソフトドキュメント Azure OpenAI 修理

マイクロソフトは、GPT-35-TurboもしくはGPT-4に任意のデータソースを指定することでそのデータの内容を読み込み、質問に対して内容を基に回答できるようになる新機能「Azure OpenAI On Your Data」が正式サービスとなったことを発表しました。例えば、社内規約や社内マニュアルなどを読み込ませると、「PCの修理を申し... 続きを読む

「社内のアレ分からん、教えてAI」を支援　Microsoftの“自社版ChatGPT作成サービス”、外部データ取り込み機能が正式リリース

2024/02/21 202 users アレ正式リリース外部データ機能 Rag

米Microsoftは2月20日（現地時間）、大規模言語モデル「GPT-4」などのAPIを同社のクラウド上で使える「Azure OpenAI Service」の外部データ連携機能「On Your Data」を正式リリースした。これまではパブリックプレビュー版として提供していた。 On Your Dataはいわゆる「RAG」（大規模言語モデルに外部データベースの情... 続きを読む

GPT-4にWebサイトを“自律的に”ハッキングさせる方法　AI自身が脆弱性を検出、成功率70％以上【研究紹介】

2024/02/21 223 users 検出脆弱性 AI自身 LLM Webサイト

米UIUC（イリノイ大学アーバナ・シャンペーン校）に所属する研究者らが発表した論文「LLM Agents can Autonomously Hack Websites」は、大規模言語モデル（LLM）を用いたAIエージェントに、自律的にWebサイトをハッキングさせる攻撃手法を提案した研究報告である。LLMエージェントがWebサイトに存在する脆弱性を事前に知... 続きを読む

AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」　米Metaなどが開発、実験でGPT-4を上回る【研究紹介】

2024/01/23 157 users 米Meta 報酬実験米ニューヨーク大学開発

TOPコラム海外最新IT情報AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」　米Metaなどが開発、実験でGPT-4を上回る【研究紹介】 AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」　米Metaなどが開発、実験でGPT-4を上回る【研究紹介】 2024年1月23日米Metaと米ニューヨーク大学に所属する研究... 続きを読む

GPT-4にお礼を言わなくても回答は向上する「プロンプト26の原則」アブダビの研究者グループが発表 | Ledge.ai

2024/01/11 593 users アブダビ Ledge.ai お礼原則プロンプト26

サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。続きを読む

英語の学術論文をChatGPT-4で執筆する際の手順メモ｜Kan Hatakeyama

2024/01/05 265 users ChatGPT-4 Kan Hatakeyama 学術論文

はじめに英語の論文をGPT4に執筆させた際の手順を記します｡普段からChatGPTを使っている人にとっては､当たり前のやり取りしかしていないのですが､意外と使えていない方がnon-AI分野では多いので､丁寧にプロンプトを示していきます｡ (ワークショップで解説する必要が出てきたので､そのためのメモ書きです) GPT-4に論文は... 続きを読む

GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説（生成AIウィークリー）（テクノエッジ） - Yahoo

2024/01/03 120 users マルチモーダルモデル生成AIウィークリーテクノエッジ

1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。2024年初っ端の第27回目は、「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大規模言語モデルの返答が向上する「プロンプト26の原則」をはじめとする5つの論文をお届けします。画像から動く3Dシーンを生成する「Drea... 続きを読む

GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge

2024/01/01 831 users seamless TechnoEdge シームレス礼儀原則

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。2024年初っ端の第27回目は、「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大... 続きを読む

これは嬉しい　ChatGPTプロンプト書き方のコツ、OpenAIが公開

2023/12/18 1567 users OpenAI プロンプトプロンプトエンジニアリング性能

OpenAIは、大規模言語モデル（GPT-4）でよりよい結果を出すためのプロンプトエンジニアリング（プロンプトのノウハウ）入門テキストを同社のウェブサイトで公開している。同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体... 続きを読む

「面倒なことはChatGPTにやらせよう」 - あなたの日常を変える一冊！ - karaage. [からあげ]

2023/12/13 169 users KARAAGE chatgpt ChatGPT Plus

「面倒なことはChatGPTにやらせよう」はどんな本か？「ChatGPTに面倒なことをやらせてしまおう」というタイトル通りの内容の本です。AIの小難しい理論的な話は最低限にして、実用・エンジニアリングに最大限に振っています。特にChatGPT Plusの有料版に特化しています。GPT-4と様々な拡張機能と呼ばれる機能、具体的に... 続きを読む

人だと正解率92％なのに、GPT-4だと15％になる新型テスト集「GAIA」　米Metaなどが開発

2023/12/07 142 users GAIA Twitter seamless シームレス執筆

このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: ＠shiropen2 米Metaや米HuggingFaceなどに所属する研究者らが発表した論文「GAIA: a benchmark f... 続きを読む

もし明日、上司に「GPT-4を作れ」と言われたら？　Stability AIのシニアリサーチサイエンティストが紹介する「LLM構築タイムアタック」

2023/12/04 197 users 秋葉シニアリサーチサイエンティスト余地上司方々

「GPT-4を作ってください」と言われたらどう答える？秋葉拓哉氏：みなさん、こんにちは。秋葉と申します。それでは、発表させていただきたいと思います。みなさん、さっそくですが、「GPT-4」ってすごいですよね。ここにいらっしゃっている方々はこれについては、もう疑いの余地なく、同意してくださるかなと思います... 続きを読む

無料・無制限で「GPT-4」を使い放題！生成AIチャットサービス「リートン」（wrtn）／用途別にカスタマイズされた生成ツールを多数用意【レビュー】

2023/11/20 287 users wrtn 生成AIチャットサービス生成ツールリートン無料

GPT-4をセラピストとして実行し、「認知の歪み」を診断させるためのフレームワーク『Diagnosis of Thought (DoT)』と実行プロンプト | AIDB

2023/10/16 804 users Dot AIDB メンタルヘルスフレームワークセラピスト

ホーム AI論文解説, メンタルヘルス・心理学, 大規模言語モデル GPT-4をセラピストとして実行し、「認知の歪み」を診断させるためのフレームワーク『Diagnosis of Thought (DoT)』と実行プロンプト GPT-4をセラピストとして実行し、「認知の歪み」を診断させるためのフレームワーク『Diagnosis of Thought (DoT)』と実行... 続きを読む

AIにニュースの収集を任せている方法（GPT-4からSlack投稿） - toyoshiの日記

2023/10/13 719 users Tôyôshi LLM Slack 収集 API

キーワードベースで情報収集をしているという下記の記事を読みました。私も似たようなことをしているのですがキーワードは使わない方法でニュースの収集をしていて、そのほうがLLMを活用できていると思うのでその方法を紹介します。 forest.watch.impress.co.jp キーワードではなく自分の目的や関心を伝える以前私が手... 続きを読む

GPT-4Vができることをまとめてみた - ISID テックブログ

2023/10/12 221 users GPT-4V ISID テックブログ ISID 若本一種

こんにちは。ISID 金融ソリューション事業部の若本です。先日、GPT-4から発展し、画像も扱うことができるGPT-4 with vision（GPT-4V）が発表されました。GPT-4Vは大規模マルチモーダルモデル（LMMs: Large multimodal models）と呼ばれるAIモデルの一種であり、GPT-4の入力として「画像」を拡張したものになります。今... 続きを読む

作業者じゃなく開発者でありたい - id:onk のはてなブログ

2023/09/30 119 users ルーチン onk タスク余地創意工夫

自分がこうありたいというメモ。作業者と開発者の違いとして、問題解決への寄与だとか、創意工夫の余地があるかというのがありそう。これは今 GPT-4 に聞いた。 Q: 作業者と開発者の違いを100文字ぐらいで教えて。 A: 作業者は指定されたタスクや手順を実行する人を指し、特定のルーチンや手順に従って作業を進めるこ... 続きを読む

GPT-3.5-turbo を Fine-tuning して GPT-4 相当の性能を獲得する - DROBEプロダクト開発ブログ

2023/09/19 100 users Fine-tuning DROBE Data 都筑結論

はじめに結論背景課題 Fine-tuning とは？ Data の準備 Fine-tuning を実施結果おわりに参考はじめにこんにちは、DROBE の都筑です。みなさん LLM 使っていますか。今回は GPT-3.5-turbo の Fine-tuning の事例を紹介します。結論 GPT-4 を利用して得られたデータを使って GPT-3.5-turbo を Fine-tuning する... 続きを読む