タグ「LLM」 - はてブログ

タグ LLM

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 25 / 348件)

マイクロソフト、初心者向け生成AI学習教材「生成AIアプリケーションの開発を始めるために必要な全知識を学べる12講座」を無償公開

2024/01/08 1293 users マイクロソフト生成AIアプリケーション無償公開開発内容

マイクロソフト、初心者向け生成AI学習教材「生成AIアプリケーションの開発を始めるために必要な全知識を学べる12講座」を無償公開コースの内容には、大規模言語モデル（LLM）がどのように動くかを理解する。「生成 AI と大規模言語モデルの紹介」、ユースケースに適したAIモデルを選択できるようにする「様々なLLMの調... 続きを読む

LLMの現在 - Speaker Deck

2024/03/29 881 users 状況

今のLLMを取り巻く状況について紹介します。続きを読む

話題の「ChatGPT」誰でもできる目からウロコの使い方【『独学大全』著者が教える】

2023/05/06 845 users chatgpt 独学大全ウロコ著者根っこ

読書猿：実は、検索スキルというか、その根っこにある考え方って、ChatGPTのようなLLM（注１）をうまく使ってより良い答えを得るのに、めちゃくちゃ使えるんです。もっといえば、広い意味での人文知、〈知識はどのような言葉で書かれてきたか〉についての知識があればあるほど、ChatGPTは使いこなせる。その理由は、LLM... 続きを読む

【完全保存版】GPT を特定の目的に特化させて扱う (Fine-tuning, Prompt, Index, etc.) - Qiita

2023/03/30 804 users prompt Fine-tuning GPT Qiita 過言

【完全保存版】GPT を特定の目的に特化させて扱う (Fine-tuning, Prompt, Index, etc.) ChatGPT に代表される今日の AI ブームを牽引しているのは大規模言語モデル（Large-scale Language Model, LLM）と言っても過言ではないでしょう。LLM とは大量のテキストデータを使ってトレーニングされた自然言語処理のモデルで... 続きを読む

AIにニュースの収集を任せている方法（GPT-4からSlack投稿） - toyoshiの日記

2023/10/13 719 users Tôyôshi GPT-4 Slack 収集 API

キーワードベースで情報収集をしているという下記の記事を読みました。私も似たようなことをしているのですがキーワードは使わない方法でニュースの収集をしていて、そのほうがLLMを活用できていると思うのでその方法を紹介します。 forest.watch.impress.co.jp キーワードではなく自分の目的や関心を伝える以前私が手... 続きを読む

LINEの3.6B言語モデルで遊んだら爆笑した｜shi3z

2023/08/15 680 users shi3z 言語モデル line prompt 推論

LINEから36億(3.6B)パラメータの大規模言語モデル(LLM)が公開されたので早速遊んでみた。正確には遊んだのは昨日のデイリーAIニュースなのだが、面白かったのでこちらにも転載する。細かいやり方は大先生のページを参照のこと。例によってこんな関数を書いた def line(prompt): # 推論の実行 input_ids = tokenizer.en... 続きを読む

えっ、まだChatGPT使ってんの？ - Qiita

2023/09/13 591 users Qiita chatgpt chat キャッチー焦点

はじめにこんなキャッチーなタイトルをしていますが、私はChatGPTを悪く言う意図は全くありません。もちろん、ChatGPTは非常に優れた製品ですし、実際に、世界はChatGPTによって大きく変わりました。 LLMを大きく普及させたの先駆者として、とても偉大な存在です。今回は、利用料金に焦点を当てた話になります。 Chat ... 続きを読む

ChatGPTは馬鹿じゃない！真の実力を解放するプロンプトエンジニアリングの最前線

2023/03/09 518 users chatgpt プロンプトエンジニアリング iCl cot

はじめに ChatGPTをはじめとしたLLMを使いこなすための必須スキル、プロンプトエンジニアリングについて解説します。最近は動きが早すぎてキャッチアップが難しくなっていますが、特に以下のような手法が注目されているようです。 In-context Learning (ICL) Chain-of Thought (CoT) Zero-shot Reasoning ReAct Self-C... 続きを読む

日本のAI政策、「和製ChatGPT」の開発にこだわるべきか否か--自民党が提言へ

2023/03/23 449 users 提言自民党 AI政策 chatgpt 骨子

自由民主党（自民党）のデジタル社会推進本部は3月22日、AI関連の政策提言をまとめる「AIホワイトペーパー」の骨子を公開した。「ChatGPT」の登場で「AIをめぐる社会状況は一変した」としたうえで、新たなAI国家戦略の策定などを提言する。具体的な内容は3月27日週中に取りまとめる。提言では、大規模言語モデル（LLM）... 続きを読む

「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する | AIDB

2023/11/03 430 users chatgpt AIDB AI論文限界パフォーマンス

ホーム AI論文解説, 大規模言語モデル「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する... 続きを読む

ChatGPTに自社データを組み込んで新しい検索体験を模索してみました｜masa_kazama｜note

2023/03/03 397 users chatgpt masa_kazama Note Bing

イントロChatGPTやBing、NotionAIなどの大規模自然言語モデル(LLM)を活用したサービスが注目を集めています。対話、要約、翻訳、アイデア生成などの多様なタスクにおいて、とても性能が高いです。ただ、ChatGPTでは、ときどき嘘が混じっていたり、文献が捏造されたりすることがあります。 ChatGPTとの対話画面（結果の書... 続きを読む

ChatGPTのライバル「Claude 3」の使い方　良い点、悪い点まとめ (1/5)

2024/03/22 346 users chatgpt Claude ライバル OpenAI 界隈

3月4日の公開以来、「Claudeやばくない？」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル（LLM）だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも... 続きを読む

GPT-4が労働市場に与える影響と各職種のリスク評価──OpenAIの研究者が論文発表

2023/03/21 345 users OpenAI GPT-4 GPT 論文発表労働市場

「GPT-4」を手掛けたOpenAIの研究者が「GPTはGPT：LLMの労働市場への影響の可能性に関する初期の考察」と題した論文を発表した。米国の労働力の約8割が、少なくとも仕事の1割にGPT導入の影響を受ける可能性があるとしている。影響を受けやすいのはジャーナリスト、翻訳者、Webデザイナーなど。大規模言語モデル（LLM）... 続きを読む

生成AIで小説を書くためのプロンプト5選

2024/04/15 342 users 生成AI 小説プロンプト実地遅ればせ

人類の皆さん、小説書いてますか？この記事についてこの記事に書いてあることこの一ヶ月ほど、遅ればせながらLLMによる小説執筆の支援という試みを実地でやってみたので、その中で結構良かったなと思ったプロンプトを紹介する。使用したモデルはClaude 3 Opus。この記事で書かないこと生成AI「で」小説を書くこと... 続きを読む

誰でもわかる強化学習

2023/11/24 311 users 強化学習 DQN Deep Q-Network 手法講義資料

本資料は，東京大学松尾研究室で開催された強化学習セミナーの講義資料をもとに，講演目的でより初学者向けに内容を調整したものです．特に強化学習で最も基本的かつ最重要手法であるQ学習や，それの深層強化学習版のDQN（Deep Q-Network）を中心に解説しています. 昨今，ChatGPT等の大規模言語モデル（LLM）の開発に強... 続きを読む

ChatGPTの効果的なプロンプト手法における「基本のキ」を理論とテンプレート両方で紹介 | AIDB

2023/11/07 305 users chatgpt AIDB ChatG プロンプト基本

マイページに保存最終更新日：2023/11/08 ChatGPTなどのLLMは、自然言語を理解し、人間のように対話する能力を持っており、多くの場面でその能力を発揮しています。しかし、これらのモデルが最大限のパフォーマンスを発揮するためには、適切なプロンプト（指示テキスト）を使用することが不可欠です。本記事では、ChatG... 続きを読む

LLMを理解する一歩として「ゼロから作るDeep Learning」をやった - $shibayu36->blog;

2023/05/23 304 users GPT conceptualization 考察限界気持ち

LLM、GPT界隈を追いかけていて、GPTの仕組みと限界についての考察（2.1） - conceptualizationという記事を見かけた。これを見たとき、「どういうことか全然理解できない」という気持ちになった。また、その他LLMの解説記事を理解できないことが多く、自分の機械学習知識不足が明確になった。理解できなかったことは悔... 続きを読む

ChatGPTとBardの対決を超える“事件”。無料の｢StableLM｣登場で｢AIの超民主化｣争いが始まった

2023/04/21 276 users Bard ぱらめ chatgpt StableLM パラメータ

StableLMは、現在のところ3B（30億パラメータ）と7B（70億パラメータ）モデルのみが公開されているため、その実力は未知数だ。パラメータというのは、ごく簡単に言えばLLMが学習しているデータの大きさだ。 GPT3が175B（1750億パラメータ）なので、それに比べるとかなり小さいように思えるが、大規模言語モデルはパラメ... 続きを読む

データの民主化とこれからのAI組織｜ばんくし｜note

2023/03/13 264 users バンクシ Note 民主化マルチモーダルデータ

はじめにStable DiffusionだとかChatGPT、LLMみたいな「大規模モデル」って考え方が機械学習業界から出て、スケーリング則に基づいてまだまだ精度が上がるとされている昨今。（スケーリング則はどうのこうの諸説あるが）さておき、「マルチモーダルに」「あらゆるデータを学習した」「大規模なモデル」が今後数年リード... 続きを読む

GPT-4登場以降に出てきたChatGPT/LLMに関する論文や技術の振り返り - Platinum Data Blog by BrainPad

2023/06/05 250 users chatgpt GPT-4 Generative AI 論文

このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。この記事では、GPT-4の登場から執筆日（2023年5月31日時点）までの2ヶ月間で登場した論文を振り返りながら、まとめて紹介していきま... 続きを読む

LLMのプロンプト技術まとめ - Qiita

2023/10/25 248 users Qiita

はじめに今回はすぐに使えそうなプロンプトの工夫やフレームワークについて有名なものをまとめました．LMの出力の精度向上に役立てられればと思います． ※記事に誤り等ありましたらご指摘いただけますと幸いです． ※記載されている順番は論文が発表されている順番とは関係ありません． ※論文で精度向上が確認されている... 続きを読む

第1回 LLM 勉強会

2023/06/03 243 users LLM 勉強会第1回サーベイ黒橋禎夫趣旨

2023年5月15日（月）に国立情報学研究所にて初回となる LLM 勉強会を開催しました。プログラム勉強会の趣旨、国の動向など [資料] 黒橋禎夫（国立情報学研究所）現状の LLM のサーベイ [資料] 河原大輔（早稲田大学）菅原朔（国立情報学研究所）栗田修平（理化学研究所）各機関での試みの紹介河原大輔（早稲田大... 続きを読む

GPT-4にWebサイトを“自律的に”ハッキングさせる方法　AI自身が脆弱性を検出、成功率70％以上【研究紹介】

2024/02/21 223 users GPT-4 検出脆弱性 AI自身 Webサイト

米UIUC（イリノイ大学アーバナ・シャンペーン校）に所属する研究者らが発表した論文「LLM Agents can Autonomously Hack Websites」は、大規模言語モデル（LLM）を用いたAIエージェントに、自律的にWebサイトをハッキングさせる攻撃手法を提案した研究報告である。LLMエージェントがWebサイトに存在する脆弱性を事前に知... 続きを読む

GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」

2024/04/08 221 users オープンLLM Command R 衝撃 need PC内

カナダのAIスタートアップCohereは4月4日（現地時間）、ビジネス向けに最適化された最新の大規模言語モデル（LLM）「Command R+」を発表した。高度なRAG技術を採用 Cohereは、AI業界に変革をもたらしたTransformerモデルを提唱した論文「Attention is All You Need」の共同執筆者として知られるトロント大学の研究者Aid... 続きを読む

「あれ？人にお願いする時とちょっと似てない？」　ChatGPTで「効くプロンプト・効かないプロンプト」

2023/05/01 215 users chatgpt プロンプト Tips 登壇かたち

大規模言語モデル（LLM）を、実際にプロダクトや実務に役立つかたちで利用している各社が見た使いどころや、実践の上での工夫について学び合うためのイベント「ChatGPT IN ACTION 実践で使う大規模言語モデル」。ファインディ株式会社からは、笹野翔太氏が登壇。ChatGPTを利用してサービスを開発する中で見つけたTipsを... 続きを読む