はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 大規模言語モデル

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 96件)

LINEの3.6B言語モデルで遊んだら爆笑した|shi3z

2023/08/15 このエントリーをはてなブックマークに追加 680 users Instapaper Pocket Tweet Facebook Share Evernote Clip shi3z 言語モデル line LLM prompt

LINEから36億(3.6B)パラメータの大規模言語モデル(LLM)が公開されたので早速遊んでみた。正確には遊んだのは昨日のデイリーAIニュースなのだが、面白かったのでこちらにも転載する。 細かいやり方は大先生のページを参照のこと。 例によってこんな関数を書いた def line(prompt): # 推論の実行 input_ids = tokenizer.en... 続きを読む

無料で商用可、ChatGPT(3.5)に匹敵する生成AI「Llama 2」 Metaが発表、Microsoftと優先連携

2023/07/18 このエントリーをはてなブックマークに追加 234 users Instapaper Pocket Tweet Facebook Share Evernote Clip Meta chatgpt 米Meta 生成AI 商用可

米Metaは7月18日(現地時間)、大規模言語モデル「Llama 2」を発表した。利用は無料で商用利用も可能としている。最大サイズの70億パラメーターモデルは「ChatGPT(の3月1日版)と互角」(同社)という。 ダウンロードには、Metaが用意するフォームから名前とメールアドレス、国、組織名を入れ、利用規約に同意した旨を... 続きを読む

「あれ?人にお願いする時とちょっと似てない?」 ChatGPTで「効くプロンプト・効かないプロンプト」

2023/05/01 このエントリーをはてなブックマークに追加 215 users Instapaper Pocket Tweet Facebook Share Evernote Clip chatgpt プロンプト LLM Tips 登壇

大規模言語モデル(LLM)を、実際にプロダクトや実務に役立つかたちで利用している各社が見た使いどころや、実践の上での工夫について学び合うためのイベント「ChatGPT IN ACTION 実践で使う大規模言語モデル」。ファインディ株式会社からは、笹野翔太氏が登壇。ChatGPTを利用してサービスを開発する中で見つけたTipsを... 続きを読む

「社内のアレ分からん、教えてAI」を支援 Microsoftの“自社版ChatGPT作成サービス”、外部データ取り込み機能が正式リリース

2024/02/21 このエントリーをはてなブックマークに追加 202 users Instapaper Pocket Tweet Facebook Share Evernote Clip アレ 正式リリース 外部データ 機能 Rag

米Microsoftは2月20日(現地時間)、大規模言語モデル「GPT-4」などのAPIを同社のクラウド上で使える「Azure OpenAI Service」の外部データ連携機能「On Your Data」を正式リリースした。これまではパブリックプレビュー版として提供していた。 On Your Dataはいわゆる「RAG」(大規模言語モデルに外部データベースの情... 続きを読む

Microsoftがたった13億のパラメーターでGPT-3.5超えのHumanEval50.6%をたたき出す「phi-1」を発表

2023/06/22 このエントリーをはてなブックマークに追加 179 users Instapaper Pocket Tweet Facebook Share Evernote Clip パラメーター phi-1 Microsoft LLM 発表

LLaMaやFalconといった小型の大規模言語モデル(LLM)が矢継ぎ早にリリースされる中、Microsoft ResearchのAI研究チームが、プレプリントサーバーのarXivで、Transformerベースのモデル「phi-1」を発表しました。このモデルは、パラメーター数がGPT-3.5の100分の1以下の13億しかないにもかかわらず、テスト用データセット... 続きを読む

ChatGPT×Whisperで履歴書と職務経歴書づくりを効率化 開発してみてわかった、生成AIの活かし方

2023/06/13 このエントリーをはてなブックマークに追加 176 users Instapaper Pocket Tweet Facebook Share Evernote Clip 生成AI LLM 活かし方 履歴書 CTO

大規模言語モデル(LLM)を、実際にプロダクトや実務に役立つかたちで利用している各社が見た使いどころや、実践の上での工夫について学び合うためのイベント「ChatGPT IN ACTION 実践で使う大規模言語モデル」。株式会社ROXXからは、CTOの松本宏太氏が登壇。「ChatGPT×Whisper」で作ったプロトタイプを紹介しました。 R... 続きを読む

日本人「新しいBing」めっちゃ使う 日本MSが利用動向を公開 1人当たりの検索数で世界トップ

2023/03/22 このエントリーをはてなブックマークに追加 145 users Instapaper Pocket Tweet Facebook Share Evernote Clip 新しいBing 米OpenAI パナソニックコネクト API

Microsoftが提供する他のAIサービスについても、日本での利用動向を公開した。例えばクラウドサービス「Microsoft Azure」から、米OpenAIの大規模言語モデル「GPT-3.5」などのAPIにアクセスできる「Azure OpenAI Service」については、パナソニックグループのパナソニックコネクト(東京都中央区)やnoteなどに提供。そ... 続きを読む

百花繚乱の大規模言語モデル その現状まとめ【2023年4月末版】

2023/04/25 このエントリーをはてなブックマークに追加 139 users Instapaper Pocket Tweet Facebook Share Evernote Clip 百花繚乱 LLM 現状まとめ chatgpt 小競り合い

米OpenAIが独占的に提供する大規模言語モデル(LLM)に対し、さまざまなLLMが登場している。特に注目はオープンで自由な大規模言語モデル「Dolly-v2」だ。さながら現在は「不自由な大規模言語モデルと自由な大規模言語モデルの小競り合い」が起きている状態だ。 昨年末から急激に話題を呼んだChatGPT、その内部的なバー... 続きを読む

マイクロソフト、軽量かつ高性能な大規模言語モデル「phi-1」を発表

2023/06/23 このエントリーをはてなブックマークに追加 134 users Instapaper Pocket Tweet Facebook Share Evernote Clip phi-1 Transformerベース マイクロソフト

Microsoft ResearchのAI研究チームは6月20日(現地時間)、わずか13億パラメーターと従来のものよりもサイズが小さいにも関わらず「GPT-3.5(1750億パラメーター)」を上回る成績を収めたTransformerベースの大規模言語モデル「phi-1」を発表した。このモデルは間もなく「Hugging Face」で公開される予定だといいう。 ベ... 続きを読む

【西川和久の不定期コラム】 ローカルで画像生成AIや大規模言語モデルを動かしたい!Google ColabからRTX 3070 Ti+GPU Boxへ乗り換え!?

2023/03/26 このエントリーをはてなブックマークに追加 114 users Instapaper Pocket Tweet Facebook Share Evernote Clip RTX Box 西川和久 不定期コラム 画像生成AI

続きを読む

日本語に特化した大規模言語モデル(生成AI)を試作|2023年|NICT-情報通信研究機構

2023/07/04 このエントリーをはてなブックマークに追加 113 users Instapaper Pocket Tweet Facebook Share Evernote Clip 試作 生成AI NICT-情報通信研究機構 日本語

国立研究開発法人情報通信研究機構(NICT(エヌアイシーティー)、理事長: 徳田 英幸)は、ユニバーサルコミュニケーション研究所データ駆動知能システム研究センターにおいて、独自に収集した350 GBの日本語Webテキストのみを用いて400億パラメータの生成系の大規模言語モデルを開発しました。今回の開発を通し、事前学... 続きを読む

Google、論文・レポート作成を生成AIが支援「NotebookLM」公開、Geminiを導入

2023/12/09 このエントリーをはてなブックマークに追加 106 users Instapaper Pocket Tweet Facebook Share Evernote Clip GEMINI NotebookLM LLM 論文 生成AI

米Googleは12月8日(現地時間)、Googleラボが初期テスターに提供していたAIノートブック「NotebookLM」(実験製品)を、米国で18歳以上が利用できるようにした。これは今年5月に開発者カンファレンスにおいて、「Project Tailwind」という名称で紹介されたツールであり、オンラインノートに大規模言語モデル(LLM)によ... 続きを読む

OpenAI、大規模言語モデルの数学能力を大きく向上させることに成功 | アイブン

2023/06/01 このエントリーをはてなブックマークに追加 90 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI LLM アイブン 数学能力 フレームワーク

マイページに保存 OpenAIは新しいフレームワーク「PRM」を発表しました。これは、大規模言語モデル(LLM)の数学能力を向上させるためのもので、AIが問題を解く際の誤りをプロセスベースで特定・修正する能力を強化します。このフレームワークで訓練した大規模言語モデルは、DeepMind社の作成した数学問題集(MTAHデータ... 続きを読む

最近話題になった大規模言語モデルまとめ|npaka|note

2023/03/16 このエントリーをはてなブックマークに追加 82 users Instapaper Pocket Tweet Facebook Share Evernote Clip Note マルチモーダル 話題 OpenAI プロンプト

最近話題になった大規模言語モデルをまとめました。 1. GPT-4「GPT-4」は、OpenAIによって開発された大規模言語モデルです。 マルチモーダルで、テキストと画像のプロンプトを受け入れることができるようになりました。最大トークン数が4Kから32kに増えました。推論能力も飛躍的に向上しています。 現在、「ChatGPT Pro... 続きを読む

Meta、コード生成や解釈に特化した大規模言語モデル「Code Llama」公開

2023/08/27 このエントリーをはてなブックマークに追加 54 users Instapaper Pocket Tweet Facebook Share Evernote Clip Meta プロンプト Code Llama 解釈 生成

Metaは、コードもしくは自然言語によるプロンプトから、コードの生成およびコードに関する自然言語の説明を生成できる大規模言語モデル「Code Llama」を公開しました。 Code Llamaは、先月(2023年7月)にMetaが発表した大規模言語モデル「Llama 2」をベースに、コードに特化したデータセットでさらに訓練したバージョン... 続きを読む

LINE、日本語の大規模言語モデル公開 オープンソースで 商用利用もOK

2023/08/14 このエントリーをはてなブックマークに追加 40 users Instapaper Pocket Tweet Facebook Share Evernote Clip ソース line 商用利用 言語モデル公開 日本語

LINEは8月14日、日本語に特化した大規模言語モデル(LLM)「japanese-large-lm」を発表した。オープンソース(OSS)として公開し、商用利用も可能(Apache License 2.0)としている。 公開したLLMは、36億パラメーターと17億パラメーターの2つ。両モデルともHuggingFace Hubからアクセスできる。Web由来のテキストから大... 続きを読む

ChatGPTの開発元OpenAIが「10年以内にAIがほとんどの分野で専門家のスキルレベルを超える」という懸念に基づき「超知能AI」の登場に備えるべく世界的な規制機関を立ち上げる必要があると主

2023/05/23 このエントリーをはてなブックマークに追加 37 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI chatgpt スキルレベル GPT-4 懸念

現地時間の2023年5月22日、対話型AI「ChatGPT」や大規模言語モデル「GPT-4」などを開発したAI研究団体のOpenAIが、専門家のスキルレベルを超え、高度な生産活動を行うAI「超知能(Superintelligence)」の登場を予期し、AIの安全な開発を進めるためには国際的な規制機関の立ち上げが必要になると提唱しています。 Governan... 続きを読む

なぜ日本はGPUのない「富岳」でLLMを研究するのか 外国に後れを取らないための“現実的な理由”

2023/09/11 このエントリーをはてなブックマークに追加 34 users Instapaper Pocket Tweet Facebook Share Evernote Clip LLM GPU スパコン GPT-4 米OpenAI

日本では今、スパコン「富岳」を使ってLLMの研究・開発を進めている。深層学習においてはGPUを使うのが一般的だが、なぜGPUのない富岳を使うのか。そこには現実的な理由があった。 米OpenAIの大規模言語モデル(LLM)・GPT-4は今、世界を大きく塗り替え続けている技術の一つだ。世界各国の企業がこぞってLLMの開発を進め... 続きを読む

Stability AI、ノートPCでも動作する大規模言語モデル(LLM)を発表

2023/10/03 このエントリーをはてなブックマークに追加 27 users Instapaper Pocket Tweet Facebook Share Evernote Clip LLM CC-BY-SA Stability AI リリース

Stabilty.AIは10月3日、ノートPCなど計算能力のあまり高くないPCでも動作するように設計されたコンパクトな大規模言語モデル(LLM)「Stable LM 3B」のリリースを発表した。ライセンスは商用利用も可能なオープンソースの「CC-By-SA 4.0」となっている。 軽量・高速にもかかわらず高度な自然言語処理が可能 2023年4月20... 続きを読む

マイクロソフト、「Copilot」無料版にも「GPT-4 Turbo」を搭載

2024/03/14 このエントリーをはてなブックマークに追加 26 users Instapaper Pocket Tweet Facebook Share Evernote Clip LLM COPILOT chatgpt 脚注機能 HTML

印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 「Microsoft Copilot」の無料版は、より高度な大規模言語モデル(LLM)や、脚注機能、インターネットへのアクセス機能といった、「ChatGPT」の無料版に備わっていない数多くの... 続きを読む

【国内初】株式会社Trippy、『けものフレンズ』公式のAIチャットサービス「AIアライさん」をリリース

2023/05/25 このエントリーをはてなブックマークに追加 26 users Instapaper Pocket Tweet Facebook Share Evernote Clip AIチャットサービス けものフレンズ AIアライさん LLM

株式会社Trippy(本社:東京都新宿区、代表取締役:漆原陸)は、大人気プロジェクト『けものフレンズ』のキャラクター、アライグマ(通称・アライさん)を活用した、国内初のキャラクター×AIチャットサービス「AIアライさん」を5月29日(月)リリース予定。 「AIアライさん」は、OpenAI社が提供する大規模言語モデル(LLM... 続きを読む

Google Bardを試すなら2つのことを試してほしい

2023/05/11 このエントリーをはてなブックマークに追加 26 users Instapaper Pocket Tweet Facebook Share Evernote Clip Google Bard Thursday chatgpt

Web技術 Google Bardを試すなら2つのことを試してほしい Thursday, May 11th, 2023 「Google Bard」は、GoogleがChatGPTやBing AIなどに対抗して公開した、大規模言語モデルを使用した、いわゆるチャットAIです。 昨日までは日本語で質問しても英語で返答していましたが、本日未明の「Google I/O」というイベントに合わ... 続きを読む

米Bloomberg、金融特化の大規模言語モデル「BloombergGPT」発表 「Appleの時価総額を教えて」などに回答

2023/04/07 このエントリーをはてなブックマークに追加 24 users Instapaper Pocket Tweet Facebook Share Evernote Clip Twitter seamless 米Bloomberg 論文

Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 米Bloombergと米ジョンズ・ホプキンズ大学に所属する研究者らが発表した論文「BloombergGPT: A Large Langua... 続きを読む

無料でノートPCでも実行可能な70億パラメータのチャットボット「GPT4ALL」発表

2012/01/28 このエントリーをはてなブックマークに追加 24 users Instapaper Pocket Tweet Facebook Share Evernote Clip チャットボット 実行 Meta ノートPC GitHub

GPT-3.5-TurboとMetaの大規模言語モデル「LLaMA」で学習したデータを用いた、ノートPCでも実行可能なチャットボット「GPT4ALL」をNomic AIが発表しました。さまざまなトピックの学習に用いられた質問と返答のペアのトレーニングデータセットもすべて公開されています。 GitHub - nomic-ai/gpt4all: gpt4all: a chatbot t... 続きを読む

Microsoftが「AI技術のリスクを警告するチーム」をクビにしたことが判明

2023/03/14 このエントリーをはてなブックマークに追加 22 users Instapaper Pocket Tweet Facebook Share Evernote Clip クビ Microsoft 判明 リスク AI技術

Microsoftが、2023年初頭から実施している大規模なレイオフにより、OpenAIの技術を製品に組み込む際のリスク評価を行うAIチームをレイオフしたことが分かりました。OpenAIの大規模言語モデルを組み込んだMicrosoftのBing Chatが脚光を浴びる中、同社が掲げる「責任あるAIの原則」を保証することを専門とするチームがなく... 続きを読む

 
(1 - 25 / 96件)