タグ 大規模言語モデル
新着順 10 users 50 users 100 users 500 users 1000 usersLINEの3.6B言語モデルで遊んだら爆笑した|shi3z
LINEから36億(3.6B)パラメータの大規模言語モデル(LLM)が公開されたので早速遊んでみた。正確には遊んだのは昨日のデイリーAIニュースなのだが、面白かったのでこちらにも転載する。 細かいやり方は大先生のページを参照のこと。 例によってこんな関数を書いた def line(prompt): # 推論の実行 input_ids = tokenizer.en... 続きを読む
無料で商用可、ChatGPT(3.5)に匹敵する生成AI「Llama 2」 Metaが発表、Microsoftと優先連携
米Metaは7月18日(現地時間)、大規模言語モデル「Llama 2」を発表した。利用は無料で商用利用も可能としている。最大サイズの70億パラメーターモデルは「ChatGPT(の3月1日版)と互角」(同社)という。 ダウンロードには、Metaが用意するフォームから名前とメールアドレス、国、組織名を入れ、利用規約に同意した旨を... 続きを読む
「あれ?人にお願いする時とちょっと似てない?」 ChatGPTで「効くプロンプト・効かないプロンプト」
大規模言語モデル(LLM)を、実際にプロダクトや実務に役立つかたちで利用している各社が見た使いどころや、実践の上での工夫について学び合うためのイベント「ChatGPT IN ACTION 実践で使う大規模言語モデル」。ファインディ株式会社からは、笹野翔太氏が登壇。ChatGPTを利用してサービスを開発する中で見つけたTipsを... 続きを読む
「社内のアレ分からん、教えてAI」を支援 Microsoftの“自社版ChatGPT作成サービス”、外部データ取り込み機能が正式リリース
米Microsoftは2月20日(現地時間)、大規模言語モデル「GPT-4」などのAPIを同社のクラウド上で使える「Azure OpenAI Service」の外部データ連携機能「On Your Data」を正式リリースした。これまではパブリックプレビュー版として提供していた。 On Your Dataはいわゆる「RAG」(大規模言語モデルに外部データベースの情... 続きを読む
Microsoftがたった13億のパラメーターでGPT-3.5超えのHumanEval50.6%をたたき出す「phi-1」を発表
LLaMaやFalconといった小型の大規模言語モデル(LLM)が矢継ぎ早にリリースされる中、Microsoft ResearchのAI研究チームが、プレプリントサーバーのarXivで、Transformerベースのモデル「phi-1」を発表しました。このモデルは、パラメーター数がGPT-3.5の100分の1以下の13億しかないにもかかわらず、テスト用データセット... 続きを読む
ChatGPT×Whisperで履歴書と職務経歴書づくりを効率化 開発してみてわかった、生成AIの活かし方
大規模言語モデル(LLM)を、実際にプロダクトや実務に役立つかたちで利用している各社が見た使いどころや、実践の上での工夫について学び合うためのイベント「ChatGPT IN ACTION 実践で使う大規模言語モデル」。株式会社ROXXからは、CTOの松本宏太氏が登壇。「ChatGPT×Whisper」で作ったプロトタイプを紹介しました。 R... 続きを読む
日本人「新しいBing」めっちゃ使う 日本MSが利用動向を公開 1人当たりの検索数で世界トップ
Microsoftが提供する他のAIサービスについても、日本での利用動向を公開した。例えばクラウドサービス「Microsoft Azure」から、米OpenAIの大規模言語モデル「GPT-3.5」などのAPIにアクセスできる「Azure OpenAI Service」については、パナソニックグループのパナソニックコネクト(東京都中央区)やnoteなどに提供。そ... 続きを読む
百花繚乱の大規模言語モデル その現状まとめ【2023年4月末版】
米OpenAIが独占的に提供する大規模言語モデル(LLM)に対し、さまざまなLLMが登場している。特に注目はオープンで自由な大規模言語モデル「Dolly-v2」だ。さながら現在は「不自由な大規模言語モデルと自由な大規模言語モデルの小競り合い」が起きている状態だ。 昨年末から急激に話題を呼んだChatGPT、その内部的なバー... 続きを読む
マイクロソフト、軽量かつ高性能な大規模言語モデル「phi-1」を発表
Microsoft ResearchのAI研究チームは6月20日(現地時間)、わずか13億パラメーターと従来のものよりもサイズが小さいにも関わらず「GPT-3.5(1750億パラメーター)」を上回る成績を収めたTransformerベースの大規模言語モデル「phi-1」を発表した。このモデルは間もなく「Hugging Face」で公開される予定だといいう。 ベ... 続きを読む
【西川和久の不定期コラム】 ローカルで画像生成AIや大規模言語モデルを動かしたい!Google ColabからRTX 3070 Ti+GPU Boxへ乗り換え!?
日本語に特化した大規模言語モデル(生成AI)を試作|2023年|NICT-情報通信研究機構
国立研究開発法人情報通信研究機構(NICT(エヌアイシーティー)、理事長: 徳田 英幸)は、ユニバーサルコミュニケーション研究所データ駆動知能システム研究センターにおいて、独自に収集した350 GBの日本語Webテキストのみを用いて400億パラメータの生成系の大規模言語モデルを開発しました。今回の開発を通し、事前学... 続きを読む
Google、論文・レポート作成を生成AIが支援「NotebookLM」公開、Geminiを導入
米Googleは12月8日(現地時間)、Googleラボが初期テスターに提供していたAIノートブック「NotebookLM」(実験製品)を、米国で18歳以上が利用できるようにした。これは今年5月に開発者カンファレンスにおいて、「Project Tailwind」という名称で紹介されたツールであり、オンラインノートに大規模言語モデル(LLM)によ... 続きを読む
OpenAI、大規模言語モデルの数学能力を大きく向上させることに成功 | アイブン
マイページに保存 OpenAIは新しいフレームワーク「PRM」を発表しました。これは、大規模言語モデル(LLM)の数学能力を向上させるためのもので、AIが問題を解く際の誤りをプロセスベースで特定・修正する能力を強化します。このフレームワークで訓練した大規模言語モデルは、DeepMind社の作成した数学問題集(MTAHデータ... 続きを読む
最近話題になった大規模言語モデルまとめ|npaka|note
最近話題になった大規模言語モデルをまとめました。 1. GPT-4「GPT-4」は、OpenAIによって開発された大規模言語モデルです。 マルチモーダルで、テキストと画像のプロンプトを受け入れることができるようになりました。最大トークン数が4Kから32kに増えました。推論能力も飛躍的に向上しています。 現在、「ChatGPT Pro... 続きを読む
Meta、コード生成や解釈に特化した大規模言語モデル「Code Llama」公開
Metaは、コードもしくは自然言語によるプロンプトから、コードの生成およびコードに関する自然言語の説明を生成できる大規模言語モデル「Code Llama」を公開しました。 Code Llamaは、先月(2023年7月)にMetaが発表した大規模言語モデル「Llama 2」をベースに、コードに特化したデータセットでさらに訓練したバージョン... 続きを読む
LINE、日本語の大規模言語モデル公開 オープンソースで 商用利用もOK
LINEは8月14日、日本語に特化した大規模言語モデル(LLM)「japanese-large-lm」を発表した。オープンソース(OSS)として公開し、商用利用も可能(Apache License 2.0)としている。 公開したLLMは、36億パラメーターと17億パラメーターの2つ。両モデルともHuggingFace Hubからアクセスできる。Web由来のテキストから大... 続きを読む
ChatGPTの開発元OpenAIが「10年以内にAIがほとんどの分野で専門家のスキルレベルを超える」という懸念に基づき「超知能AI」の登場に備えるべく世界的な規制機関を立ち上げる必要があると主
現地時間の2023年5月22日、対話型AI「ChatGPT」や大規模言語モデル「GPT-4」などを開発したAI研究団体のOpenAIが、専門家のスキルレベルを超え、高度な生産活動を行うAI「超知能(Superintelligence)」の登場を予期し、AIの安全な開発を進めるためには国際的な規制機関の立ち上げが必要になると提唱しています。 Governan... 続きを読む
なぜ日本はGPUのない「富岳」でLLMを研究するのか 外国に後れを取らないための“現実的な理由”
日本では今、スパコン「富岳」を使ってLLMの研究・開発を進めている。深層学習においてはGPUを使うのが一般的だが、なぜGPUのない富岳を使うのか。そこには現実的な理由があった。 米OpenAIの大規模言語モデル(LLM)・GPT-4は今、世界を大きく塗り替え続けている技術の一つだ。世界各国の企業がこぞってLLMの開発を進め... 続きを読む
Stability AI、ノートPCでも動作する大規模言語モデル(LLM)を発表
Stabilty.AIは10月3日、ノートPCなど計算能力のあまり高くないPCでも動作するように設計されたコンパクトな大規模言語モデル(LLM)「Stable LM 3B」のリリースを発表した。ライセンスは商用利用も可能なオープンソースの「CC-By-SA 4.0」となっている。 軽量・高速にもかかわらず高度な自然言語処理が可能 2023年4月20... 続きを読む
マイクロソフト、「Copilot」無料版にも「GPT-4 Turbo」を搭載
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 「Microsoft Copilot」の無料版は、より高度な大規模言語モデル(LLM)や、脚注機能、インターネットへのアクセス機能といった、「ChatGPT」の無料版に備わっていない数多くの... 続きを読む
【国内初】株式会社Trippy、『けものフレンズ』公式のAIチャットサービス「AIアライさん」をリリース
株式会社Trippy(本社:東京都新宿区、代表取締役:漆原陸)は、大人気プロジェクト『けものフレンズ』のキャラクター、アライグマ(通称・アライさん)を活用した、国内初のキャラクター×AIチャットサービス「AIアライさん」を5月29日(月)リリース予定。 「AIアライさん」は、OpenAI社が提供する大規模言語モデル(LLM... 続きを読む
Google Bardを試すなら2つのことを試してほしい
Web技術 Google Bardを試すなら2つのことを試してほしい Thursday, May 11th, 2023 「Google Bard」は、GoogleがChatGPTやBing AIなどに対抗して公開した、大規模言語モデルを使用した、いわゆるチャットAIです。 昨日までは日本語で質問しても英語で返答していましたが、本日未明の「Google I/O」というイベントに合わ... 続きを読む
米Bloomberg、金融特化の大規模言語モデル「BloombergGPT」発表 「Appleの時価総額を教えて」などに回答
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 米Bloombergと米ジョンズ・ホプキンズ大学に所属する研究者らが発表した論文「BloombergGPT: A Large Langua... 続きを読む
無料でノートPCでも実行可能な70億パラメータのチャットボット「GPT4ALL」発表
GPT-3.5-TurboとMetaの大規模言語モデル「LLaMA」で学習したデータを用いた、ノートPCでも実行可能なチャットボット「GPT4ALL」をNomic AIが発表しました。さまざまなトピックの学習に用いられた質問と返答のペアのトレーニングデータセットもすべて公開されています。 GitHub - nomic-ai/gpt4all: gpt4all: a chatbot t... 続きを読む
Microsoftが「AI技術のリスクを警告するチーム」をクビにしたことが判明
Microsoftが、2023年初頭から実施している大規模なレイオフにより、OpenAIの技術を製品に組み込む際のリスク評価を行うAIチームをレイオフしたことが分かりました。OpenAIの大規模言語モデルを組み込んだMicrosoftのBing Chatが脚光を浴びる中、同社が掲げる「責任あるAIの原則」を保証することを専門とするチームがなく... 続きを読む