はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ Large Language Model

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 3 / 3件)
 

大規模言語モデル(LLM)の作り方 Megatron-DeepSpeed編

2023/06/29 このエントリーをはてなブックマークに追加 129 users Instapaper Pocket Tweet Facebook Share Evernote Clip LLM Turing GPT-4 インターン 知見

はじめに Turing 株式会社のリサーチチームでインターンをしている東京工業大学 B4 横田研究室の藤井(@okoge_kaz)です。 大規模言語モデル(Large Language Model: LLM)への注目がGPT-4のリリース以降高まっていますが、LLMを作るための知見は十分に共有されているとは言い難いと個人的に感じています。 Turingでは、Visi... 続きを読む

サイバーエージェント、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供―

2023/05/17 このエントリーをはてなブックマークに追加 421 users Instapaper Pocket Tweet Facebook Share Evernote Clip サイバーエージェント chatgpt 日本語LLM 藤田晋

株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役:藤田晋、東証プライム市場:証券コード4751)は、最大68億パラメータの日本語LLM(Large Language Model、大規模言語モデル)を一般公開したことをお知らせいたします。 近年、OpenAI社が開発した「ChatGPT」※1 を始めとする生成AI・LLMは急速な進化を遂... 続きを読む

サイバーエージェント、独自の日本語LLM(大規模言語モデル)を開発 ―自然な日本語の文章生成を実現―

2023/05/11 このエントリーをはてなブックマークに追加 199 users Instapaper Pocket Tweet Facebook Share Evernote Clip 藤田晋 極予測TD 本社 サイバーエージェント 証券コード

株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役:藤田晋、東証プライム市場:証券コード4751)は、独自の日本語LLM(Large Language Model、大規模言語モデル)を開発したことをお知らせいたします。 本モデルはすでに130億パラメータまでの開発が完了しており、当社が提供する「極予測AI」「極予測TD」... 続きを読む

 
(1 - 3 / 3件)