はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 日本語言語モデル

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 4 / 4件)
 

36億パラメータの日本語言語モデルを公開しました

2023/08/14 このエントリーをはてなブックマークに追加 263 users Instapaper Pocket Tweet Facebook Share Evernote Clip 36億パラメータ

こんにちは。 LINEのNLP Foundation Devチームの清野舜と高瀬翔とoverlastです。 LINEでは2020年11月から日本語に特化した大規模言語モデル「HyperCLOVA」の構築と応用に関わる研究開発に取り組んできましたが、この「HyperCLOVA」と並行するかたちで複数の大規模言語モデルの研究開発プロジェクトが進行しています。 今... 続きを読む

日本語言語モデル「Japanese StableLM Alpha」をリリースしました — Stability AI Japan

2023/08/10 このエントリーをはてなブックマークに追加 397 users Instapaper Pocket Tweet Facebook Share Evernote Clip Japanese StableLM Alpha 性能評価

Stability AI Japan は70億パラメータの日本語向け汎用言語モデル「Japanese StableLM Base Alpha 7B」及び、指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を一般公開しました。このモデルはベンチマークスイート「lm-evaluation-harness」による複数の日本語タスクを用いた性能評価において、一般公開さ... 続きを読む

自宅PCで「rinna」の日本語言語モデルを試用、メモリ32GBあればCPUだけでも動くぞ!【イニシャルB】

2023/06/04 このエントリーをはてなブックマークに追加 269 users Instapaper Pocket Tweet Facebook Share Evernote Clip rinna 試用 イニシャルB 自宅PC

続きを読む

CyberAgentの日本語言語モデルを試してみる - きしだのHatena

2023/05/17 このエントリーをはてなブックマークに追加 92 users Instapaper Pocket Tweet Facebook Share Evernote Clip CyberAgent サイバーエージェント 日本語LLM

CyberAgentが日本語LLMを公開していたので、とりあえず動かしてみました。 サイバーエージェント、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供― | 株式会社サイバーエージェント モデルは次のように6サイズ提供されています。 ※ Rinna社も同時... 続きを読む

 
(1 - 4 / 4件)