はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 言語モデル開発

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 4 / 4件)
 

大規模言語モデル開発のための日本語 Instruction データセット作成の取り組み

2024/03/30 このエントリーをはてなブックマークに追加 6 users Instapaper Pocket Tweet Facebook Share Evernote Clip 日本語

日本語LLMチューニングデータ最前線 - W&B ミートアップ #12 in 東京 での発表資料になります。 https://wandb.connpass.com/event/313036/ 続きを読む

プリファード、大規模言語モデル開発 24年商用化目指す - 日本経済新聞

2023/06/16 このエントリーをはてなブックマークに追加 21 users Instapaper Pocket Tweet Facebook Share Evernote Clip プリファード 日本経済新聞

プリファード・ネットワークス(PFN、東京・千代田)は16日、生成人工知能(AI)の基盤となる大規模言語モデル(LLM)の開発に着手したと発表した。西川徹最高経営責任者(CEO)が同日開かれたICT(情報通信技術)分野の総合展示会「Interop Tokyo 2023」で表明した。米テック企業の汎用的なLLMとは一線を画し、より専門... 続きを読む

「富岳」で大規模言語モデル開発へ 分散並列学習法を研究 成果はGitHubなどで公開予定

2023/05/23 このエントリーをはてなブックマークに追加 7 users Instapaper Pocket Tweet Facebook Share Evernote Clip 富士通 全体総括 計算資源 理化学研究所 収集

理化学研究所と富士通、東京工業大学、東北大学は5月22日、スーパーコンピュータ「富岳」で大規模言語モデルの分散並列学習手法の研究を始めると発表した。 大量のデータを効率的に処理する計算資源を確保するために富岳を活用する。研究は東京工業大学が全体総括を担当し、東北大学が学習用データの収集、理化学研究所... 続きを読む

LINEがOpenAI「GPT」・Google「T5」同様の超巨大汎用言語モデルをNAVERと共同開発、世界初の日本語特化 | TechCrunch Japan

2020/11/25 このエントリーをはてなブックマークに追加 11 users Instapaper Pocket Tweet Facebook Share Evernote Clip 汎用言語モデル 言語表現 言語処理 韓国NAVER 処理

LINEは11月25日、韓国NAVERと共同で、日本語に特化した超巨大言語モデル開発と、その処理に必要なインフラ構築についての取り組みを発表した。超巨大言語モデル(膨大なデータから生成された汎用言語モデル)は、AIによる、より自然な言語処理・言語表現を可能にするもので、日本語に特化した超巨大言語モデル開発は、世... 続きを読む

 
(1 - 4 / 4件)