タグ「事後学習」 - はてブログ

タグ事後学習

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 3 / 3件)

Reflection Llama-3.1 70B を試す｜ぬこぬこ

2024/09/06 12 users ぬこぬこ Reflection Thinking タグ

tl;drReflection Llama-3.1 70B がオープン LLM の中で世界最高性能を謳う Llama 3.1 70B を Reflection-Tuning を用いて事後学習 <output> / <thinking> / (reflection) などのタグを用いて推論 Ollama を使って推論させてみる Reflection Llama-3.1 70B とはHyperWrite の CEO Matt Shumer 氏の公開した Llama 3.1 ベ... 続きを読む

ファッションドメインにおけるLLMの未知の知識獲得可能性 - DROBEプロダクト開発ブログ

2024/05/23 6 users LLM ハルシネーション定量未知考察

概要背景・目的関連研究事後学習を通じた知識の獲得未知の知識をどう定義するか実験ある情報がLLMにとって新知識であるかの確認 QAデータセット実験の設定結果自作したQAデータセットでの結果相対的な汎化性能（定量）相対的な汎化性能（定性）考察未知の知識の定義の難しさハルシネーションの対策の難し... 続きを読む

東大松尾研、日英対応の大規模言語モデル公開　100億パラメータ、精度は「国内オープンソース最高水準」

2023/08/18 27 users 東大松尾研水準精度日英対応言語モデル公開

東大松尾研が、日英の2カ国語に対応した100億パラメータサイズの大規模言語モデル（LLM）を、非商用のオープンソースで公開した。東京大学院工学系研究科・松尾研究室（主宰：松尾豊教授）は8月18日、日英の2カ国語に対応した100億パラメータサイズの大規模言語モデル（LLM）「Weblab-10B」を、事前学習と事後学習（フ... 続きを読む

(1 - 3 / 3件)