タグ「Low-Rank」 - はてブログ

タグ Low-Rank

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 3 / 3件)

大規模言語モデル(LLM)をLoRAで強化する際に役立つ情報を研究者が公開

2023/11/23 8 users LLM LoRa https 大規模言語モデル言語モデル

LoRAは画像生成モデルや大規模言語モデル(LLM)に追加の情報を学習させてモデルを微調整できる仕組みです。LoRAを用いてLLMを強化する際に役立つ情報をAI研究者のセバスチャン・ラシュカ氏が解説しています。 Practical Tips for Finetuning LLMs Using LoRA (Low-Rank Adaptation) https://magazine.sebastianraschka.co... 続きを読む

LoRA のもう一つの大きなメリット、GPUメモリ共有しつつ別のタスク処理モデルへ即時に切り替える方法 - A Day in the Life

2023/05/31 13 users rinna HuggingFace LoRa GPUメモリ

低ランク行列を追加することで、大元のモデルを維持しつつ少ないコストで学習できる LoRA(Low-Rank Adaptation of Large Language Models)。先日、日本語でも大規模パラメータモデル cyberagent/open-calm-7b や rinna/japanese-gpt-neox-3.6b 等々がリリースされたり、HuggingFaceからはtransformersでLoRAを簡単に実現... 続きを読む

[輪講資料] LoRA: Low-Rank Adaptation of Large Language Models

2023/04/18 62 users LoRa Fine-tuning パラメータ変遷論文

パラメータを固定した事前学習済みモデルに対して、ごく少数のパラメータからなる低ランク行列を導入・学習することで、モデル全体のfine-tuningと同等の性能を発揮できる手法であるLoRAと、その論文について解説した資料です。深層学習を用いた自然言語処理の歴史的な変遷と周辺技術から、LoRAが必要とされるに至った... 続きを読む

(1 - 3 / 3件)

タグ Low-Rank

大規模言語モデル(LLM)をLoRAで強化する際に役立つ情報を研究者が公開

LoRA のもう一つの大きなメリット、GPUメモリ共有しつつ別のタスク処理モデルへ即時に切り替える方法 - A Day in the Life

[輪講資料] LoRA: Low-Rank Adaptation of Large Language Models

本日の新着エントリー

本日の人気エントリー

1年前の人気エントリー

先週のランキング

人気エントリーにあるタグ

最近の注目エントリー

最近の注目タグ

タグ Low-Rank

大規模言語モデル(LLM)をLoRAで強化する際に役立つ情報を研究者が公開

LoRA のもう一つの大きなメリット、GPUメモリ共有しつつ別のタスク処理モデルへ即時に切り替える方法 - A Day in the Life

[輪講資料] LoRA: Low-Rank Adaptation of Large Language Models

本日の新着エントリー

本日の人気エントリー

1年前の人気エントリー

先週のランキング

人気エントリーにあるタグ

最近の注目エントリー

最近の注目タグ

[輪講資料] LoRA: Low-Rank Adaptation of Large Language Models