タグ「RWKV」 - はてブログ

タグ RWKV

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 4 / 4件)

RWKVについて解説

2023/08/17 14 users Transformer RNN アーキテクチャ解説手法

本記事では、RWKVとよばれるモデルのアーキテクチャについて詳しく説明します。はじめに自然言語処理の分野において、Transformer[1]の登場以前に一般的に使用されてきたRNN[2]はいくつかの課題を抱えており、その課題を克服する新たな手法として、RNNとは完全に異なるアプローチを取るTransformerが登場しました。し... 続きを読む

従来の大規模言語モデルの制約だった「入力量の限界」を取り払った「RWKV」は一体どんな言語モデルなのか？

2023/07/09 16 users Bard 制約 chatgpt 従来限界

ChatGPTやBardなど、2023年7月時点で商用利用されている大規模言語モデルはほとんど全てがトランスフォーマーというアーキテクチャを利用したモデルですが、トランスフォーマー型のモデルは入力の長さの2乗に比例して計算量が増加するため、入力サイズが制限されてしまう問題があります。そうした問題に応えて、大きいデ... 続きを読む

"RWKV_CUDA_ON"を1に設定してRWKVを高速化する - Qiita

2023/04/08 11 users Qiita LLM ドキュメント環境変数性能

ローカル環境でも高速で動作するLLMとして話題のRWKVですが、ドキュメントを見ていると環境変数の"RWKV_CUDA_ON"を1に設定することでより高速で動くということなので試してみました。設定を変更するときに１箇所エラーで躓いたところがあったのでそちらも記録しておきます。 RWKVとは RWKVとはTransformerレベルの性能... 続きを読む

Google Colab で RWKV を試す｜npaka｜note

2023/03/27 10 users RNN VRAM npaka｜note プレミア節約

「Google Colab」で「RWKV」を試したので、まとめました。【注意】「RWKV」のチャットデモを実行するには、「Google Colab Pro/Pro+」の「プレミア」が必要です。 1. RWKV「RWKV」は、TransformerレベルのLLM性能を備えたRNNです。高性能、高速推論、VRAMの節約、高速学習、無限の文脈長、自由な埋め込みを実現していま... 続きを読む

(1 - 4 / 4件)

タグ RWKV

RWKVについて解説

従来の大規模言語モデルの制約だった「入力量の限界」を取り払った「RWKV」は一体どんな言語モデルなのか？

"RWKV_CUDA_ON"を1に設定してRWKVを高速化する - Qiita

Google Colab で RWKV を試す｜npaka｜note

本日の新着エントリー

本日の人気エントリー

1年前の人気エントリー

先週のランキング

人気エントリーにあるタグ

最近の注目エントリー

最近の注目タグ