タグ DeepSeek R
人気順 5 users 50 users 100 users 500 users 1000 usersrinnaのDeepSeek R1蒸留モデルがすごい - きしだのHatena
DeepSeek R1が話題になってだいぶたちますが、日本語対応モデルも出てきてますね。 そして2/15にrinnaからDeepSeek R1の蒸留モデルが出ていて、これがかなりいい感じなのでびっくりしてます。驚き屋してます。 DeepSeek R1では、こっそりと回答方針を決めるフェーズがあるのだけど、そこがなかなか筋がいい。 というか、... 続きを読む
DeepSeekのジェイルブレークにセキュリティー企業が成功、「ChatGPTより脆弱」
中国DeepSeek(ディープシーク)が開発したLLM(大規模言語モデル)の「DeepSeek R1」に注目が集まっている。 費用対効果に優れているとして話題になっているが、セキュリティー企業などはそのセキュリティーを厳しく評価し始めた。米OpenAI(オープンAI)の「ChatGPT」が登場したときと同じような状況といえるだろう。 ... 続きを読む
DeepSeek R1が何故OSSとして発表されたか - サッとぶ
タイトルについてだが、これは「R1は米国の輸出規制が無ければ開発しえなかった。つまり輸出規制は逆効果だ!」という事をアメリカに(そして全世界に)喧伝する為だったのでは?という考察。 なぜなら米国の輸出規制のおかげでdeepseekは安くて性能の低いチップを使うしかなく、結果的に中間命令セットであるPTXを使用... 続きを読む
話題の中華LLM「DeepSeek R1」の日本語追加学習モデル サイバーエージェントが無料公開
サイバーエージェントは1月27日、大規模言語モデル(LLM)「DeepSeek-R1」を使った新たなAIモデルを無料公開した。「DeepSeek-R1-Distill-Qwen-14B/32B」をベースに、日本語を追加学習させたLLM「DeepSeek-R1-Distill-Qwen-14B/32B-Japanese」をHugging Face上で公開。ライセンスは、MITライセンスで商用利用なども可能だ。 続きを読む
OpenAI o1相当の推論モデル「DeepSeek R1」を中国AI企業が商用利用や改変が可能なMITライセンスでリリース
中国のAI企業であるDeepSeekが、第1世代の推論モデルである「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスの下でオープンソースとして公開しました。DeepSeekは特定のAIベンチマークで、OpenAI o1と同等の性能を発揮すると主張しています。 DeepSeek-R1/DeepSeek_R1.pdf at main · deepseek-ai/DeepSeek-R1 · Gi... 続きを読む