はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ LLM

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 66件)

AIの新星ニューラルネットワーク「KAN」とは? LLMが“カンニング”して評価を盛ってた? など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

2024/05/05 このエントリーをはてなブックマークに追加 150 users Instapaper Pocket Tweet Facebook Share Evernote Clip seamless シームレス TechnoEdge KAN

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第45回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ 高精度なニューラ... 続きを読む

LLMプロダクト開発者がMac Studioを買ってローカルLLMを触るべき理由|erukiti

2024/04/24 このエントリーをはてなブックマークに追加 146 users Instapaper Pocket Tweet Facebook Share Evernote Clip erukiti ローカルLLM Mac Studio メモリ

もしあなたがLLMを使ったプロダクトを何かしら開発している、もしくは興味があるのなら、メモリを大量に積んだMac Studioの購入を検討すべきです。 結論LLMプロダクト開発において、今年はもはやローカルLLMを無視できない、してはいけない状況です。 LLMプロダクト開発をする会社の視点でいえば、是非とも80GB以上の十... 続きを読む

もし「GitHub Copilot」を現役弁護士が使ったら? - MNTSQ Techブログ

2024/04/19 このエントリーをはてなブックマークに追加 141 users Instapaper Pocket Tweet Facebook Share Evernote Clip GitHub Copilot MNTSQ Techブログ

こんにちは。GitHub Copilotを先日初めて触って、感銘を受けたMNTSQ代表の板谷です。MNTSQの代表をしておりますが、現役の弁護士でもあります。 なぜ私が、GitHub Copilotに感銘を受けたかというと、「プログラミングの LLM による進化」は、契約という言語をコーディングするためにもドンピシャで使えそうだと感じたか... 続きを読む

生成AIで小説を書くためのプロンプト5選

2024/04/15 このエントリーをはてなブックマークに追加 342 users Instapaper Pocket Tweet Facebook Share Evernote Clip 生成AI 小説 プロンプト 実地 遅ればせ

人類の皆さん、小説書いてますか? この記事について この記事に書いてあること この一ヶ月ほど、遅ればせながらLLMによる小説執筆の支援という試みを実地でやってみたので、その中で結構良かったなと思ったプロンプトを紹介する。 使用したモデルはClaude 3 Opus。 この記事で書かないこと 生成AI「で」小説を書くこと... 続きを読む

優秀と噂なCohere社のCommand R+でRAGチャットボットを簡単に構築して体験しよう! - Qiita

2024/04/14 このエントリーをはてなブックマークに追加 118 users Instapaper Pocket Tweet Facebook Share Evernote Clip Qiita Rag Command R+ チュートリアル 実装

1. はじめに Cohere社が最近リリースしたLLMのCommand R+がGPT4に迫る性能を発揮していたり、RAG利用での性能で話題となっています。 そのCommand R+でRAGを体験できるチャットアプリの実装がLightningAIにてチュートリアルが公開(CC-BY-4.0ライセンスとして)されています。 これを身近な環境で動かしてみたいと思います... 続きを読む

GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」

2024/04/08 このエントリーをはてなブックマークに追加 221 users Instapaper Pocket Tweet Facebook Share Evernote Clip オープンLLM Command R 衝撃 need PC内

カナダのAIスタートアップCohereは4月4日(現地時間)、ビジネス向けに最適化された最新の大規模言語モデル(LLM)「Command R+」を発表した。 高度なRAG技術を採用 Cohereは、AI業界に変革をもたらしたTransformerモデルを提唱した論文「Attention is All You Need」の共同執筆者として知られるトロント大学の研究者Aid... 続きを読む

LLMの現在 - Speaker Deck

2024/03/29 このエントリーをはてなブックマークに追加 881 users Instapaper Pocket Tweet Facebook Share Evernote Clip 状況

今のLLMを取り巻く状況について紹介します。 続きを読む

NTT、国産の生成AI「tsuzumi」サービス開始--「2027年に売上1000億円」と島田社長

2024/03/25 このエントリーをはてなブックマークに追加 192 users Instapaper Pocket Tweet Facebook Share Evernote Clip tsuzumi 生成AI NTT 島田社長 国産

日本電信電話(NTT)は3月25日、独自に開発した大規模言語モデル(LLM)「tsuzumi」の商用提供を企業向けに開始した。代表取締役社長を務める島田明氏は「2027年までに売上1000億円を目指す」と述べた。 tsuzumiは、NTTが2023年11月に発表した国産LLMだ。特徴の1つはモデルを大幅に軽量化した点で、パラメーター数は軽量... 続きを読む

ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)

2024/03/22 このエントリーをはてなブックマークに追加 346 users Instapaper Pocket Tweet Facebook Share Evernote Clip chatgpt Claude ライバル OpenAI 界隈

3月4日の公開以来、「Claudeやばくない?」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル(LLM)だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも... 続きを読む

米OpenAI「公表しないで……」 ブラックボックスであるLLMの中身を“盗む”攻撃 米Googleらが発表

2024/03/13 このエントリーをはてなブックマークに追加 185 users Instapaper Pocket Tweet Facebook Share Evernote Clip 米OpenAI 中身 攻撃 ブラックボックス 発表

このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Google DeepMindなどに所属する研究者らが発表した論文「Stealing Part of a Prod... 続きを読む

国産の日本語生成AIの無料デモ版が公開 ~「GPT-3.5 Turbo」に匹敵する性能を達成/東大初のELYZA社が700億パラメーターのLLM「ELYZA-japanese-Llama-2-70b」を開発

2024/03/12 このエントリーをはてなブックマークに追加 197 users Instapaper Pocket Tweet Facebook Share Evernote Clip 国産 GPT-3.5 Turbo 性能 開発

続きを読む

Dockerで構築する機械学習環境【2024年版】

2024/03/11 このエントリーをはてなブックマークに追加 192 users Instapaper Pocket Tweet Facebook Share Evernote Clip Docker 機械学習環境 karaage0703 特性 多数

Dockerを使った機械学習環境の構築方法 株式会社松尾研究所で働いているからあげ(@karaage0703)です。松尾研究所では、機械学習(ここでは、予測モデル、画像認識からLLMまで幅広く扱います)を使う多数のプロジェクトが走っています。プロジェクトの特性は多種多様なので、環境構築方法は様々なのですが、松尾研究所... 続きを読む

Google、オープンな生成AIモデル「Gemma」公開 商用利用OK、Geminiと同じ技術の軽量LLM

2024/02/21 このエントリーをはてなブックマークに追加 204 users Instapaper Pocket Tweet Facebook Share Evernote Clip GEMINI Gemma 生成AIモデル Google 技術

米Googleは、大規模言語モデル(LLM)「Gemma」を公開した。同社が開発するLLM「Gemini」に使ったのと同じ技術を活用して開発した軽量版LLMで、同社は「オープンなAIモデル」として位置付けている。商用利用も可能としている。 続きを読む

GPT-4にWebサイトを“自律的に”ハッキングさせる方法 AI自身が脆弱性を検出、成功率70%以上【研究紹介】

2024/02/21 このエントリーをはてなブックマークに追加 223 users Instapaper Pocket Tweet Facebook Share Evernote Clip GPT-4 検出 脆弱性 AI自身 Webサイト

米UIUC(イリノイ大学アーバナ・シャンペーン校)に所属する研究者らが発表した論文「LLM Agents can Autonomously Hack Websites」は、大規模言語モデル(LLM)を用いたAIエージェントに、自律的にWebサイトをハッキングさせる攻撃手法を提案した研究報告である。LLMエージェントがWebサイトに存在する脆弱性を事前に知... 続きを読む

書評:GitHub Copilot とのペアプロ TDD でつくるローグライク RPG - 若くない何かの悩み

2024/02/12 このエントリーをはてなブックマークに追加 200 users Instapaper Pocket Tweet Facebook Share Evernote Clip TDD ローグライク GitHub Copilot 書評 本題

本記事は「GitHub Copilot とのペアプロ TDD でつくるローグライク RPG」の書評です。題名にローグライクRPGとあるのでゲーム開発の本なのかなと思ってしまいますが、本題は仕様の端的な表現をもたないシステムを LLM を使って真っ当に開発する方法の解説だと思います。タイトルにローグライクRPGと書いていることでゲー... 続きを読む

社内用語集を気軽に質問できるSlackBotを作ってみた (RAGの応用アプリ) - ABEJA Tech Blog

2024/02/08 このエントリーをはてなブックマークに追加 116 users Instapaper Pocket Tweet Facebook Share Evernote Clip Rag Slackbot GitHub ABEJA 坂井

こんにちは!株式会社 ABEJA で ABEJA Platform 開発を行っている坂井(GitHub : @Yagami360)です。 LangChain を使用すれば、RAG [Retrieval Augment Generation] を使用した LLM アプリケーションを簡単に作成できるので便利ですよね。 今回 LangChain での RAG を使用して、LLM が学習に使用していない特定ドメイン... 続きを読む

Google、“現行最強”の生成AI発表 月2900円で利用可 チャットAIサービスはBard→Geminiに刷新

2024/02/08 このエントリーをはてなブックマークに追加 169 users Instapaper Pocket Tweet Facebook Share Evernote Clip Bard GEMINI 刷新 Gemini Advanced

米Googleは2月8日(現地時間)、「現行最強」をうたう生成AI「Gemini Advanced」を発表した。すでにサービスの提供を開始しており、月額2900円で利用可能。2カ月間の無料試用期間も用意する。 同社は従来、生成AIの頭脳部分となるLLM(大規模言語モデル)として「Gemini」ブランドを利用し、サービス名は「Bard」として... 続きを読む

東工大など、日本語に強い大規模言語モデル「Swallow」を無償で公開

2024/01/13 このエントリーをはてなブックマークに追加 209 users Instapaper Pocket Tweet Facebook Share Evernote Clip Swallow 両者 生成AI 無償 産総研

東京工業大学(東工大)と産業技術総合研究所(産総研)の両者は12月19日、現在公開されている中で、日本語に強い生成AIの基盤である「大規模言語モデル」(LLM)としては最大規模となる「Swallow」を、米・MetaのLLM「Llama 2」の日本語能力を拡張することで構築し、Webサイト「TokyoTech-LLM」にて一般公開したこと、またオ... 続きを読む

マイクロソフト、初心者向け生成AI学習教材「生成AIアプリケーションの開発を始めるために必要な全知識を学べる12講座」を無償公開

2024/01/08 このエントリーをはてなブックマークに追加 1293 users Instapaper Pocket Tweet Facebook Share Evernote Clip マイクロソフト 生成AIアプリケーション 無償公開 開発 内容

マイクロソフト、初心者向け生成AI学習教材「生成AIアプリケーションの開発を始めるために必要な全知識を学べる12講座」を無償公開 コースの内容には、大規模言語モデル(LLM)がどのように動くかを理解する。「生成 AI と大規模言語モデルの紹介」、ユースケースに適したAIモデルを選択できるようにする「様々なLLMの調... 続きを読む

年末年始にLLMの勉強はいかが? 東大松尾研、大規模言語モデルの講座資料を無料公開

2023/12/27 このエントリーをはてなブックマークに追加 143 users Instapaper Pocket Tweet Facebook Share Evernote Clip 東大松尾研 無償 講義資料 言語モデル 東京大学松尾研究室

東京大学松尾研究室は、大規模言語モデル(LLM)の講義資料を無償公開した。同研究室が9~10月に実施した「東京大学サマースクール 大規模言語モデル講座」で使用したもの。 東京大学松尾研究室は12月27日、大規模言語モデル(LLM)の講義資料を無償公開した。同研究室が9~10月に実施した「東京大学サマースクール 大... 続きを読む

Google、論文・レポート作成を生成AIが支援「NotebookLM」公開、Geminiを導入

2023/12/09 このエントリーをはてなブックマークに追加 106 users Instapaper Pocket Tweet Facebook Share Evernote Clip GEMINI NotebookLM 論文 生成AI 名称

米Googleは12月8日(現地時間)、Googleラボが初期テスターに提供していたAIノートブック「NotebookLM」(実験製品)を、米国で18歳以上が利用できるようにした。これは今年5月に開発者カンファレンスにおいて、「Project Tailwind」という名称で紹介されたツールであり、オンラインノートに大規模言語モデル(LLM)によ... 続きを読む

LLM時代の強化学習 - どこから見てもメンダコ

2023/11/24 このエントリーをはてなブックマークに追加 104 users Instapaper Pocket Tweet Facebook Share Evernote Clip メンダコ VLM LLM時代 強化学習 課題

強化学習におけるLLMの活用パターン調査 はじめに:実世界における強化学習の課題 LLM×強化学習 人間はゼロショット推論によりサンプル効率の良い学習ができる LLMによるゼロショット推論の例 さまざまなLLM活用パターン 1. 報酬モデルとしてのLLM LLMによる代理報酬モデル VLMによる外観ベース代理報酬モデル 外部知識... 続きを読む

【switch-c-2048】GoogleがついにGPT-4レベルのLLMをオープンソースで公開!概要〜使い方まで | WEEL

2023/11/25 このエントリーをはてなブックマークに追加 136 users Instapaper Pocket Tweet Facebook Share Evernote Clip パラメーター 藤崎 共同執筆 WEEL オープンソース化

メディア事業部リサーチャーのいつきとメディア事業部AIエバンジェリストの藤崎です。この記事は専門的な内容を含むため、AIスペシャリストとの共同執筆となっています。 今回ご紹介するのは、Googleがオープンソース化したMOEモデルの「switch-c-2048」について。 なんと、こちらのMOEモデルは、1.6兆個のパラメーター... 続きを読む

誰でもわかる強化学習

2023/11/24 このエントリーをはてなブックマークに追加 311 users Instapaper Pocket Tweet Facebook Share Evernote Clip 強化学習 DQN Deep Q-Network 手法 講義資料

本資料は,東京大学松尾研究室で開催された強化学習セミナーの講義資料をもとに,講演目的でより初学者向けに内容を調整したものです.特に強化学習で最も基本的かつ最重要手法であるQ学習や,それの深層強化学習版のDQN(Deep Q-Network)を中心に解説しています. 昨今,ChatGPT等の大規模言語モデル(LLM)の開発に強... 続きを読む

人類には早過ぎるLLMの話 - laiso

2023/11/22 このエントリーをはてなブックマークに追加 154 users Instapaper Pocket Tweet Facebook Share Evernote Clip laiso 人類

Sam Altman解任騒動は個人間の対立ではなく、組織構造の問題に注目すると感想が変わるなと思った。 www.nytimes.com この騒動についてはAIの安全性を重視する思想とOpenAIのビジネスの拡大を目指す戦略の衝突があるので、AIの安全性というトピックが重要になる。 僕は結構テクノロジー原理主義者みたいなところがあるの... 続きを読む

 
(1 - 25 / 66件)