タグ「LLM」 - はてブログ

タグ LLM

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 25 / 393件)

arXivから2024年のLLMトレンド追ってみた

2024/12/18 11 users arXiv 論文 Advent Calendar 清水本記事

はじめにこんにちは、株式会社松尾研究所シニアデータサイエンティストの清水です。本記事は、松尾研究所 Advent Calendar 2024の記事です。 2024年も残り僅かとなりましたが、今年もLLM(Large Language Model)で大賑わいの1年となりました。そこでこの記事では今年1年の中でarXivに投稿されたLLMに関する論文を分析し... 続きを読む

Microsoftの検索エンジンBingがTransformerからLLMとSLMの組み合わせに移行＆TensorRT-LLMの統合を発表

2024/12/18 12 users Transformer SLM TensorRT-LLM

Microsoftは検索エンジンのBingで、これまでGoogleが開発した機械学習モデルの「Transformer」を採用してきました。しかし、Transformerに限界が訪れたとして、大規模言語モデル(LLM)と小規模言語モデル(SLM)の組み合わせに移行すると発表しています。さらに、ワークフローにNVIDIAが開発している「TensorRT-LLM」を統合... 続きを読む

クレジットカードの不正検知システムを3日で設計し、3週間で本番リリースした話 - LLMで加速するソフトウェア開発 - LayerX エンジニアブログ

2024/12/18 187 users LLM活用ドキュメント要件 Design Doc 執筆

はじめに背景：クレジットカード不正検知システムとは 3日でDesign Doc 2本、ADR 5本を執筆 3週間で開発し、本番環境にリリース LLM活用による効率化のポイント目的・要件の整理要件を満たす技術的オプションの洗い出し・技術調査 PoC実装ドキュメントの執筆・技術選定本実装学びおわりにはじめに新規プロダク... 続きを読む

ついにAI学習のためのデータが枯渇へ、データセットが不足しているAI企業は大規模で汎用的なLLMから小規模で専門性の高いモデルへの移行を余儀なくされる可能性大

2024/12/16 15 users Nature 学術雑誌 AIモデル現状学習資料

AIモデルの開発には学習資料となるデータセットが必要不可欠ですが、すでに大規模なモデルはアクセスできるデータのほとんどを食い尽くしており、2028年までにデータを使い果たしてしまう可能性が指摘されています。AIとデータセットの現状について、学術雑誌のNatureがまとめています。 The AI revolution is running o... 続きを読む

生成AIサービスに個人情報をアップロードしたくない!！　Windowsローカルで大規模言語モデル（LLM）を利用する

2024/12/13 15 users Microsoft Copilot 手元生成AIサービス

生成AIサービスに個人情報をアップロードしたくない!！　Windowsローカルで大規模言語モデル（LLM）を利用する：Tech TIPS ChatGPTやMicrosoft Copilotなどの生成AIサービスが便利なのは分かるが、いざ使おうと思うと「情報漏えいなどが心配」と感じていないだろうか。そんな心配がある場合、手元のWindows 10／11上でLL... 続きを読む

「Agentless」という最新手法。LLMの新しい使い方。

2024/12/10 136 users エージェントレス Rag 生成AIエージェント手法最新手法

本記事では、最近流行りの「生成AIエージェント」に替わる「Agentless」（エージェントレス）という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。この記事は何この記事は、ソフトウェア開発自体を自動化する際の新しい手法「Agentle... 続きを読む

LLMの要約結果を評価する

2024/12/10 16 users マルチエージェントシステム躍進 Magic Moment

この記事は Magic Moment Advent Calendar 2024 7 日目の記事です。 Magic Moment の @tdoi です。 2024年1月にジョインし、Magic Moment の製品開発を担当しております。学生時代に、マルチエージェントシステムに関する研究に従事していました。昨今、LLM の躍進によって、エージェントという言葉を見聞きすることが... 続きを読む

「Xのアルゴリズム」は数日であなたの政治的意見を変えられる――米スタンフォード大が1000人以上で検証

2024/12/08 657 users アルゴリズム米スタンフォード大検証あなたフィード

研究チームは、大規模言語モデル（LLM）を活用し、政治的に分極化をもたらす可能性のあるコンテンツへの影響を調べるため、リアルタイムでXのフィードを再ランク付けするアプローチを開発し、ユーザーへの影響を調査した。実験では、Xのユーザー1256人の協力を得て10日間実施。ブラウザ拡張機能を使用してフィードをリ... 続きを読む

LLMを悩ませる"Excel文書"をうまく扱う方法

2024/12/08 97 users Rag シロクマチャットボット Excel文書ドキュメント

はじめに株式会社ファースト・オートメーションCTOの田中(しろくま)です！弊社では製造業向けのRAGを使ったチャットボットの開発を行っていますが、 RAGで読み取りづらいなと感じているドキュメントが"Excel文書"です。 LLMを悩ませる"Excel文書"とはここで"Excel文書"と呼んでいるドキュメントは、「構造化されたテ... 続きを読む

OpenAIとApollo Research、「o1」は自分の目的のために嘘をつくと報告

2024/12/06 14 users OpenAI 推論タスク米OpenAI 連鎖目的

米OpenAIとAI安全性の研究組織である米Apollo Researchは12月5日（現地時間）、OpenAIが同日公式版をリリースしたLLMの「o1」についての考察を発表した。いずれも、o1に関して幾つかの懸念事項を指摘している。 o1は、OpenAIが9月に発表したLLM。回答を生成する前に思考の連鎖を生み出すことで、複雑な推論タスクを実行... 続きを読む

第841回　ローカルLLMの実行ツール「Ollama」のGUIフロントエンド、Alpacaを使用して生成AIを使用する | gihyo.jp

2024/12/04 11 users Alpaca Ollama ローカルLLM gihyo.jp

Ubuntu Weekly Recipe 第841回ローカルLLMの実行ツール「Ollama」のGUIフロントエンド⁠⁠、Alpacaを使用して生成AIを使用する今回は、ローカルLLMの実行ツール「Ollama」のフロントエンド、Alpacaを紹介します。 Alpacaとは Ollamaに関しては第825回で紹介しました。そこではフロントエンドとして、Open WebUIを使いまし... 続きを読む

LLMの思考の性能をモンテカルロ木探索で引き上げる

2024/12/04 12 users 須藤英寿タスクモンテカルロ木探索数学チャット

導入こんにちは、株式会社ナレッジセンスの須藤英寿です。普段はエンジニアとして、LLMを使用したチャットのサービスを提供しております。今回は、推論ステップをモンテカルロ木探索を用いて導き出し、複雑なタスク(例えば、数学の問題を解くなど)での性能を大幅に引き上げる手法、「HiAR-ICL」について解説します。 ... 続きを読む

突撃！隣のキーボード！〜 2024年冬ニーリー Ver. 〜 - Nealle Developer's Blog

2024/12/03 22 users Nealle Developer 突撃キーボードニーリー

こんにちは！ニーリーアドベントカレンダー2024 3日目担当のSREチームの宮後(@miya10kei)です。最近、LLMと格闘する日々を送っています🤼‍♀️ 企業テックブログで散々こすられた企画「突撃！隣のキーボード！」ですが、ニーリーもテックブログをはじめたのにまだこすってないではないか😤、、、ということに気づいたので今... 続きを読む

生成AIは「意味」を理解しているのか？「ノリ」で喋れるLLMに、決定的に欠けているものとは | レバテックラボ（レバテックLAB）

2024/12/03 72 users レバテックラボレバテックLAB 谷口生成AI 工学

生成AIは「意味」を理解しているのか？「ノリ」で喋れるLLMに、決定的に欠けているものとは 2024年12月3日京都大学大学院情報学研究科教授／立命館大学総合科学技術研究機構　客員教授谷口忠大 1978年生まれ。京都大学工学研究科博士課程修了、博士（工学）。専門は人工知能、創発システム、認知発達ロボティクス、コ... 続きを読む

マルチモーダルLLMで複雑な画像を攻略：AOAIでGPT-4oをFine-tuning - Insight Edge Tech Blog

2024/12/02 13 users マルチモーダルLLM Fine-tuning 藤村昨今実務

はじめに Insight EdgeのLLM Engineerの藤村です。昨今、企業のDX推進に伴い、社内に蓄積された大量の画像データや文書の効率的な活用が求められています。弊社では、実務でLLMを活用する際、画像や表形式、複雑な図を含むドキュメントの理解が大きな課題となっています。この課題は多くの企業でも同様に直面していると... 続きを読む

2.5兆トークンを学習したOSSのコード生成LLM「OpenCoder」公開　プロジェクトが明す、コードLLM構築に重要な3要素とは

2024/12/01 13 users OSS プロジェクト再現３要素性能

OpenCoderプロジェクトは2024年11月8日（米国時間）、オープンソースソフトウェア（OSS）のLLM（大規模言語モデル）、「OpenCoder」を公開した。同プロジェクトは以下のように説明している。 OpenCoderは、トップクラスのコード生成LLMの性能に匹敵する、オープンで再現可能なコードLLMファミリーだ。本プロジェクトでは... 続きを読む

日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました｜Kotaro.Kinoshita

2024/11/26 1327 users YomiToku OCR Rag メインターゲット記号

はじめに最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。しかし、その多くは日本語をメインターゲットに開発されているわけではありません。日本語文書は、英数字に加えて、ひらがな、漢字、記号など数千種類の文字を識... 続きを読む

日本語のAIで使う大規模言語モデル性能を評価する「オープン日本語LLMリーダーボード」公開

2024/11/26 15 users 日本語公開 LLM-jp NLP タスク

16種類以上のNLP(自然言語処理)タスクを用いて日本語の大規模言語モデル(LLM)の性能評価と分析を行う「オープン日本語LLMリーダーボード」が公開されました。構築には国立情報学研究所をはじめとする日本語LLMの研究開発を行う組織横断プロジェクト「LLM-jp」が携わっています。 Open Japanese LLM Leaderboard - a Hugg... 続きを読む

OpenAIの蒸留機能(Model Distillation)を使って運用中のLLMのコストを削減する取り組み

2024/11/19 11 users OpenAI コスト運用中

私たちは以前にもGPT-4o-miniをファインチューニングして運用しているというお話をシェアして大きな反響いただきました。上の記事では、GPT-4oの出力を人手で修正（アノテーション）して、GPT-4-miniをファインチューニングする運用をご紹介していますが、蒸留はGPT-4oの出力をそのまま使用するのが大きな違いです。ま... 続きを読む

MicrosoftのGraphRAG+Neo4jで簡単にKnowledge Graphを可視化する - Taste of Tech Topics

2024/11/19 26 users Knowledge Graph Microsoft 可視化

こんにちは。データサイエンティストチームYAMALEXのSsk1029Takashiです。 LLMが広く使用されるようになってから、RAGに関する研究も増加し、RAGを拡張する手法の研究も多く出ました。その中でもテキストをグラフデータとして扱いRAGの元データとする手法をGraphRAGと言います。今回はその中の一つであるMicrosoftが提... 続きを読む

LLMの概念空間の構造解明：脳のような機能別「領域」仮説　MITの研究チームが発表 | Ledge.ai

2024/11/16 142 users Ledge.ai 領域構造解明研究チーム発表

サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。続きを読む

マルチモーダル / AI Agent / LLMOps 3つの技術トレンドで理解するLLMの今後の展望

2024/11/14 24 users agent マルチモーダル登壇見解予測

最近登壇で使っていたLLM関連技術の今後について触れた50ページほどの資料を公開します。 (予測や展望は個人の見解を多分に含む点をご容赦ください。) 細かい技術説明というよりみんな気になるAgent、LLMOps周りの実際に立ち向かって死にかけた経験を赤裸々に書いた感じです。取り組む前にこの屍を… 続きを読む

AIへの「ビジュアルプロンプトインジェクション」攻撃とは何か？

2024/11/14 17 users 攻撃プロンプトインジェクションチャットボットAI

大規模言語モデル(LLM)のセキュリティを研究するスタートアップ・Lakeraのエンジニアであるダニエル・ティンブレル氏が、画像認識も可能なチャットボットAIに対する「ビジュアルプロンプトインジェクション」攻撃について解説しています。 The Beginner's Guide to Visual Prompt Injections: Invisibility Cloaks, Cann... 続きを読む

オープンソースのコーディング支援AI「Qwen2.5-Coder」シリーズの性能はGPT-4oに匹敵、64GBのRAM＆M2搭載MacBook Proでもローカル実行可能

2024/11/14 15 users 匹敵 GPT-4o コーディング支援AI ローカル実行性能

中国・Alibabaグループが開発する大規模言語モデル(LLM)「Qwen」の研究チームが、コード生成や補完、数学の推論タスクに特化したLLM「Qwen2.5-Coder」の新モデルを2024年11月12日にリリースしました。Qwen2.5-Coderのコーディング機能はGPT-4oに匹敵し、パラメータ数も最大320億で、M2搭載MacBook Pro上でも実行できたこ... 続きを読む

25グラムの「AIレコーダー」が“仕事”を激変させる？　サッと録音→GPT-4oですぐ要約　話題のガジェットを使ってみた

2024/11/13 18 users 要約 GPT-4o AIレコーダーガジェット録音

2024年12月、ウェアラブル型の“AIデバイス”が日本に上陸する。生成AIとボイスレコーダーを組み合わせた米Nicebuildの「PLAUD NotePin」（プラウドノートピン）だ。本体価格は2万8600円。腕時計やピンバッジのように身に着けて会話を録音し、米OpenAIの大規模言語モデル（LLM）「GPT-4o」と連携して文字起こしや要約がで... 続きを読む