タグ「LLM」 - はてブログ

タグ LLM

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 25 / 518件)

arXivから2024年のLLMトレンド追ってみた

2024/12/18 11 users arXiv 論文 Advent Calendar 清水本記事

はじめにこんにちは、株式会社松尾研究所シニアデータサイエンティストの清水です。本記事は、松尾研究所 Advent Calendar 2024の記事です。 2024年も残り僅かとなりましたが、今年もLLM(Large Language Model)で大賑わいの1年となりました。そこでこの記事では今年1年の中でarXivに投稿されたLLMに関する論文を分析し... 続きを読む

AppleがNVIDIAとの共同研究で大規模言語モデルのパフォーマンス高速化の成果を発表

2024/12/19 6 users NVIDIA Apple 成果言語モデル共同研究

Appleは、NVIDIAとの共同研究による大規模言語モデル(LLM)の推論処理高速化についての研究成果を2024年12月18日に発表しました。Appleが独自に開発した「ReDrafter」技術をNVIDIAのGPU向け推論フレームワーク「TensorRT-LLM」に統合することで、処理速度を最大2.7倍に向上させることに成功し、消費電力とGPU使用量の削減... 続きを読む

Microsoftの検索エンジンBingがTransformerからLLMとSLMの組み合わせに移行＆TensorRT-LLMの統合を発表

2024/12/18 12 users Transformer SLM TensorRT-LLM

Microsoftは検索エンジンのBingで、これまでGoogleが開発した機械学習モデルの「Transformer」を採用してきました。しかし、Transformerに限界が訪れたとして、大規模言語モデル(LLM)と小規模言語モデル(SLM)の組み合わせに移行すると発表しています。さらに、ワークフローにNVIDIAが開発している「TensorRT-LLM」を統合... 続きを読む

クレジットカードの不正検知システムを3日で設計し、3週間で本番リリースした話 - LLMで加速するソフトウェア開発 - LayerX エンジニアブログ

2024/12/18 187 users LLM活用ドキュメント要件 Design Doc 執筆

はじめに背景：クレジットカード不正検知システムとは 3日でDesign Doc 2本、ADR 5本を執筆 3週間で開発し、本番環境にリリース LLM活用による効率化のポイント目的・要件の整理要件を満たす技術的オプションの洗い出し・技術調査 PoC実装ドキュメントの執筆・技術選定本実装学びおわりにはじめに新規プロダク... 続きを読む

ついにAI学習のためのデータが枯渇へ、データセットが不足しているAI企業は大規模で汎用的なLLMから小規模で専門性の高いモデルへの移行を余儀なくされる可能性大

2024/12/16 15 users Nature 学術雑誌 AIモデル現状学習資料

AIモデルの開発には学習資料となるデータセットが必要不可欠ですが、すでに大規模なモデルはアクセスできるデータのほとんどを食い尽くしており、2028年までにデータを使い果たしてしまう可能性が指摘されています。AIとデータセットの現状について、学術雑誌のNatureがまとめています。 The AI revolution is running o... 続きを読む

LLMを味方につけた文章執筆術 - 執筆から校正までの実践的アプローチ

2024/12/15 7 users Claude Qiita chatgpt 校正発展途上

この記事は、技術同人誌/技術を取り巻く様々な執筆 - Qiita Advent Calendar 2024 - Qiitaの16日目です。 ChatGPTやClaudeなど（以下、LLMと呼ぶ）を使って技術文章を書くというのは、まだまだ発展途上の分野です。「LLMに丸投げすれば楽ができる」という単純な話ではありませんし、逆にLLMを全く使わないのももったいな... 続きを読む

LLMには"Super Weights"があるという話と、現実のヒトの脳との関連性を考えてみる - 渋谷駅前で働くデータサイエンティストのブログ

2024/12/13 8 users Twitter 要約備忘録的論文興味深い現象

X (Twitter)を眺めていたら、面白そうな論文が流れてきました。それがこちらです。実際に流れてきたのはこちらの紹介記事なんですが、その要約を読んだ限りでもなかなかに興味深い現象であるように思われます。ということで、何番煎じかもはや分かりませんがこのブログでも備忘録的に取り上げてみようと思います。が、... 続きを読む

生成AIサービスに個人情報をアップロードしたくない!！　Windowsローカルで大規模言語モデル（LLM）を利用する

2024/12/13 15 users Microsoft Copilot 手元生成AIサービス

生成AIサービスに個人情報をアップロードしたくない!！　Windowsローカルで大規模言語モデル（LLM）を利用する：Tech TIPS ChatGPTやMicrosoft Copilotなどの生成AIサービスが便利なのは分かるが、いざ使おうと思うと「情報漏えいなどが心配」と感じていないだろうか。そんな心配がある場合、手元のWindows 10／11上でLL... 続きを読む

ガードレールによるLLMの安全性担保【開発者と読み解くAIの世界】

2024/12/12 5 users ガードレール開発者世界

「Agentless」という最新手法。LLMの新しい使い方。

2024/12/10 136 users エージェントレス Rag 生成AIエージェント手法最新手法

本記事では、最近流行りの「生成AIエージェント」に替わる「Agentless」（エージェントレス）という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。この記事は何この記事は、ソフトウェア開発自体を自動化する際の新しい手法「Agentle... 続きを読む

LLMの要約結果を評価する

2024/12/10 16 users マルチエージェントシステム躍進 Magic Moment

この記事は Magic Moment Advent Calendar 2024 7 日目の記事です。 Magic Moment の @tdoi です。 2024年1月にジョインし、Magic Moment の製品開発を担当しております。学生時代に、マルチエージェントシステムに関する研究に従事していました。昨今、LLM の躍進によって、エージェントという言葉を見聞きすることが... 続きを読む

UbieにおけるLLMを活用した不具合分析とテスト戦略立案プロセス

2024/12/09 9 users Ubie QAエンジニアスクラムマスターテスト戦略アプリ

こんにちは、UbieでQAエンジニアをしている ackey です。今年の10月からアプリチームのスクラムマスターとQAエンジニアを兼務していましたが、12月からアプリのテスト戦略&推進を進めるため、QAエンジニアに専念しています。本記事では、LLMを活用した不具合分析とそれに基づくテスト戦略の立案プロセスについて紹介し... 続きを読む

LLMと数理最適化を組み合わせる

2024/12/09 7 users Ubie 生成AI Advent Calendar 進化分野

本エントリは Ubie 生成AI Advent Calendar 2024 の9日目の記事です。LLMの進化が目覚ましいですが、現状ではLLM単体では対応が難しい課題も多く存在します。そこで重要になるのが、LLMと他のツールとの連携です。本記事では、LLMで不得意な分野を埋めるツールの一つとして数理最適化との連携方法について、自分の試し... 続きを読む

「Xのアルゴリズム」は数日であなたの政治的意見を変えられる――米スタンフォード大が1000人以上で検証

2024/12/08 657 users アルゴリズム米スタンフォード大検証あなたフィード

研究チームは、大規模言語モデル（LLM）を活用し、政治的に分極化をもたらす可能性のあるコンテンツへの影響を調べるため、リアルタイムでXのフィードを再ランク付けするアプローチを開発し、ユーザーへの影響を調査した。実験では、Xのユーザー1256人の協力を得て10日間実施。ブラウザ拡張機能を使用してフィードをリ... 続きを読む

LLMを悩ませる"Excel文書"をうまく扱う方法

2024/12/08 97 users Rag シロクマチャットボット Excel文書ドキュメント

はじめに株式会社ファースト・オートメーションCTOの田中(しろくま)です！弊社では製造業向けのRAGを使ったチャットボットの開発を行っていますが、 RAGで読み取りづらいなと感じているドキュメントが"Excel文書"です。 LLMを悩ませる"Excel文書"とはここで"Excel文書"と呼んでいるドキュメントは、「構造化されたテ... 続きを読む

OpenAIとApollo Research、「o1」は自分の目的のために嘘をつくと報告

2024/12/06 14 users OpenAI 推論タスク米OpenAI 連鎖目的

米OpenAIとAI安全性の研究組織である米Apollo Researchは12月5日（現地時間）、OpenAIが同日公式版をリリースしたLLMの「o1」についての考察を発表した。いずれも、o1に関して幾つかの懸念事項を指摘している。 o1は、OpenAIが9月に発表したLLM。回答を生成する前に思考の連鎖を生み出すことで、複雑な推論タスクを実行... 続きを読む

第841回　ローカルLLMの実行ツール「Ollama」のGUIフロントエンド、Alpacaを使用して生成AIを使用する | gihyo.jp

2024/12/04 11 users Alpaca Ollama ローカルLLM gihyo.jp

Ubuntu Weekly Recipe 第841回ローカルLLMの実行ツール「Ollama」のGUIフロントエンド⁠⁠、Alpacaを使用して生成AIを使用する今回は、ローカルLLMの実行ツール「Ollama」のフロントエンド、Alpacaを紹介します。 Alpacaとは Ollamaに関しては第825回で紹介しました。そこではフロントエンドとして、Open WebUIを使いまし... 続きを読む

LLMの思考の性能をモンテカルロ木探索で引き上げる

2024/12/04 12 users 須藤英寿タスクモンテカルロ木探索数学チャット

導入こんにちは、株式会社ナレッジセンスの須藤英寿です。普段はエンジニアとして、LLMを使用したチャットのサービスを提供しております。今回は、推論ステップをモンテカルロ木探索を用いて導き出し、複雑なタスク(例えば、数学の問題を解くなど)での性能を大幅に引き上げる手法、「HiAR-ICL」について解説します。 ... 続きを読む

vLLMで独自実装モデルを高速推論させる

2024/12/04 9 users vLLM Llama Qwen サービングライブラリ

はじめにチューリング生成AIチームの荒居です。この記事は生成AIアドベントカレンダー2024の4日目の記事です。この記事では、動画生成モデルを題材に、vLLMを用いて独自のマルチモーダルモデルを推論させる方法について解説します。vLLMはLLMの高速推論・サービングのライブラリで、LlamaやQwenなどの有名なモデルに... 続きを読む

突撃！隣のキーボード！〜 2024年冬ニーリー Ver. 〜 - Nealle Developer's Blog

2024/12/03 22 users Nealle Developer 突撃キーボードニーリー

こんにちは！ニーリーアドベントカレンダー2024 3日目担当のSREチームの宮後(@miya10kei)です。最近、LLMと格闘する日々を送っています🤼‍♀️ 企業テックブログで散々こすられた企画「突撃！隣のキーボード！」ですが、ニーリーもテックブログをはじめたのにまだこすってないではないか😤、、、ということに気づいたので今... 続きを読む

生成AIは「意味」を理解しているのか？「ノリ」で喋れるLLMに、決定的に欠けているものとは | レバテックラボ（レバテックLAB）

2024/12/03 72 users レバテックラボレバテックLAB 谷口生成AI 工学

生成AIは「意味」を理解しているのか？「ノリ」で喋れるLLMに、決定的に欠けているものとは 2024年12月3日京都大学大学院情報学研究科教授／立命館大学総合科学技術研究機構　客員教授谷口忠大 1978年生まれ。京都大学工学研究科博士課程修了、博士（工学）。専門は人工知能、創発システム、認知発達ロボティクス、コ... 続きを読む

マルチモーダルLLMで複雑な画像を攻略：AOAIでGPT-4oをFine-tuning - Insight Edge Tech Blog

2024/12/02 13 users マルチモーダルLLM Fine-tuning 藤村昨今実務

はじめに Insight EdgeのLLM Engineerの藤村です。昨今、企業のDX推進に伴い、社内に蓄積された大量の画像データや文書の効率的な活用が求められています。弊社では、実務でLLMを活用する際、画像や表形式、複雑な図を含むドキュメントの理解が大きな課題となっています。この課題は多くの企業でも同様に直面していると... 続きを読む

2.5兆トークンを学習したOSSのコード生成LLM「OpenCoder」公開　プロジェクトが明す、コードLLM構築に重要な3要素とは

2024/12/01 13 users OSS プロジェクト再現３要素性能

OpenCoderプロジェクトは2024年11月8日（米国時間）、オープンソースソフトウェア（OSS）のLLM（大規模言語モデル）、「OpenCoder」を公開した。同プロジェクトは以下のように説明している。 OpenCoderは、トップクラスのコード生成LLMの性能に匹敵する、オープンで再現可能なコードLLMファミリーだ。本プロジェクトでは... 続きを読む

日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました｜Kotaro.Kinoshita

2024/11/26 1327 users YomiToku OCR Rag メインターゲット記号

はじめに最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。しかし、その多くは日本語をメインターゲットに開発されているわけではありません。日本語文書は、英数字に加えて、ひらがな、漢字、記号など数千種類の文字を識... 続きを読む

日本語のAIで使う大規模言語モデル性能を評価する「オープン日本語LLMリーダーボード」公開

2024/11/26 15 users 日本語公開 LLM-jp NLP タスク

16種類以上のNLP(自然言語処理)タスクを用いて日本語の大規模言語モデル(LLM)の性能評価と分析を行う「オープン日本語LLMリーダーボード」が公開されました。構築には国立情報学研究所をはじめとする日本語LLMの研究開発を行う組織横断プロジェクト「LLM-jp」が携わっています。 Open Japanese LLM Leaderboard - a Hugg... 続きを読む