タグ「言語モデル」

タグ言語モデル

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 25 / 339件)

オープンＡＩ、新たな旗艦ＡＩモデル発表-「ＧＰＴ－４Ｏ」

2024/05/13 10 users オープンAI LLM chatgpt おー対話型人工知能

対話型人工知能（ＡＩ）「ChatGPT」を開発した米オープンＡＩは、ＧＰＴ－４モデルをアップデートした「ＧＰＴ－４Ｏ（オー）」を発表した。スピードアップと低価格を実現したという。 13日のライブ配信イベントで披露された新しい大規模言語モデル（ＬＬＭ）、ＧＴＰー４Ｏは膨大な量のデータをインターネットから取り... 続きを読む

スパコン「富岳」で学習した日本語特化大規模言語モデル「Fugaku-LLM」が公開される

2024/05/13 10 users Fugaku-LLM スパコン富岳既存学習データ

スーパーコンピューター「富岳」を用いて学習した130億パラメータの大規模言語モデル「Fugaku-LLM」が2024年5月10日(金)に公開されました。Fugaku-LLMは既存の大規模言語モデルに頼らず独自の学習データを用いて学習しており、既存の日本語特化大規模言語モデルと比べて高い性能を発揮することがアピールされています。 ... 続きを読む

まるで“いけない話ができるChatGPT”　ローカルAI「Command R+」の爆発的な可能性 (1/5)

2024/05/12 306 users chatgpt LLM ローカルAI Command R 筆者

筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子（あすきこ）さん」 PCローカル環境で動作する大規模言語モデル（LLM）「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT（GPT-4）と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話も... 続きを読む

まるで“いけない話ができるChatGPT”　ローカルAI「Command R+」の爆発的な可能性（アスキー） - Yahoo!ニュース

2024/05/12 21 users chatgpt アスキー LLM ローカルAI Yahoo

PCローカル環境で動作する大規模言語モデル（LLM）「Command R+」を使っていますが、相当優秀です。体感ではChatGPT（GPT-4）と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。【もっと写真を見る】 PCローカル環境で動作する大規模言語モデル（LLM）「Command R+」を使っていますが... 続きを読む

スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開日本語能力に長け、研究・ビジネス利用にも期待

2024/05/10 11 users 要点分散並列学習 Fugaku-LLM AI基盤モデル性能

要点日本の計算機技術を用いて開発した日本語能力に優れた大規模言語モデルを公開スーパーコンピュータ「富岳」の性能を最大限に活用した分散並列学習を実現 AI基盤モデルを科学研究に活用する「AI for Science」など革新的な研究やビジネスにつながる概要東京工業大学学術国際情報センターの横田理央教授の研究チ... 続きを読む

スパコン「富岳」で開発のAIが完成報道陣に公開 | NHK

2024/05/10 12 users 生成AI 基盤スパコン国産スーパーコンピューター

世界最高クラスの計算性能を持つスーパーコンピューター「富岳」を使って開発されたAIが完成し、10日、報道陣に公開されました。生成AIの開発の基盤となる大規模言語モデルと呼ばれるAIで、開発の担当者は「今後、日本語に特化した国産の生成AIのさまざまな研究・開発に活用されることを期待したい」と話しています。開... 続きを読む

15歳の高校生、「日本語能力最強」のAIモデル開発　AITuber向けに設計

2024/05/10 15 users 設計高校生 15歳 LLM AITuber

15歳で現役高校生の開発者「Holy-fox/子狐」氏は5月9日、パラメーター数7Bクラスとしては日本語能力が最強となる大規模言語モデル（LLM）「ArrowPro-7B-KUJIRA」を公開した。「AItuberの魂」になることを想定 7Bにおいて日本語能力最強のモデル、ArrowPro-7B-KUJIRAができました。Elyza-task100においては約3.8をマーク... 続きを読む

日本語大規模言語モデル「Japanese Stable LM 2 1.6B」をリリースしました — Stability AI Japan

2024/05/09 150 users ハードウェア Stability AI Japan 多く

ポイント Japanese Stable LM 2 1.6B（JSLM2 1.6B）は16億パラメータで学習した日本語の小型言語モデルです。 JSLM2 1.6Bのモデルサイズを16億パラメータという少量にすることによって、利用するために必要なハードウェアを小規模に抑えることが可能であり、より多くの開発者が生成AIのエコシステムに参加できるようにし... 続きを読む

インストール不要でLlama 3やMistralなどオープンソースLLMをブラウザで動かせるチャットボット「Secret Llama」が登場

2024/05/07 10 users LLM ABI Mistral GitHub WebGPU

Llama 3やMistral-7Bといったオープンソースの大規模言語モデル(LLM)をサポートし、WebGPUを使ってブラウザ上で完全に動作するチャットボット「Secret Llama」が公開されています。 Secret Llama https://secretllama.com/ GitHub - abi/secret-llama: Fully private LLM chatbot that runs entirely with a browser wit... 続きを読む

1つの大きなLLM（大規模言語モデル）を複数のGPUで力を合わせて動かそう | IIJ Engineers Blog

2024/05/07 10 users LLM GPU IIJ Engineers Blog 複数

地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます... 続きを読む

大規模言語モデルを使って組織内の全データを検索する時にはどのような前処理を行うと効率的なのか？

2024/05/05 12 users 処理組織内全データ LLM Rag

組織には構造化されたデータベースやきれいにフォーマットされたCSVのほか、何気なく書いたメールから複雑な技術マニュアルまでさまざまな形式のデータが大量に保存されています。検索拡張生成(RAG)は大規模言語モデル(LLM)を使用して全てのデータから適切な情報を引き出すための技術ですが、RAGを使用する際にデータの... 続きを読む

デスクトップ「Chrome」Gemini統合

2024/05/04 63 users Chrome GEMINI プロンプトデスクトップデス

この記事のポイントデスクトップ版「Chrome」に大規模言語モデル「Gemini」が統合（v124）アドレスバーに［@］と入力しつつ表示される項目から［Gemini］を選択してプロンプトを入力「@gemini」ショートカットがまだ利用できない場合は有効的（ただし日本語では文字化けも） Google ブラウザサービス「Chrome」のデス... 続きを読む

AppleはGoogleから約40人のAI専門家を引き抜いてスイス・チューリッヒに極秘研究所「Vision Lab」を開設している

2024/05/01 18 users チューリッヒ OpenELM Ferret-UI スイス近年

近年のAppleでは、オープンソースの言語モデル「OpenELM」やマルチモーダル大規模言語モデル「Ferret-UI」などのAI関連製品の開発が精力的に行われています。そんなAppleではGoogleから少なくとも36人ものAI専門家を引き抜き、スイス・チューリッヒにAIモデルや製品を開発する研究所を設立していることが報告されていま... 続きを読む

謎の高性能AIモデル「gpt2-chatbot」がChatbot Arenaに登場、GPT-4.5かGPT-5なのではないかと話題に

2024/04/30 10 users Chatbot Arena GPT-2 GPT-5 出力話題

ユーザーがログインせずに様々な言語モデルとチャットしてその出力を評価することができるウェブサイト「LMSYS.org」のChatbot Arenaで、「GPT-4.5」あるいは「GPT-5」と思われるモデルがテストされているのではないかと話題になっています。 GPT-2? https://rentry.co/GPT2 GPT-4.5 or GPT-5 being tested on LMSYS? | ... 続きを読む

Apple、iPhoneでも稼働するオープンな言語モデル「OpenELM」を公開

2024/04/25 16 users iPhone OpenELM ELM Apple パラメータ

米Appleの研究者らは4月24日（現地時間）、オープンソースの言語モデル「OpenELM」（ELMはEfficient Language Model、効率的な言語モデルの略）をHugging Faceで公開した。パラメータ数の異なる4つのモデルがある。小さいものから、2億7000万、4億5000万、11億、30億（パラメータとは、意思決定でモデルがトレーニング... 続きを読む

LEIA: 言語間転移学習でLLMを賢くする新しい方法

2024/04/24 18 users LLM Studio Ousia 訓練言語理化学研究所

Studio Ousiaと理化学研究所に所属している山田育矢です。この記事では、大規模言語モデル（LLM）の性能を向上させる新しい方法であるLEIA（Lightweight Entity-based Inter-language Adaptation）を紹介します。 LLMは言語によって性能に顕著な差があり、訓練に使われるテキストが最も多い英語において特に性能が高い... 続きを読む

言語モデルを高位合成でFPGAに実装してみた

2024/04/24 10 users FPGA LLM 高位合成内山 Generative AI

言語モデルを高位合成でFPGAに実装してみた Turing株式会社のリサーチチームでインターンしているM1の内山です。 Turing株式会社では大規模基盤モデルによる完全自動運転を目指しており、その実現に欠かせない技術として大規模言語モデルの研究開発を行っています。 Generative AI LLMの広範な知識と思考能力に加え、視... 続きを読む

NEC、世界トップレベル性能の高速な大規模言語モデル (LLM) cotomi Pro / cotomi Light を開発

2024/04/24 11 users LLM cotomi アーキテクチャ NEC 生成AI

NECは、LLM(Large Language Model：大規模言語モデル)「cotomi(注1)」のラインアップ拡充のため、学習データやアーキテクチャを刷新した「cotomi Pro」「cotomi Light」を開発しました。昨今の生成AIの急速な発展に伴い、様々な企業や公共機関が、LLMを活用した業務変革の検討・検証を進めています。具体的な活用シーン... 続きを読む

経済情報特化の生成AI、日経が開発　40年分の記事学習 - 日本経済新聞

2024/04/24 34 users 生成AI 指標パラメーター数人工知能日経

日本経済新聞社は24日、経済情報に特化した生成AI（人工知能）の基盤技術を開発したと発表した。大規模言語モデルと呼ばれるもので、約40年分の日経グループの新聞や雑誌の記事を学習させた。記事の要約機能などで活用を見込む。大規模言語モデルの名称は「NIKKEI Language Model」。性能の指標となる「パラメーター数」... 続きを読む

NEC、クラウド不要の生成AI提供　機密情報を社内で管理　【イブニングスクープ】 - 日本経済新聞

2024/04/23 16 users イブニングスクープ NEC クラウド LLM 機密情報

NECは企業向けに新たな生成AI（人工知能）サービスを6月に始める。NEC製のサーバーとセットで提供することで、機密性の高いデータを社外に出さず、社内で運用を完結できるようにする。個人情報を扱う金融機関やコンタクトセンターなどの需要を見込む。生成AIの基盤となる新型の大規模言語モデル（LLM）「cotomi Light（... 続きを読む

「GPT-4」を上回る性能で、グラフィカルな文書を読解するLLM技術

2024/04/23 10 users GPT-4 文書 LLM 性能 tsuzumi

「GPT-4」を上回る性能で、グラフィカルな文書を読解するLLM技術：NTTの「tsuzumi」にも採用 NTTは2024年4月12日、大規模言語モデル（LLM）の活用により、文書に含まれる図表やグラフなども含めて理解し、自然言語での指示に従って読解／応答する「視覚読解技術」を実現したと発表した。 NTTは2024年4月12日、大規模言語... 続きを読む

OpenAIのGPT-4はCVEのセキュリティ勧告を読むことで実際の脆弱性を悪用できることが明らかに

2024/04/22 14 users CVE OpenAI LLM abs GPT-4

OpenAIが開発する大規模言語モデル(LLM)のGPT-4は、一般公開されている脆弱(ぜいじゃく)性を悪用してサイバー攻撃を成功させることが可能であることが最新の研究により明らかになりました。 [2404.08144] LLM Agents can Autonomously Exploit One-day Vulnerabilities https://arxiv.org/abs/2404.08144 GPT-4 can expl... 続きを読む

陰謀論者 vs. 生成AI──大規模言語モデルは陰謀論を説得できるか？　米MITなどが2000人以上で検証

2024/04/19 29 users 陰謀論者生成AI 米MIT 陰謀論反証

陰謀論は一度信じ始めると、反証によって覆すのが非常に難しい信念だと考えられている。しかし、この研究では従来の陰謀論に対する反証の試みが失敗してきたのは、単に各陰謀論者に合わせた説得力のある反証が不足していたためではないかという可能性を検討した。陰謀論者は自分の関心のある陰謀について非常に詳しいこ... 続きを読む

GoogleがAIに無限の長さのテキストを処理できる能力を与える技術を発表

2024/04/15 17 users テキスト能力 Google 技術発表

Googleの研究者が、大規模言語モデル(LLM)に無限の長さのテキストを処理させる手法だという「Infini-attention」に関する論文を発表しました。 [2404.07143] Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention https://arxiv.org/abs/2404.07143 Google’s new technique gives L... 続きを読む

GPT-4に日本語特化モデル　OpenAI Japan始動会見で発表

2024/04/15 169 users GPT-4 プレビューリリース発表カスタムモデル API

米OpenAIは4月15日、大規模言語モデル「GPT-4」について、日本語に最適化したカスタムモデルを発表した。日本語のテキストを記述する能力が向上しており、「GPT-4 Turbo」より最大3倍高速とうたっている。今後数カ月以内にAPIをリリースするという。関連記事 OpenAI、“怠けにくい”「GPT-4 Turbo」プレビューリリースや... 続きを読む

(1 - 25 / 339件)

次の25件 »