はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ Llama 2

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 28件)

Metaがコード生成AIモデルの新バージョン「Code Llama 70B」をリリース、コードの正確性が向上・Pythonに最適化されたバリアントも提供

2024/01/30 このエントリーをはてなブックマークに追加 8 users Instapaper Pocket Tweet Facebook Share Evernote Clip バリアント Meta Instagram Facebook

FacebookやInstagramを運営するMetaが、テキスト入力を元にプログラムのコードを生成するAI「Code Llama」の700億パラメータのモデルをリリースしたと発表しました。モデルはLlama 2と同じ「Llama 2 Community License」で公開されており、月間アクティブユーザー数が7億人以下の場合は無償で商用利用することが可能です... 続きを読む

東工大など、日本語に強い大規模言語モデル「Swallow」を無償で公開

2024/01/13 このエントリーをはてなブックマークに追加 209 users Instapaper Pocket Tweet Facebook Share Evernote Clip Swallow LLM 両者 生成AI 無償

東京工業大学(東工大)と産業技術総合研究所(産総研)の両者は12月19日、現在公開されている中で、日本語に強い生成AIの基盤である「大規模言語モデル」(LLM)としては最大規模となる「Swallow」を、米・MetaのLLM「Llama 2」の日本語能力を拡張することで構築し、Webサイト「TokyoTech-LLM」にて一般公開したこと、またオ... 続きを読む

130億パラメータの「Llama 2」をベースとした日本語LLM「ELYZA-japanese-Llama-2-13b」を公開しました(商用利用可)|ELYZA, Inc.

2023/12/27 このエントリーをはてなブックマークに追加 26 users Instapaper Pocket Tweet Facebook Share Evernote Clip ELYZA Inc 日本語LLM ベース ベースモデル

130億パラメータの「Llama 2」をベースとした日本語LLM「ELYZA-japanese-Llama-2-13b」を公開しました(商用利用可) 本記事のサマリーELYZA は「Llama 2 13B」をベースとした商用利用可能な日本語LLMである「ELYZA-japanese-Llama-2-13b」シリーズを一般公開しました。前回公開の 7B シリーズからベースモデルおよび学... 続きを読む

「医療」に特化したオープンソースの大規模言語モデル「Meditron」が登場

2023/12/03 このエントリーをはてなブックマークに追加 13 users Instapaper Pocket Tweet Facebook Share Evernote Clip LLM Meta 言語モデル オープンソース 医療

Metaの大規模言語モデル(LLM)である「Llama 2」をベースに医学書でトレーニングした、医療専門のLLMスイート「Meditron」が登場しました。登場直後であるため正規採用はまだ推奨されていないものの、医療分野に関する能力がGPT-3.5を上回っていることが報告されています。 [2311.16079] MEDITRON-70B: Scaling Medical P... 続きを読む

【Orca-2-13b】Microsoftの最新LLMがLlama 2を超える性能を叩き出す | WEEL

2023/11/26 このエントリーをはてなブックマークに追加 7 users Instapaper Pocket Tweet Facebook Share Evernote Clip 藤崎 Meta社 推論能力 WEEL ベース

WEELメディア事業部テックリサーチャーの藤崎です。 2023年11月21日に、Microsoftから小規模言語モデルの「Orca-2-13b」が公開されました。 このモデルはmeta社が開発したLLAMA 2と呼ばれる言語モデルをベースにしており、推論能力を向上させるために開発されました。 Orca-2-13bを発表したMicrosoft Researchのツイート... 続きを読む

さまざまなチャットAIを簡単にローカル環境で動かせるアプリ「Ollama」の公式Dockerイメージが登場

2023/10/21 このエントリーをはてなブックマークに追加 98 users Instapaper Pocket Tweet Facebook Share Evernote Clip Ollama Mistral チャットAI vicuna 登場

「Mistral」「Llama 2」「Vicuna」などオープンソースの大規模言語モデルを簡単にローカルで動作させることが可能なアプリ「Ollama」の公式Dockerイメージが登場したので、早速使い勝手を試してみました。 Ollama is now available as an official Docker image · Ollama Blog https://ollama.ai/blog/ollama-is-now-ava... 続きを読む

GPT-4やLlama 2の透明性をスタンフォード大HAIが評価 トップはMetaでOpenAIは3位

2023/10/19 このエントリーをはてなブックマークに追加 13 users Instapaper Pocket Tweet Facebook Share Evernote Clip Meta OpenAI Hai found GPT-4

スタンフォード大学HAIは、AI基盤モデルの透明性評価システム「FMTI」と、このシステムで評価したOpenAIやMetaなど10社の透明性ランキングを発表した。 米スタンフォード大学Human-Centered AI Institute(HAI)は10月18日(現地時間)、AIの基盤モデルを公開している10社の透明性を評価するスコアリングシステム「Found... 続きを読む

【Zephyr 7b Alpha】ついにLlama 2を超えるLLM現る!HuggingFaceの最強AI | WEEL

2023/10/13 このエントリーをはてなブックマークに追加 9 users Instapaper Pocket Tweet Facebook Share Evernote Clip HuggingFace WEEL ファインチューニング 性能

Zephyr 7b Alphaは、Hugging FaceがリリースしたMistral AIのMistral 7bのファインチューニングモデルで、なんと10倍ほどモデルサイズが大きいChat Llama 70Bと同等の性能を持っています。 ファインチューニングで10倍の差を埋めるのはすごいですよね! 今回は、Zephyr 7b Alphaの概要や仕組み、実際に使ってみた感想を... 続きを読む

AWS提供の生成AIサービスが一般開放 新たにLlama 2も利用可能に

2023/09/29 このエントリーをはてなブックマークに追加 11 users Instapaper Pocket Tweet Facebook Share Evernote Clip 生成AIサービス 一般開放 利用

AWSのサービスとも連携可能で、例えば監視ツール「Amazon CloudWatch」と連携すれば利用状況を可視化できるという。ただし、ユーザーのデータベースと生成AIを直接接続する機能などは引き続きプレビュー版のまま提供する。 関連記事 AWSが生成AIに本格参入 テキスト生成、文章要約、画像生成など API経由で利用できる... 続きを読む

ELYZAが公開した日本語LLM「ELYZA-japanese-Llama-2-7b」についての解説 : (1) 事前学習編

2023/09/12 このエントリーをはてなブックマークに追加 11 users Instapaper Pocket Tweet Facebook Share Evernote Clip ELYZA Meta 平川 日本語LLM 堀江

はじめに こんにちは。ELYZAの研究開発チームの佐々木 (@hikomimo)、中村 (@tyo_yo_)、堀江 (@eemon18)、平川 (@h__must__) です。 先日弊社株式会社ELYZAでは以下のようなリリースをさせていただきました。 Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました 上記の... 続きを読む

Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました|ELYZA, Inc.

2023/08/29 このエントリーをはてなブックマークに追加 129 users Instapaper Pocket Tweet Facebook Share Evernote Clip Meta ELYZA text-davinci-003 匹敵

Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました 本記事のサマリーELYZAが「Llama 2」ベースの商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を一般公開 性能は「GPT-3.5 (text-davinci-003)」に匹敵、日本語の公開モデルのなかでは最高水準 Chat形式のデ... 続きを読む

Google Colab で Llama 2 + LangChain の RetrievalQA を試す|npaka

2023/07/31 このエントリーをはてなブックマークに追加 6 users Instapaper Pocket Tweet Facebook Share Evernote Clip Colab LangChain npaka 実行Colab

「Google Colab」で「Llama 2 + LangChain」の RetrievalQA を試したのでまとめました。 1. 使用モデル今回は、「Llama-2-7b-chat-hf」(4bit量子化)と埋め込みモデル「multilingual-e5-large」を使います。 3. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) メニュー「編集→ノートブックの設定」で、「ハード... 続きを読む

ChatGPT(3.5)に匹敵する「Llama 2」をローカルPCで動かしてみた

2023/07/31 このエントリーをはてなブックマークに追加 21 users Instapaper Pocket Tweet Facebook Share Evernote Clip chatgpt 米Meta GPT-4 米OpenAI 対抗馬

生成AIのトップランナーといえば、米OpenAIが提供するGPT-4などを使ったChatGPTですが、その対抗馬として期待されているのが米Metaが提供する大規模言語モデル「Llama 2」です。Llama 2ならば自宅のローカルPCでも動作させられるかもしれません。ということで、Text Generation web UIを使って、Llama 2を試してみました... 続きを読む

【西川和久の不定期コラム】 LLMがローカルで動くパラメータ数どこまで?Metaの「Llama 2」を試してみた

2023/07/27 このエントリーをはてなブックマークに追加 7 users Instapaper Pocket Tweet Facebook Share Evernote Clip LLM Meta 西川和久 不定期コラム

続きを読む

「Metaが公開した『LLaMa 2』はオープンソースではない」――OSIが声明

2023/07/25 このエントリーをはてなブックマークに追加 8 users Instapaper Pocket Tweet Facebook Share Evernote Clip OSI エグゼクティブディレクター Meta 声明 ライセンス

オープンソース推進団体のOpen Source Initiative(OSI)は2023年7月20日(米国時間)、エグゼクティブディレクターを務めるステファノ・マフリ氏の名前で、「Metaが公開した『LLaMa 2』のライセンスはオープンソースではない」と題した声明を発表した。 OSIは声明で、「Metaは、LLaMa 2が『オープンソース』だという誤... 続きを読む

Meta、商用利用可能なオープンソースLLM「Llama 2」を提供開始 「MPT」や「Falcon」を上回る成績

2023/07/21 このエントリーをはてなブックマークに追加 7 users Instapaper Pocket Tweet Facebook Share Evernote Clip MPT Falcon Meta LLM オープンソースLLM

Metaは2023年7月18日(米国時間)、次世代のオープンソース大規模言語モデル(LLM)「Llama 2」の提供開始を発表した。研究および商用向けに無償で提供されている。 Llama 2は、同社が2023年2月に研究者向けに公開し、高い需要がある「Llama 1」の次期バージョン。開発者や組織が生成AIを活用したツールや体験を構築でき... 続きを読む

話題のLlama 2という大規模言語モデルをAmazon SageMaker JumpStartで動かしてみた | DevelopersIO

2023/07/19 このエントリーをはてなブックマークに追加 5 users Instapaper Pocket Tweet Facebook Share Evernote Clip DevelopersIO 大規模言語モデル 話題

料金については正確な情報として以下の公式情報も参照ください。 以降はml.g5.48xlargeなども使用しますので、費用にはご注意ください。 なお大きめのインスタンスはService Quotaの上限緩和申請が必要となるケースもありますので、必要に応じて対処下さい。 作業用ノートブックの起動 7b-chatモデルを右上の「Open note... 続きを読む

オープンソースで商用利用可能な大規模言語モデル「Llama 2」がReplicateに登場したのでAPI経由で使ってみた

2023/07/20 このエントリーをはてなブックマークに追加 12 users Instapaper Pocket Tweet Facebook Share Evernote Clip replicate Jul api経由 言語モデル 商用利用

AIモデルを誰でも簡単にデプロイできるサイト「Replicate」にて、2023年7月18日に公開されたばかりの高性能オープンソースAIモデル「Llama 2」が登場したので早速使ってみました。 Accessing Llama 2 from the command-line with the llm-replicate plugin https://simonwillison.net/2023/Jul/18/accessing-llama-2/ Ll... 続きを読む

Meta、商用利用も可能な大規模言語モデル「Llama 2」をオープンソースで提供開始 

2023/07/19 このエントリーをはてなブックマークに追加 7 users Instapaper Pocket Tweet Facebook Share Evernote Clip Meta オープンソース 言語モデル 商用利用 提供開始

続きを読む

Llama 2 をDocker使ってローカルで動かす

2023/07/20 このエントリーをはてなブックマークに追加 8 users Instapaper Pocket Tweet Facebook Share Evernote Clip Docker LLM Meta Python ライセンス

Llama 2 発表! Metaから商用利用可能なライセンスでオープンなLLMであるLlama 2が発表されました。 こりゃすごそうだけど、しばらくは様子見かなーと思っていたら、npakaさんが一瞬で動かしているではありませんか。 こりゃやるしかないと、ローカルでDockerで動かしてみました。要は、npakaさんの記事の「(1) Pythonの... 続きを読む

Metaの次世代オープンソースLLM「Llama 2」が発表 ~AzureとWindows上で動作サポート/パートナーシップを拡大し、Microsoftが優先パートナーに

2023/07/19 このエントリーをはてなブックマークに追加 7 users Instapaper Pocket Tweet Facebook Share Evernote Clip Meta パートナーシップ Microsoft 発表

続きを読む

HuggingFace での Llama 2 の使い方|npaka

2023/07/19 このエントリーをはてなブックマークに追加 5 users Instapaper Pocket Tweet Facebook Share Evernote Clip HuggingFace npaka LLM Meta 使い方

以下の記事が面白かったので、軽くまとめました。 ・Llama 2 is here - get it on Hugging Face 1. Llama 2Llama 2」は、Metaが開発した、7B・13B・70B パラメータのLLMです。 長いコンテキスト長 (4,000トークン) や、70B モデルの高速推論のためのグループ化されたクエリアテンションなど、「Llama 1」と比べて大幅... 続きを読む

Llama.cpp で Llama 2 を試す|npaka

2023/07/19 このエントリーをはてなブックマークに追加 7 users Instapaper Pocket Tweet Facebook Share Evernote Clip npaka LLM llama.cpp Meta パラメータ

「Llama.cpp」(llama-cpp-python)で「Llama 2」を試したので、まとめました。 1. Llama 2Llama 2」は、Metaが開発した、7B・13B・70B パラメータのLLMです。 3. モデル一覧「Llama.cpp」を利用するには、「Llama 2」モデルをGGML形式に変換する必要があります。HuggingFaceには、変換済みのモデルも公開されています。... 続きを読む

Metaの大規模言語モデル「Llama 2」を無料で誰でもブラウザからお試しできる「LLaMA2 Chatbot」

2023/07/19 このエントリーをはてなブックマークに追加 10 users Instapaper Pocket Tweet Facebook Share Evernote Clip Meta LLM パラメーター 大規模言語モデル ブラウザ

Metaが発表した商用利用も可能な大規模言語モデル(LLM)「Llama 2」を、誰でも無料でブラウザ上からお試しできる「LLaMA2 Chatbot」が公開されました。 LLaMA2 Chatbot by a16z-infra https://llama2.ai/ 画面左にあるメニュー部分では、モデルやパラメーターを変更したり、チャット履歴を削除したりすることができます。... 続きを読む

MetaとQualcomm、生成AI「Llama 2」をスマートフォンやHMDで実行可能に

2023/07/18 このエントリーをはてなブックマークに追加 6 users Instapaper Pocket Tweet Facebook Share Evernote Clip Meta Qualcomm HMD 米Meta 生成AI

Qualcommは、Metaの新生成AI「Llama 2」を、Snapdragon搭載のスマートフォンやVRヘッドセットで実行可能にすると発表した。2024年以降に実現する計画。 米Qualcommは7月19日(現地時間)、米Metaが前日発表した「Llama 2」をSnapdragon搭載スマートフォン、PC、VR/ARヘッドセットで実行できるようにすることでMetaと提... 続きを読む

 
(1 - 25 / 28件)