タグ Llama 2
新着順 10 users 50 users 100 users 500 users 1000 usersMetaがコード生成AIモデルの新バージョン「Code Llama 70B」をリリース、コードの正確性が向上・Pythonに最適化されたバリアントも提供
FacebookやInstagramを運営するMetaが、テキスト入力を元にプログラムのコードを生成するAI「Code Llama」の700億パラメータのモデルをリリースしたと発表しました。モデルはLlama 2と同じ「Llama 2 Community License」で公開されており、月間アクティブユーザー数が7億人以下の場合は無償で商用利用することが可能です... 続きを読む
東工大など、日本語に強い大規模言語モデル「Swallow」を無償で公開
東京工業大学(東工大)と産業技術総合研究所(産総研)の両者は12月19日、現在公開されている中で、日本語に強い生成AIの基盤である「大規模言語モデル」(LLM)としては最大規模となる「Swallow」を、米・MetaのLLM「Llama 2」の日本語能力を拡張することで構築し、Webサイト「TokyoTech-LLM」にて一般公開したこと、またオ... 続きを読む
130億パラメータの「Llama 2」をベースとした日本語LLM「ELYZA-japanese-Llama-2-13b」を公開しました(商用利用可)|ELYZA, Inc.
130億パラメータの「Llama 2」をベースとした日本語LLM「ELYZA-japanese-Llama-2-13b」を公開しました(商用利用可) 本記事のサマリーELYZA は「Llama 2 13B」をベースとした商用利用可能な日本語LLMである「ELYZA-japanese-Llama-2-13b」シリーズを一般公開しました。前回公開の 7B シリーズからベースモデルおよび学... 続きを読む
「医療」に特化したオープンソースの大規模言語モデル「Meditron」が登場
Metaの大規模言語モデル(LLM)である「Llama 2」をベースに医学書でトレーニングした、医療専門のLLMスイート「Meditron」が登場しました。登場直後であるため正規採用はまだ推奨されていないものの、医療分野に関する能力がGPT-3.5を上回っていることが報告されています。 [2311.16079] MEDITRON-70B: Scaling Medical P... 続きを読む
【Orca-2-13b】Microsoftの最新LLMがLlama 2を超える性能を叩き出す | WEEL
WEELメディア事業部テックリサーチャーの藤崎です。 2023年11月21日に、Microsoftから小規模言語モデルの「Orca-2-13b」が公開されました。 このモデルはmeta社が開発したLLAMA 2と呼ばれる言語モデルをベースにしており、推論能力を向上させるために開発されました。 Orca-2-13bを発表したMicrosoft Researchのツイート... 続きを読む
さまざまなチャットAIを簡単にローカル環境で動かせるアプリ「Ollama」の公式Dockerイメージが登場
「Mistral」「Llama 2」「Vicuna」などオープンソースの大規模言語モデルを簡単にローカルで動作させることが可能なアプリ「Ollama」の公式Dockerイメージが登場したので、早速使い勝手を試してみました。 Ollama is now available as an official Docker image · Ollama Blog https://ollama.ai/blog/ollama-is-now-ava... 続きを読む
GPT-4やLlama 2の透明性をスタンフォード大HAIが評価 トップはMetaでOpenAIは3位
スタンフォード大学HAIは、AI基盤モデルの透明性評価システム「FMTI」と、このシステムで評価したOpenAIやMetaなど10社の透明性ランキングを発表した。 米スタンフォード大学Human-Centered AI Institute(HAI)は10月18日(現地時間)、AIの基盤モデルを公開している10社の透明性を評価するスコアリングシステム「Found... 続きを読む
【Zephyr 7b Alpha】ついにLlama 2を超えるLLM現る!HuggingFaceの最強AI | WEEL
Zephyr 7b Alphaは、Hugging FaceがリリースしたMistral AIのMistral 7bのファインチューニングモデルで、なんと10倍ほどモデルサイズが大きいChat Llama 70Bと同等の性能を持っています。 ファインチューニングで10倍の差を埋めるのはすごいですよね! 今回は、Zephyr 7b Alphaの概要や仕組み、実際に使ってみた感想を... 続きを読む
AWS提供の生成AIサービスが一般開放 新たにLlama 2も利用可能に
AWSのサービスとも連携可能で、例えば監視ツール「Amazon CloudWatch」と連携すれば利用状況を可視化できるという。ただし、ユーザーのデータベースと生成AIを直接接続する機能などは引き続きプレビュー版のまま提供する。 関連記事 AWSが生成AIに本格参入 テキスト生成、文章要約、画像生成など API経由で利用できる... 続きを読む
ELYZAが公開した日本語LLM「ELYZA-japanese-Llama-2-7b」についての解説 : (1) 事前学習編
はじめに こんにちは。ELYZAの研究開発チームの佐々木 (@hikomimo)、中村 (@tyo_yo_)、堀江 (@eemon18)、平川 (@h__must__) です。 先日弊社株式会社ELYZAでは以下のようなリリースをさせていただきました。 Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました 上記の... 続きを読む
Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました|ELYZA, Inc.
Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました 本記事のサマリーELYZAが「Llama 2」ベースの商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を一般公開 性能は「GPT-3.5 (text-davinci-003)」に匹敵、日本語の公開モデルのなかでは最高水準 Chat形式のデ... 続きを読む
Google Colab で Llama 2 + LangChain の RetrievalQA を試す|npaka
「Google Colab」で「Llama 2 + LangChain」の RetrievalQA を試したのでまとめました。 1. 使用モデル今回は、「Llama-2-7b-chat-hf」(4bit量子化)と埋め込みモデル「multilingual-e5-large」を使います。 3. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) メニュー「編集→ノートブックの設定」で、「ハード... 続きを読む
ChatGPT(3.5)に匹敵する「Llama 2」をローカルPCで動かしてみた
生成AIのトップランナーといえば、米OpenAIが提供するGPT-4などを使ったChatGPTですが、その対抗馬として期待されているのが米Metaが提供する大規模言語モデル「Llama 2」です。Llama 2ならば自宅のローカルPCでも動作させられるかもしれません。ということで、Text Generation web UIを使って、Llama 2を試してみました... 続きを読む
【西川和久の不定期コラム】 LLMがローカルで動くパラメータ数どこまで?Metaの「Llama 2」を試してみた
「Metaが公開した『LLaMa 2』はオープンソースではない」――OSIが声明
オープンソース推進団体のOpen Source Initiative(OSI)は2023年7月20日(米国時間)、エグゼクティブディレクターを務めるステファノ・マフリ氏の名前で、「Metaが公開した『LLaMa 2』のライセンスはオープンソースではない」と題した声明を発表した。 OSIは声明で、「Metaは、LLaMa 2が『オープンソース』だという誤... 続きを読む
Meta、商用利用可能なオープンソースLLM「Llama 2」を提供開始 「MPT」や「Falcon」を上回る成績
Metaは2023年7月18日(米国時間)、次世代のオープンソース大規模言語モデル(LLM)「Llama 2」の提供開始を発表した。研究および商用向けに無償で提供されている。 Llama 2は、同社が2023年2月に研究者向けに公開し、高い需要がある「Llama 1」の次期バージョン。開発者や組織が生成AIを活用したツールや体験を構築でき... 続きを読む
話題のLlama 2という大規模言語モデルをAmazon SageMaker JumpStartで動かしてみた | DevelopersIO
料金については正確な情報として以下の公式情報も参照ください。 以降はml.g5.48xlargeなども使用しますので、費用にはご注意ください。 なお大きめのインスタンスはService Quotaの上限緩和申請が必要となるケースもありますので、必要に応じて対処下さい。 作業用ノートブックの起動 7b-chatモデルを右上の「Open note... 続きを読む
オープンソースで商用利用可能な大規模言語モデル「Llama 2」がReplicateに登場したのでAPI経由で使ってみた
AIモデルを誰でも簡単にデプロイできるサイト「Replicate」にて、2023年7月18日に公開されたばかりの高性能オープンソースAIモデル「Llama 2」が登場したので早速使ってみました。 Accessing Llama 2 from the command-line with the llm-replicate plugin https://simonwillison.net/2023/Jul/18/accessing-llama-2/ Ll... 続きを読む
Meta、商用利用も可能な大規模言語モデル「Llama 2」をオープンソースで提供開始
Llama 2 をDocker使ってローカルで動かす
Llama 2 発表! Metaから商用利用可能なライセンスでオープンなLLMであるLlama 2が発表されました。 こりゃすごそうだけど、しばらくは様子見かなーと思っていたら、npakaさんが一瞬で動かしているではありませんか。 こりゃやるしかないと、ローカルでDockerで動かしてみました。要は、npakaさんの記事の「(1) Pythonの... 続きを読む
Metaの次世代オープンソースLLM「Llama 2」が発表 ~AzureとWindows上で動作サポート/パートナーシップを拡大し、Microsoftが優先パートナーに
HuggingFace での Llama 2 の使い方|npaka
以下の記事が面白かったので、軽くまとめました。 ・Llama 2 is here - get it on Hugging Face 1. Llama 2「Llama 2」は、Metaが開発した、7B・13B・70B パラメータのLLMです。 長いコンテキスト長 (4,000トークン) や、70B モデルの高速推論のためのグループ化されたクエリアテンションなど、「Llama 1」と比べて大幅... 続きを読む
Llama.cpp で Llama 2 を試す|npaka
「Llama.cpp」(llama-cpp-python)で「Llama 2」を試したので、まとめました。 1. Llama 2「Llama 2」は、Metaが開発した、7B・13B・70B パラメータのLLMです。 3. モデル一覧「Llama.cpp」を利用するには、「Llama 2」モデルをGGML形式に変換する必要があります。HuggingFaceには、変換済みのモデルも公開されています。... 続きを読む
Metaの大規模言語モデル「Llama 2」を無料で誰でもブラウザからお試しできる「LLaMA2 Chatbot」
Metaが発表した商用利用も可能な大規模言語モデル(LLM)「Llama 2」を、誰でも無料でブラウザ上からお試しできる「LLaMA2 Chatbot」が公開されました。 LLaMA2 Chatbot by a16z-infra https://llama2.ai/ 画面左にあるメニュー部分では、モデルやパラメーターを変更したり、チャット履歴を削除したりすることができます。... 続きを読む
MetaとQualcomm、生成AI「Llama 2」をスマートフォンやHMDで実行可能に
Qualcommは、Metaの新生成AI「Llama 2」を、Snapdragon搭載のスマートフォンやVRヘッドセットで実行可能にすると発表した。2024年以降に実現する計画。 米Qualcommは7月19日(現地時間)、米Metaが前日発表した「Llama 2」をSnapdragon搭載スマートフォン、PC、VR/ARヘッドセットで実行できるようにすることでMetaと提... 続きを読む