タグ オープンモデル
人気順 10 users 50 users 100 users 500 users 1000 users720億パラメーターでも「GPT-4o超え」、Ai2のオープンモデル
アレン人工知能研究所(Ai2)がマルチモーダル言語モデル「Molmo」ファミリーをリリースした。質の高いデータと効率的な訓練によって720億パラメーターのモデルでGPT-4oを上回る性能を示したという。 by Melissa Heikkilä2024.10.09 8 非営利研究機関のアレン人工知能研究所(Ai2)は、オープンソース・マルチモーダル言... 続きを読む
Google、AIの“幻覚”に対処する「DataGemma」をオープンモデルでリリース
米Googleは9月13日(現地時間)、LLMが不正確な回答を出してしまういわゆる幻覚(ハルシネーション)を軽減するためのAIモデル「DataGemma」を発表した。オープンモデルとしてHugging Faceで公開した。 Gemmaは、Googleが今年2月にオープンモデルとして発表した「Gemini」の軽量版LLM。DataGemmaは、このGemmaのオープン... 続きを読む
GitHub、数クリックで話題の生成AIモデルを試せる「GitHub Models」を発表
GitHub、数クリックで話題の生成AIモデルを試せる「GitHub Models」を発表:「全ての開発者がAIエンジニアになれる」 GitHubはAIアプリ開発支援サービスの「GitHub Models」を発表した。Microsoft、OpenAI、Meta、Mistralなどの人気のあるプライベートモデルやオープンモデルを数回のクリックとキー操作で実験、比較、テ... 続きを読む
Meta、無料で商用可の「Llama 3.1」リリース 「世界最大かつ最も高性能なオープンモデル」
米Metaは7月24日(現地時間)、“オープンソースの”LLMの最新版「Llama 3.1」を発表した。最大モデルは4050億(405B)のパラメータを持ち、米NVIDIAの1万6000個以上の「H100」でトレーニングした。Llama 3の70Bモデルと8Bモデルもアップグレードされる。 4月にリリースした「Llama 3」同様に、ほぼすべての主要クラウドサ... 続きを読む
加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実
加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実 2024.06.21 Updated by Ryo Shimizu on June 21, 2024, 18:19 pm JST 世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。 いくつかの興味深い事象が起きているからだ。 昨日発表されたKarakuri社... 続きを読む
NVIDIAがオープンモデル「Nemotron-4 340B」を発表、LLMトレーニング用合成データの生成に革命を起こすか
高度なAIのトレーニングには高品質な学習データが欠かせませんが、そのようなデータは急速に枯渇しつつあることが問題となっています。NVIDIA2024年6月14日に、大規模言語モデル(LLM)のトレーニングに使用する合成データの生成を念頭に開発され、商用アプリケーションにも使えるオープンソースのAIモデル「Nemotron-4 34... 続きを読む
Microsoftがコスト効率の高い小さめの言語モデル「Phi-3」をリリース、オープンモデルで商用利用可能
Microsoftが小さい規模で大きな性能を発揮する言語モデルとして「Phi-3」ファミリーをリリースしました。ファミリーの中でも一番小さなサイズのモデルであるPhi-3-miniはオープンモデルとなっており、無料で商用利用が可能です。 Introducing Phi-3: Redefining what's possible with SLMs | Microsoft Azure Blog https... 続きを読む
Google Colab で Llama 3 のファインチューニングを試す |npaka
「Google Colab」での「Llama 3」のファインチューニングを試したので、まとめました。 【注意】Google Colab Pro/Pro+のA100で動作確認しています。 1. Llama 3「Llama 3」は、Metaが開発したオープンモデルです。 2. 学習Colabでの学習手順は、次のとおりです。 (1) Colabのノートブックを開き、メニュー「編集 → ノー... 続きを読む
Databricks、“オープン”な汎用LLM「DBRX」リリース 商用利用可
米AI企業のDatabricksは3月27日(現地時間)、“オープンな”汎用LLM「DBRX」を発表した。同社によると、DBRXは標準的なベンチマークで既存のすべてのオープンモデルより優れたパフォーマンスを発揮するという。ただし、マルチモーダルではない。 DBRXは、オープンソースプロジェクトMegaBlocksに基づいて構築されたMoE(M... 続きを読む
Stability AI、画像生成モデルSDXL 1.0をリリース、オープンモデルとして公開 | gihyo.jp
Stability AI、画像生成モデルSDXL 1.0をリリース、オープンモデルとして公開 Stability AIは2023年7月26日、同社の開発するテキストによるAI画像生成モデルSDXL(Stable Diffusion XL)の新バージョンSDXL 1.0をリリースした。 ANNOUNCING SDXL 1.0 -Stability AI Stability AIが最新のテキストから画像を生成する... 続きを読む
AWSとSalesforce、GenesysがLinux Foundationと組んで新たなオープン・データモデルを発表 | TechCrunch Japan
昨年AdobeとSAP、Microsoftの3社はOpen Data Initiativeを結成した。負けてはならじとAWSとSalesforce、Genesysの3社もThe Linux Foundationと提携してCloud Information Modelを発表した。 2つの競合するデータモデルには共通点がたくさんある。どちらも、データを集めて共通のオープンモデルを適用する。こうした大会... 続きを読む
【2010年8月最新版】直近決算発表に基づくmixi,GREE,モバゲーの業績比較 ~ モバゲー独走状態だが、グリー巻き返しの兆しが:in the looop:ITmedia オルタナティブ・ブログ
日本三大SNSサービスの2010年4-6月期の四半期決算発表が出揃った。 3ヶ月前の記事では、自社ゲームとオープンゲームの「ハイブリッドモデル」を選択したモバゲータウン(以下、モバゲーと省略)が、「オープンモデル」(オープンゲームのみ)のmixiと「クローズモデル」(自社ゲームのみ)のGREEを圧倒し、ひとり勝ちの様相となったことを報じた。 ・ 【2010年5月版】直近決算発表に基づくmixi,G... 続きを読む