はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ オープンモデル

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 12 / 12件)
 

720億パラメーターでも「GPT-4o超え」、Ai2のオープンモデル

2024/10/09 このエントリーをはてなブックマークに追加 11 users Instapaper Pocket Tweet Facebook Share Evernote Clip GPT-4o AI2 Melissa Heikkil 訓練

アレン人工知能研究所(Ai2)がマルチモーダル言語モデル「Molmo」ファミリーをリリースした。質の高いデータと効率的な訓練によって720億パラメーターのモデルでGPT-4oを上回る性能を示したという。 by Melissa Heikkilä2024.10.09 8 非営利研究機関のアレン人工知能研究所(Ai2)は、オープンソース・マルチモーダル言... 続きを読む

Google、AIの“幻覚”に対処する「DataGemma」をオープンモデルでリリース

2024/09/15 このエントリーをはてなブックマークに追加 18 users Instapaper Pocket Tweet Facebook Share Evernote Clip 幻覚 LLM GEMINI Gemma ハルシネーション

米Googleは9月13日(現地時間)、LLMが不正確な回答を出してしまういわゆる幻覚(ハルシネーション)を軽減するためのAIモデル「DataGemma」を発表した。オープンモデルとしてHugging Faceで公開した。 Gemmaは、Googleが今年2月にオープンモデルとして発表した「Gemini」の軽量版LLM。DataGemmaは、このGemmaのオープン... 続きを読む

GitHub、数クリックで話題の生成AIモデルを試せる「GitHub Models」を発表

2024/08/20 このエントリーをはてなブックマークに追加 8 users Instapaper Pocket Tweet Facebook Share Evernote Clip GitHub GitHub Models Mistral

GitHub、数クリックで話題の生成AIモデルを試せる「GitHub Models」を発表:「全ての開発者がAIエンジニアになれる」 GitHubはAIアプリ開発支援サービスの「GitHub Models」を発表した。Microsoft、OpenAI、Meta、Mistralなどの人気のあるプライベートモデルやオープンモデルを数回のクリックとキー操作で実験、比較、テ... 続きを読む

Meta、無料で商用可の「Llama 3.1」リリース 「世界最大かつ最も高性能なオープンモデル

2024/07/23 このエントリーをはてなブックマークに追加 23 users Instapaper Pocket Tweet Facebook Share Evernote Clip Meta LLM 商用可 米Meta パラメータ

米Metaは7月24日(現地時間)、“オープンソースの”LLMの最新版「Llama 3.1」を発表した。最大モデルは4050億(405B)のパラメータを持ち、米NVIDIAの1万6000個以上の「H100」でトレーニングした。Llama 3の70Bモデルと8Bモデルもアップグレードされる。 4月にリリースした「Llama 3」同様に、ほぼすべての主要クラウドサ... 続きを読む

加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実

2024/06/21 このエントリーをはてなブックマークに追加 417 users Instapaper Pocket Tweet Facebook Share Evernote Clip NVIDIA GPU 冷や水 組み合わせ pm JST

加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実 2024.06.21 Updated by Ryo Shimizu on June 21, 2024, 18:19 pm JST 世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。 いくつかの興味深い事象が起きているからだ。 昨日発表されたKarakuri社... 続きを読む

NVIDIAがオープンモデル「Nemotron-4 340B」を発表、LLMトレーニング用合成データの生成に革命を起こすか

2024/06/15 このエントリーをはてなブックマークに追加 52 users Instapaper Pocket Tweet Facebook Share Evernote Clip NVIDIA 生成 革命 LLM 発表

高度なAIのトレーニングには高品質な学習データが欠かせませんが、そのようなデータは急速に枯渇しつつあることが問題となっています。NVIDIA2024年6月14日に、大規模言語モデル(LLM)のトレーニングに使用する合成データの生成を念頭に開発され、商用アプリケーションにも使えるオープンソースのAIモデル「Nemotron-4 34... 続きを読む

Microsoftがコスト効率の高い小さめの言語モデル「Phi-3」をリリース、オープンモデルで商用利用可能

2024/04/24 このエントリーをはてなブックマークに追加 8 users Instapaper Pocket Tweet Facebook Share Evernote Clip Phi-3 Microsoft 規模 ファミリー リリース

Microsoftが小さい規模で大きな性能を発揮する言語モデルとして「Phi-3」ファミリーをリリースしました。ファミリーの中でも一番小さなサイズのモデルであるPhi-3-miniはオープンモデルとなっており、無料で商用利用が可能です。 Introducing Phi-3: Redefining what's possible with SLMs | Microsoft Azure Blog https... 続きを読む

Google Colab で Llama 3 のファインチューニングを試す |npaka

2024/04/22 このエントリーをはてなブックマークに追加 8 users Instapaper Pocket Tweet Facebook Share Evernote Clip ファインチューニング Meta Colab npaka とおり

「Google Colab」での「Llama 3」のファインチューニングを試したので、まとめました。 【注意】Google Colab Pro/Pro+のA100で動作確認しています。 1. Llama 3「Llama 3」は、Metaが開発したオープンモデルです。 2. 学習Colabでの学習手順は、次のとおりです。 (1) Colabのノートブックを開き、メニュー「編集 → ノー... 続きを読む

Databricks、“オープン”な汎用LLM「DBRX」リリース 商用利用可

2024/03/28 このエントリーをはてなブックマークに追加 8 users Instapaper Pocket Tweet Facebook Share Evernote Clip Databricks マルチモーダル moe リリース 既存

米AI企業のDatabricksは3月27日(現地時間)、“オープンな”汎用LLM「DBRX」を発表した。同社によると、DBRXは標準的なベンチマークで既存のすべてのオープンモデルより優れたパフォーマンスを発揮するという。ただし、マルチモーダルではない。 DBRXは、オープンソースプロジェクトMegaBlocksに基づいて構築されたMoE(M... 続きを読む

Stability AI、画像生成モデルSDXL 1.0をリリース、オープンモデルとして公開 | gihyo.jp

2023/07/27 このエントリーをはてなブックマークに追加 8 users Instapaper Pocket Tweet Facebook Share Evernote Clip gihyo.jp Stable Diffusion 同社

Stability AI⁠⁠、画像生成モデルSDXL 1.0をリリース⁠⁠、オープンモデルとして公開 Stability AIは2023年7月26日、同社の開発するテキストによるAI画像生成モデルSDXL(Stable Diffusion XL)の新バージョンSDXL 1.0をリリースした。 ANNOUNCING SDXL 1.0 -Stability AI Stability AIが最新のテキストから画像を生成する... 続きを読む

AWSとSalesforce、GenesysがLinux Foundationと組んで新たなオープン・データモデルを発表 | TechCrunch Japan

2019/11/14 このエントリーをはてなブックマークに追加 12 users Instapaper Pocket Tweet Facebook Share Evernote Clip SalesForce SAP Foundation AWS

昨年AdobeとSAP、Microsoftの3社はOpen Data Initiativeを結成した。負けてはならじとAWSとSalesforce、Genesysの3社もThe Linux Foundationと提携してCloud Information Modelを発表した。 2つの競合するデータモデルには共通点がたくさんある。どちらも、データを集めて共通のオープンモデルを適用する。こうした大会... 続きを読む

【2010年8月最新版】直近決算発表に基づくmixi,GREE,モバゲーの業績比較 ~ モバゲー独走状態だが、グリー巻き返しの兆しが:in the looop:ITmedia オルタナティブ・ブログ

2010/08/16 このエントリーをはてなブックマークに追加 357 users Instapaper Pocket Tweet Facebook Share Evernote Clip GREE mixi ひとり勝ち モバゲー ハイブリッドモデル

日本三大SNSサービスの2010年4-6月期の四半期決算発表が出揃った。 3ヶ月前の記事では、自社ゲームとオープンゲームの「ハイブリッドモデル」を選択したモバゲータウン(以下、モバゲーと省略)が、「オープンモデル」(オープンゲームのみ)のmixiと「クローズモデル」(自社ゲームのみ)のGREEを圧倒し、ひとり勝ちの様相となったことを報じた。 ・ 【2010年5月版】直近決算発表に基づくmixi,G... 続きを読む

 
(1 - 12 / 12件)