タグ「VLM」 - はてブログ

タグ VLM

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 6 / 6件)

Apple、iOS 18.2、iPadOS 18.2、macOS Sequoia 15.2で画面上のコンテンツを理解する視覚言語モデル (VLM)を実装 | NEWS | Mac OTAKARA

2024/11/05 12 users Siri Apple Intelligence アプリ実装

Making onscreen content available to Siri and Apple Intelligence Appleが、デベロッパー向けドキュメント「Making onscreen content available to Siri and Apple Intelligence」を公開し、iOS 18.2以降、iPadOS 18.2以降、macOS Sequoia 15.2以降で、Siri と Apple Intelligence を有効にして、アプリの画面上のコ... 続きを読む

Sakana AI、複数の画像を扱える“日本語視覚言語モデル”公開　非英語圏での先駆けに

2024/08/05 13 users Sakana AI 非英語圏複数画像公開

AIスタートアップのSakana AI（東京都港区）は8月2日、複数の画像について日本語で質疑応答できるAIモデル「Llama-3-EvoVLM-JP-v2」を発表した。このモデルは、同社が提案する生成AIの開発手法「進化的モデルマージ」で開発した視覚言語モデル（VLM）。作成したAIモデルなどはHugging Faceで公開中。「Llama-3-EvoVLM-J... 続きを読む

【MiniCPM-Llama3-V 2.5】たった8BでGPT-4o超えのVLM | WEEL

2024/07/04 5 users GPT-4V WEELメディア事業部LLMライター性能

WEELメディア事業部LLMライターのゆうやです。 MiniCPM-Llama3-V 2.5は、中国のOpenBMB（Open Lab for Big Model Base）が開発した最新のオープンソースマルチモーダル言語モデルで、8BというサイズながらGPT-4Vと同等の性能を有しています。 🚀 Excited to introduce MiniCPM-Llama3-V 2.5! With 8B parameters, it’s o... 続きを読む

LLM時代の強化学習 - どこから見てもメンダコ

2023/11/24 104 users メンダコ LLM LLM時代強化学習課題

強化学習におけるLLMの活用パターン調査はじめに：実世界における強化学習の課題 LLM×強化学習人間はゼロショット推論によりサンプル効率の良い学習ができる LLMによるゼロショット推論の例さまざまなLLM活用パターン 1. 報酬モデルとしてのLLM LLMによる代理報酬モデル VLMによる外観ベース代理報酬モデル外部知識... 続きを読む

OpenAI の GPT-4-vision-preview (VLM) を利用した商品画像のタグ付け - DROBEプロダクト開発ブログ

2023/11/22 30 users プロンプトケーススタディ DROBE モチベーション課題

はじめに DROBE の課題と GPT-4-Vision-Preview を試すモチベーションケーススタディ入力するデータ推論周辺部分のコードプロンプト実験結果おわりに参考文献はじめに OpenAIが Dev Day で発表したGPT-4-Vision-Previewは、画像処理と自然言語処理を組み合わせた最先端の技術です。このモデルは、画像を理解し... 続きを読む

Stability AIは商用利用可能な日本語画像言語モデル「Japanese Stable VLM」をリリースしました。 — Stability AI Japan

2023/11/13 14 users Stability AI 商用利用日本語画像言語モデル

Stability AI は商用利用可能な日本語画像言語モデル「Japanese Stable VLM」をリリースしました。 Japanese Stable VLM 「Japanese Stable VLM」は、「Japanese Stable LM Instruct Gamma 7B」をベースとした日本語画像言語モデル（Vision-Language Model、略してVLM)です。入力した画像に対して文字で説明を生成できる... 続きを読む

(1 - 6 / 6件)

タグ VLM

Apple、iOS 18.2、iPadOS 18.2、macOS Sequoia 15.2で画面上のコンテンツを理解する視覚言語モデル (VLM)を実装 | NEWS | Mac OTAKARA

Sakana AI、複数の画像を扱える“日本語視覚言語モデル”公開　非英語圏での先駆けに

【MiniCPM-Llama3-V 2.5】たった8BでGPT-4o超えのVLM | WEEL

LLM時代の強化学習 - どこから見てもメンダコ

OpenAI の GPT-4-vision-preview (VLM) を利用した商品画像のタグ付け - DROBEプロダクト開発ブログ

Stability AIは商用利用可能な日本語画像言語モデル「Japanese Stable VLM」をリリースしました。 — Stability AI Japan

本日の新着エントリー

本日の人気エントリー

1年前の人気エントリー

先週のランキング

人気エントリーにあるタグ

最近の注目エントリー

最近の注目タグ

タグ VLM

Apple、iOS 18.2、iPadOS 18.2、macOS Sequoia 15.2で画面上のコンテンツを理解する視覚言語モデル (VLM)を実装 | NEWS | Mac OTAKARA

Sakana AI、複数の画像を扱える“日本語視覚言語モデル”公開 非英語圏での先駆けに

【MiniCPM-Llama3-V 2.5】たった8BでGPT-4o超えのVLM | WEEL

LLM時代の強化学習 - どこから見てもメンダコ

OpenAI の GPT-4-vision-preview (VLM) を利用した商品画像のタグ付け - DROBEプロダクト開発ブログ

Stability AIは商用利用可能な日本語画像言語モデル「Japanese Stable VLM」をリリースしました。 — Stability AI Japan

本日の新着エントリー

本日の人気エントリー

1年前の人気エントリー

先週のランキング

人気エントリーにあるタグ

最近の注目エントリー

最近の注目タグ

Sakana AI、複数の画像を扱える“日本語視覚言語モデル”公開　非英語圏での先駆けに