はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ Ferret-UI

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 3 / 3件)
 

AppleはGoogleから約40人のAI専門家を引き抜いてスイス・チューリッヒに極秘研究所「Vision Lab」を開設している

2024/05/01 このエントリーをはてなブックマークに追加 18 users Instapaper Pocket Tweet Facebook Share Evernote Clip チューリッヒ OpenELM スイス Apple 近年

近年のAppleでは、オープンソースの言語モデル「OpenELM」やマルチモーダル大規模言語モデル「Ferret-UI」などのAI関連製品の開発が精力的に行われています。そんなAppleではGoogleから少なくとも36人ものAI専門家を引き抜き、スイス・チューリッヒにAIモデルや製品を開発する研究所を設立していることが報告されていま... 続きを読む

米Apple、iPhoneのUIを理解するモバイル専用AI言語モデル「Ferret-UI」発表 GPT-4V越えの性能

2024/04/12 このエントリーをはてなブックマークに追加 20 users Instapaper Pocket Tweet Facebook Share Evernote Clip seamless iPhone シームレス GPT-4V 論文

このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 X: @shiropen2 米Appleに所属する研究者らが発表した論文「Ferret-UI: Grounded Mobile UI Understandin... 続きを読む

Appleがスマホの画面を認識できるマルチモーダルLLM「Ferret-UI」を発表、SiriがiPhoneアプリのUIを理解できるようになる可能性も

2024/04/10 このエントリーをはてなブックマークに追加 15 users Instapaper Pocket Tweet Facebook Share Evernote Clip abs MLLM arXiv Siri 未査読論文リポジトリ

Appleの研究者が、スマートフォンのアプリUIを理解するために設計したマルチモーダル大規模言語モデル(MLLM)の「Ferret-UI」を開発したという論文を、未査読論文リポジトリであるarXivで公開しました。 [2404.05719] Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs https://arxiv.org/abs/2404.0571... 続きを読む

 
(1 - 3 / 3件)