タグ 未査読論文リポジトリ
人気順 5 users 50 users 100 users 500 users 1000 usersAppleがスマホの画面を認識できるマルチモーダルLLM「Ferret-UI」を発表、SiriがiPhoneアプリのUIを理解できるようになる可能性も
Appleの研究者が、スマートフォンのアプリUIを理解するために設計したマルチモーダル大規模言語モデル(MLLM)の「Ferret-UI」を開発したという論文を、未査読論文リポジトリであるarXivで公開しました。 [2404.05719] Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs https://arxiv.org/abs/2404.0571... 続きを読む
AIに「『スター・トレック』の船長になりきって」と指示すると数学の問題でより良いパフォーマンスが発揮されることを研究者が発見
by JD Hancock 「大規模言語モデル(LLM)にSFドラマ『スター・トレック』の登場人物になりきるようなプロンプトを入力すると、数学の問題を解く能力が向上した」という論文が、未査読論文リポジトリであるarXivに掲載されました。 あ [2402.10949] The Unreasonable Effectiveness of Eccentric Automatic Prompts https:... 続きを読む
わずか100秒のモーションデータから94%の精度でVRユーザーを特定できることが5万人以上のBeat Saberプレーヤーからの匿名化されたデータで判明
人気アプリ「Beat Saber」の5万人以上のプレイヤーの匿名化されたVRデータ記録250万件を分析し、わずか100秒間のモーションデータから94%以上の精度でユーザーを一意に特定できるという研究結果を示した論文が、未査読論文リポジトリのarxiv.orgに掲載されています。 [2302.08927] Unique Identification of 50,000+ Vi... 続きを読む