タグ モダリティ
人気順 10 users 50 users 100 users 500 users 1000 usersGoogle、次世代AIモデル「Gemini 1.5」を発表 「10万行のソースコードから修正を提案するデモ」も公開
Googleは2024年2月15日(米国時間)、同社の大規模言語モデル(LLM)「Gemini」の次世代モデルである「Gemini 1.5」を発表した。 Geminiは、テキスト/画像/音声/数値など複数の種類のデータ(モダリティ)を処理できるマルチモーダルAI(人工知能)モデル。Googleは、Gemini 1.5の初期テスト用モデルとして「Gemini 1... 続きを読む
Meta、マルチモーダルAI「ImageBind」をオープンソース化
Metaは、マルチモーダルなAIモデル「ImageBind」をオープンソースで公開した。テキスト、画像および動画、音声、深度(3D)、熱(赤外線)、慣性測定単位(IMU)という6種類のモダリティをサポートする。「メタバース」生成にも使えそうだ。 米Metaは5月9日(現地時間)、マルチモーダルな情報をバインドするAIモデル「I... 続きを読む
CycleGANで効果を発揮!画像の構造を抽出する特徴量"MIND"を実装してみる - エムスリーテックブログ
初めまして!2019年8月中旬からエムスリー エンジニアリングG AIチームで10日間インターンに参加した三澤です。インターンでは「CycleGANを用いてモダリティ(CT, MRI, PETなどの画像撮影装置)の違う画像の変換に関する手法」に関する論文について、Surveyと実装をしました。CycleGANというのは「夏の風景画と冬の風景画... 続きを読む
モダリティを超えて - 人工知能に関する断創録
2018年の目標(2018/1/1)にも書いたように今年はマルチモーダル深層学習の深耕を目標に上げていました。社内の輪講会でマルチモーダル深層学習の研究動向について発表する機会があったので資料を公開します。 マルチモーダル深層学習の研究動向 from Koichiro Mori Multimodal Machine Learning: A Survey and Taxonomy... 続きを読む
ビジネス英語の歩き方:自分の奥さんを「ママ」と呼ぶ――日本語の“常識”が日本人を英語ベタにする (1/2) - Business Media 誠
日本人は無意識のうちに「相手との関係性」に応じた日本語を使い分けています。これをモダリティといいますが、この意識が強すぎることが英語でのコミュニケーションを邪魔しているのです。 「ビジネス英語の歩き方」とは? 英語番組や英会話スクール、ネットを通じた英会話学習など、現代日本には英語を学ぶ手段が数多く存在しています。しかし、単語や文法などは覚えられても、その背景にある文化的側面については、なかなか理... 続きを読む