タグ 画像認識
人気順 10 users 50 users 100 users 500 users 1000 usersAIへの「ビジュアルプロンプトインジェクション」攻撃とは何か?
大規模言語モデル(LLM)のセキュリティを研究するスタートアップ・Lakeraのエンジニアであるダニエル・ティンブレル氏が、画像認識も可能なチャットボットAIに対する「ビジュアルプロンプトインジェクション」攻撃について解説しています。 The Beginner's Guide to Visual Prompt Injections: Invisibility Cloaks, Cann... 続きを読む
料理を撮影するとAIの画像認識でカロリーや栄養素を推定してくれるアプリ、なぜかメニューにお茶があるとカロリーが計算できない不具合が起きる
リンク Wikipedia ゼロ除算 数学においてゼロ除算(ゼロじょさん、ゼロじょざん、0除算、英語: division by zero)とは、0で除す割り算のことである。このような除算は除される数をaとするならば、形式上は a/0と書くことができるが、このような式を矛盾なく定義することはできない。コンピュータにゼロ除算をさせようと... 続きを読む
有料生成AIが無料・無制限で使い放題の「リートン」でGPT対抗AI「Claude 3」が一般公開/画像認識ができる「vision」機能を実装
GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円
画像認識が可能なオープンソースモデルの「Llama 3-V」が公開されました。Llama 3-Vは、OpenAIのマルチモーダルモデル「GPT4-V」よりも格段に小型で、事前トレーニングにかかる費用は500ドル(約78000円)程度なのにもかかわらず、ほとんどの指標で同等のパフォーマンスを示しています。 Llama 3-V: Matching GPT4-V with ... 続きを読む
【Excel】PDFや画像を見ながら表を手入力する時代は終わった! 画像認識を活用しよう【いまさら聞けないExcelの使い方講座】
NVIDIAのローカルAI「ChatRTX」、AIモデル追加で画像認識や音声入力が可能に/
GeForce RTX搭載PCで動くローカルAI「ChatRTX」刷新。画像認識や音声入力に対応
イーロン・マスク氏のLLM「Grok」、1.5更新で画像認識可能に
イーロン・マスク氏の米AI企業xAIは4月12日(現地時間)、昨年11月に発表した独自LLM(大規模言語モデル)「Grok」の更新版「Grok-1.5V」を発表した。同社初のマルチモーダルモデルで、画像を認識する。既存のGrokユーザーに間もなく提供される予定。 1.5Vの最大の特徴は画像認識能力だ。手書きのフローチャートやスクリ... 続きを読む
中学生でもわかる深層学習
第1章 理論編 ・深層学習とは (p.13-) ・ニューラルネットワークとは (p.31-) ・どうやって学習するか: 勾配降下法 (p.57-) ・深層学習の注意点 (p.91-) 第2章 応用編 ・分類問題 (p.110-) ・画像認識 (p.120-) ・音声認識/自然言語処理 (p.151-) ・講演のまとめ (p.167-) 続きを読む
Dockerで構築する機械学習環境【2024年版】
Dockerを使った機械学習環境の構築方法 株式会社松尾研究所で働いているからあげ(@karaage0703)です。松尾研究所では、機械学習(ここでは、予測モデル、画像認識からLLMまで幅広く扱います)を使う多数のプロジェクトが走っています。プロジェクトの特性は多種多様なので、環境構築方法は様々なのですが、松尾研究所... 続きを読む
「死んだ祖母の形見」とウソをつくことでBingチャットにCAPTCHAの画像認識を解かせることに成功
BingチャットはMicrosoftが提供しているチャットボットAIで、ユーザーは画像をアップロードして検索したり議論したりすることが可能です。そんなBingチャットは、画像認識型のセキュリティテストであるCAPTCHAの問題は解かないように設定されているのですが、架空の亡くなった祖母のロケットペンダントだとウソをついてB... 続きを読む
ChatGPT、“目”と“耳”の実装を発表 写真の内容を認識、発話機能でおしゃべりも可能に
米OpenAIのチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載された。今後2週間かけて、PlusユーザーとEnterpriseユーザーに展開するという。 米OpenAIは9月25日(現地時間)、同社のチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載されたと発表した。今後2週間かけて、PlusユーザーとEnterpr... 続きを読む
Googleの無料AI「Bard」に大アプデ:画像認識、シェア機能、そして待望のメールアクセス
Googleの無料AI「Bard」に大アプデ:画像認識、シェア機能、そして待望のメールアクセス2023.09.19 20:3016,870 西谷茂リチャード 加熱するAI開発レース。勝者はユーザー? GoogleのAIツール「Bard」が大規模アップデートされ、かなり便利そうな新機能がいくつか備わりました。アップデートの概要をご紹介します。 Googleレ... 続きを読む
Google BardでOCR文字認識してみた【画像認識】 - Qiita
まず、英語版のバードに行きます。 画像をアップロードしてほしい情報を入力すると教えていただけます。 生年月日について聞いてみました "平成元年3月31日生"と正しく認識できてます 有効期限も聞きました "2025年3月31日まで有効"と正しく認識できてます まとめ 言われたことしかできない人は、仕事がAIに取られるかも... 続きを読む
「GPT-4」登場。多くの試験を「人間レベル」で合格、画像認識も
ナムチャン/南原 徹也@甲子化学工業 on Twitter: "さつまいもの自動梱包ロボが開発され、海外では運用され始めています。従来は人がサイズを選別して、綺麗に入るように箱詰めしていまし
さつまいもの自動梱包ロボが開発され、海外では運用され始めています。従来は人がサイズを選別して、綺麗に入るように箱詰めしていましたが、このロボは画像認識でパズルを組み立てるように自動で箱詰めしてくれます。ちなみにこれもイスラエルです… https://t.co/GiaCvJOSTQ 続きを読む
誰もdlshogiには敵わなくなって将棋AIの世界が終わってしまった件 | やねうら王 公式サイト
いま大会上位に位置するDeep Learning系の将棋AIは、評価関数として画像認識などでよく使われているResNetを用いている。ResNetについては機械学習を齧っている人ならば誰でも知ってるぐらい有名だと思うので、詳しい説明は割愛する。(ググれば詳しい説明がいくらでも出てくる) 囲碁AIの世界では、このResNetのブロック... 続きを読む
画像の機械学習が劣化する理由 - Qiita
主旨 単純に学習データを追加するだけでは学習が改善しないことがある。そのような場合へのヒントを著者の限られた経験の中から記述する。 はじめに 画像認識の機械学習を改善するためにはデータを追加すればよい。 そう思っている人が大半だろう。 ただ、データを追加したからといって必ずしも機械学習結果は改善しない... 続きを読む
IoT Connect Gatewayを使ってみた 番外編 第2回 ~インターンシップでStorage転送機能を使って開発してみた~ - NTT Communications Engineers' Blog
目次 はじめに インターンシップ参加にあたって 体験内容 IoT Connect GatewayとStorage転送機能についての理解 新サービスの提案 開発環境 カメラの開発 IoT Connect Gatewayの設定 Amazon Web Services上での画像認識 画像認識結果の可視化 インターンシップを終えた感想 トレーナーからのコメント はじめに こんにち... 続きを読む
会議中にスマホを触る政治家を機械学習と画像認識で検出
会議の最中であるにもかかわらず、政治家が集中せずに手遊びしていたり居眠りしていたりする様子が中継に映り込むことがあります。これを、中継映像から機械学習と画像認識を用いて自動的に検出し、TwitterとInstagramのアカウントで映像付きで報告する仕組みが運用されています。 The Flemish Scrollers, 2021-2022 – D... 続きを読む
“目が不自由な人が一人でランニング” グーグル 新技術開発へ | IT・ネット | NHKニュース
目が不自由な人が一人でもランニングを楽しめるよう、大手IT企業のグーグルは、スマートフォンの画像認識の機能を使って走る方向をランナーに知らせる、新しい技術の開発に乗り出しました。 グーグルの日本法人が開発しているのは、カメラを正面に向けた状態でランナーの腹部にスマートフォンを取り付け、画像認識のAI=... 続きを読む
京セラ、図書館の蔵書点検を効率化 本の背表紙をAIで画像解析、一括読み取り - ITmedia NEWS
京セラが、図書館の蔵書点検業務をサポートするサービス「SHELF EYE」の提供を始めた。AIによる画像認識で本の背表紙を読み取り、まとめて蔵書確認することで、職員が1冊ずつバーコードを読み取るこれまでの作業を効率化できる。 京セラコミュニケーションシステム(京都市、KCCS)は2月25日、図書館の蔵書点検業務をサ... 続きを読む
Google、スマホカメラで心拍と呼吸数を認識する新機能。Pixelから提供 - Engadget 日本版
Google のフィットネスアプリ Google Fit に、スマホカメラを使った呼吸数・心拍数計測機能が加わります。 呼吸数の計測は、スタンドなどに立てたスマホのカメラで胸から上をとらえることで、服ごしの体の動きを画像認識で推測する仕組み。 Google Fit は従来から、スマホを持って歩いた際の位置情報や動きを使い、ウォ... 続きを読む
2020年超盛り上がり!自己教師あり学習の最前線まとめ! - Qiita
2020年に大きく盛り上がりを見せた分野に自己教師あり学習(=Self-Supervised Learning(SSL))があります。SSLとは名前の通り自分で教師を用意するような手法で、データ自身から独自のラベルを機械的に作り画像の表現を学ばせるようなタスクです。なので、人間によるラベルは用いません。 最近の画像認識では特に大量のデ... 続きを読む
ラズパイで画像認識、1日30円~のエッジAIが快進撃 - ITmedia NEWS
3000円台で手に入るシングルボードコンピュータ「Raspberry Pi」の性能をフルに生かした、エッジAIプラットフォームを展開しているスタートアップ企業、Ideinを取材した。 3000円台で手に入るシングルボードコンピュータ「Raspberry Pi」の性能をフルに生かした、エッジAIプラットフォームを展開しているスタートアップ... 続きを読む