はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 画像認識

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 137件)

AIへの「ビジュアルプロンプトインジェクション」攻撃とは何か?

2024/11/14 このエントリーをはてなブックマークに追加 17 users Instapaper Pocket Tweet Facebook Share Evernote Clip LLM 攻撃 プロンプトインジェクション チャットボットAI

大規模言語モデル(LLM)のセキュリティを研究するスタートアップ・Lakeraのエンジニアであるダニエル・ティンブレル氏が、画像認識も可能なチャットボットAIに対する「ビジュアルプロンプトインジェクション」攻撃について解説しています。 The Beginner's Guide to Visual Prompt Injections: Invisibility Cloaks, Cann... 続きを読む

料理を撮影するとAIの画像認識でカロリーや栄養素を推定してくれるアプリ、なぜかメニューにお茶があるとカロリーが計算できない不具合が起きる

2024/08/15 このエントリーをはてなブックマークに追加 27 users Instapaper Pocket Tweet Facebook Share Evernote Clip 栄養素 カロリー お茶 メニュー アプリ

リンク Wikipedia ゼロ除算 数学においてゼロ除算(ゼロじょさん、ゼロじょざん、0除算、英語: division by zero)とは、0で除す割り算のことである。このような除算は除される数をaとするならば、形式上は a/0と書くことができるが、このような式を矛盾なく定義することはできない。コンピュータにゼロ除算をさせようと... 続きを読む

有料生成AIが無料・無制限で使い放題の「リートン」でGPT対抗AI「Claude 3」が一般公開/画像認識ができる「vision」機能を実装

2024/07/12 このエントリーをはてなブックマークに追加 106 users Instapaper Pocket Tweet Facebook Share Evernote Clip Vision リートン 有料生成AI 実装 Claude 3

続きを読む

GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円

2024/05/29 このエントリーをはてなブックマークに追加 21 users Instapaper Pocket Tweet Facebook Share Evernote Clip マルチモーダルモデル OpenAI 格段 指標 登場

画像認識が可能なオープンソースモデルの「Llama 3-V」が公開されました。Llama 3-Vは、OpenAIのマルチモーダルモデル「GPT4-V」よりも格段に小型で、事前トレーニングにかかる費用は500ドル(約78000円)程度なのにもかかわらず、ほとんどの指標で同等のパフォーマンスを示しています。 Llama 3-V: Matching GPT4-V with ... 続きを読む

【Excel】PDFや画像を見ながら表を手入力する時代は終わった! 画像認識を活用しよう【いまさら聞けないExcelの使い方講座】

2024/05/21 このエントリーをはてなブックマークに追加 12 users Instapaper Pocket Tweet Facebook Share Evernote Clip Excel PDF 時代 使い方講座 画像

続きを読む

NVIDIAのローカルAI「ChatRTX」、AIモデル追加で画像認識や音声入力が可能に/

2024/05/02 このエントリーをはてなブックマークに追加 14 users Instapaper Pocket Tweet Facebook Share Evernote Clip NVIDIA ローカルAI 音声入力

続きを読む

GeForce RTX搭載PCで動くローカルAI「ChatRTX」刷新。画像認識や音声入力に対応

2024/05/02 このエントリーをはてなブックマークに追加 18 users Instapaper Pocket Tweet Facebook Share Evernote Clip 刷新 ローカルAI 音声入力

続きを読む

イーロン・マスク氏のLLM「Grok」、1.5更新で画像認識可能に

2024/04/13 このエントリーをはてなブックマークに追加 9 users Instapaper Pocket Tweet Facebook Share Evernote Clip LLM スクリ Grok マルチモーダルモデル 手書き

イーロン・マスク氏の米AI企業xAIは4月12日(現地時間)、昨年11月に発表した独自LLM(大規模言語モデル)「Grok」の更新版「Grok-1.5V」を発表した。同社初のマルチモーダルモデルで、画像を認識する。既存のGrokユーザーに間もなく提供される予定。 1.5Vの最大の特徴は画像認識能力だ。手書きのフローチャートやスクリ... 続きを読む

中学生でもわかる深層学習

2024/03/29 このエントリーをはてなブックマークに追加 508 users Instapaper Pocket Tweet Facebook Share Evernote Clip 深層学習 中学生 ニューラルネットワーク 勾配降下法 音声

第1章 理論編 ・深層学習とは (p.13-) ・ニューラルネットワークとは (p.31-) ・どうやって学習するか: 勾配降下法 (p.57-) ・深層学習の注意点 (p.91-) 第2章 応用編 ・分類問題 (p.110-) ・画像認識 (p.120-) ・音声認識/自然言語処理 (p.151-) ・講演のまとめ (p.167-) 続きを読む

Dockerで構築する機械学習環境【2024年版】

2024/03/11 このエントリーをはてなブックマークに追加 192 users Instapaper Pocket Tweet Facebook Share Evernote Clip Docker LLM 機械学習環境 karaage0703

Dockerを使った機械学習環境の構築方法 株式会社松尾研究所で働いているからあげ(@karaage0703)です。松尾研究所では、機械学習(ここでは、予測モデル、画像認識からLLMまで幅広く扱います)を使う多数のプロジェクトが走っています。プロジェクトの特性は多種多様なので、環境構築方法は様々なのですが、松尾研究所... 続きを読む

「死んだ祖母の形見」とウソをつくことでBingチャットにCAPTCHAの画像認識を解かせることに成功

2023/10/03 このエントリーをはてなブックマークに追加 38 users Instapaper Pocket Tweet Facebook Share Evernote Clip CAPTCHA 形見 Bingチャット セキュリティテスト

BingチャットはMicrosoftが提供しているチャットボットAIで、ユーザーは画像をアップロードして検索したり議論したりすることが可能です。そんなBingチャットは、画像認識型のセキュリティテストであるCAPTCHAの問題は解かないように設定されているのですが、架空の亡くなった祖母のロケットペンダントだとウソをついてB... 続きを読む

ChatGPT、“目”と“耳”の実装を発表 写真の内容を認識、発話機能でおしゃべりも可能に

2023/09/25 このエントリーをはてなブックマークに追加 23 users Instapaper Pocket Tweet Facebook Share Evernote Clip Enterpr chatgpt 米OpenAI おしゃべり

米OpenAIのチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載された。今後2週間かけて、PlusユーザーとEnterpriseユーザーに展開するという。 米OpenAIは9月25日(現地時間)、同社のチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載されたと発表した。今後2週間かけて、PlusユーザーとEnterpr... 続きを読む

Googleの無料AI「Bard」に大アプデ:画像認識、シェア機能、そして待望のメールアクセス

2023/09/19 このエントリーをはてなブックマークに追加 19 users Instapaper Pocket Tweet Facebook Share Evernote Clip 西谷茂リチャード 勝者 待望 Google 概要

Googleの無料AI「Bard」に大アプデ:画像認識、シェア機能、そして待望のメールアクセス2023.09.19 20:3016,870 西谷茂リチャード 加熱するAI開発レース。勝者はユーザー? GoogleのAIツール「Bard」が大規模アップデートされ、かなり便利そうな新機能がいくつか備わりました。アップデートの概要をご紹介します。 Googleレ... 続きを読む

Google BardでOCR文字認識してみた【画像認識】 - Qiita

2023/07/18 このエントリーをはてなブックマークに追加 24 users Instapaper Pocket Tweet Facebook Share Evernote Clip Qiita Google Bard

まず、英語版のバードに行きます。 画像をアップロードしてほしい情報を入力すると教えていただけます。 生年月日について聞いてみました "平成元年3月31日生"と正しく認識できてます 有効期限も聞きました "2025年3月31日まで有効"と正しく認識できてます まとめ 言われたことしかできない人は、仕事がAIに取られるかも... 続きを読む

「GPT-4」登場。多くの試験を「人間レベル」で合格、画像認識

2023/03/15 このエントリーをはてなブックマークに追加 15 users Instapaper Pocket Tweet Facebook Share Evernote Clip GPT-4 合格 試験 人間 登場

続きを読む

ナムチャン/南原 徹也@甲子化学工業 on Twitter: "さつまいもの自動梱包ロボが開発され、海外では運用され始めています。従来は人がサイズを選別して、綺麗に入るように箱詰めしていまし

2022/09/16 このエントリーをはてなブックマークに追加 220 users Instapaper Pocket Tweet Facebook Share Evernote Clip 南原 サツマイモ イスラエル ロボ on Twitter

さつまいもの自動梱包ロボが開発され、海外では運用され始めています。従来は人がサイズを選別して、綺麗に入るように箱詰めしていましたが、このロボは画像認識でパズルを組み立てるように自動で箱詰めしてくれます。ちなみにこれもイスラエルです… https://t.co/GiaCvJOSTQ 続きを読む

誰もdlshogiには敵わなくなって将棋AIの世界が終わってしまった件 | やねうら王 公式サイト

2022/06/27 このエントリーをはてなブックマークに追加 10 users Instapaper Pocket Tweet Facebook Share Evernote Clip dlshogi ResNet 将棋AI やねうら王 囲碁AI

いま大会上位に位置するDeep Learning系の将棋AIは、評価関数として画像認識などでよく使われているResNetを用いている。ResNetについては機械学習を齧っている人ならば誰でも知ってるぐらい有名だと思うので、詳しい説明は割愛する。(ググれば詳しい説明がいくらでも出てくる) 囲碁AIの世界では、このResNetのブロック... 続きを読む

画像の機械学習が劣化する理由 - Qiita

2022/04/30 このエントリーをはてなブックマークに追加 194 users Instapaper Pocket Tweet Facebook Share Evernote Clip 主旨 Qiita 大半 著者 ヒント

主旨 単純に学習データを追加するだけでは学習が改善しないことがある。そのような場合へのヒントを著者の限られた経験の中から記述する。 はじめに 画像認識の機械学習を改善するためにはデータを追加すればよい。 そう思っている人が大半だろう。 ただ、データを追加したからといって必ずしも機械学習結果は改善しない... 続きを読む

IoT Connect Gatewayを使ってみた 番外編 第2回 ~インターンシップでStorage転送機能を使って開発してみた~ - NTT Communications Engineers' Blog

2022/03/29 このエントリーをはてなブックマークに追加 7 users Instapaper Pocket Tweet Facebook Share Evernote Clip インターンシップ 目次 トレーナー 番外編 カメラ

目次 はじめに インターンシップ参加にあたって 体験内容 IoT Connect GatewayとStorage転送機能についての理解 新サービスの提案 開発環境 カメラの開発 IoT Connect Gatewayの設定 Amazon Web Services上での画像認識 画像認識結果の可視化 インターンシップを終えた感想 トレーナーからのコメント はじめに こんにち... 続きを読む

会議中にスマホを触る政治家を機械学習と画像認識で検出

2022/01/18 このエントリーをはてなブックマークに追加 29 users Instapaper Pocket Tweet Facebook Share Evernote Clip 検出 機械学習 政治家 Instagram Twitter

会議の最中であるにもかかわらず、政治家が集中せずに手遊びしていたり居眠りしていたりする様子が中継に映り込むことがあります。これを、中継映像から機械学習と画像認識を用いて自動的に検出し、TwitterとInstagramのアカウントで映像付きで報告する仕組みが運用されています。 The Flemish Scrollers, 2021-2022 – D... 続きを読む

“目が不自由な人が一人でランニング” グーグル 新技術開発へ | IT・ネット | NHKニュース

2021/08/29 このエントリーをはてなブックマークに追加 10 users Instapaper Pocket Tweet Facebook Share Evernote Clip グーグル ランニング 腹部 ランナー NHKニュース

目が不自由な人が一人でもランニングを楽しめるよう、大手IT企業のグーグルは、スマートフォンの画像認識の機能を使って走る方向をランナーに知らせる、新しい技術の開発に乗り出しました。 グーグルの日本法人が開発しているのは、カメラを正面に向けた状態でランナーの腹部にスマートフォンを取り付け、画像認識のAI=... 続きを読む

京セラ、図書館の蔵書点検を効率化 本の背表紙をAIで画像解析、一括読み取り - ITmedia NEWS

2021/02/25 このエントリーをはてなブックマークに追加 28 users Instapaper Pocket Tweet Facebook Share Evernote Clip 京セラ 蔵書点検 背表紙 KCCS ITmedia News

京セラが、図書館の蔵書点検業務をサポートするサービス「SHELF EYE」の提供を始めた。AIによる画像認識で本の背表紙を読み取り、まとめて蔵書確認することで、職員が1冊ずつバーコードを読み取るこれまでの作業を効率化できる。 京セラコミュニケーションシステム(京都市、KCCS)は2月25日、図書館の蔵書点検業務をサ... 続きを読む

Google、スマホカメラで心拍と呼吸数を認識する新機能。Pixelから提供 - Engadget 日本版

2021/02/04 このエントリーをはてなブックマークに追加 8 users Instapaper Pocket Tweet Facebook Share Evernote Clip Pixel 心拍 うお 計測 スタンド

Google のフィットネスアプリ Google Fit に、スマホカメラを使った呼吸数・心拍数計測機能が加わります。 呼吸数の計測は、スタンドなどに立てたスマホのカメラで胸から上をとらえることで、服ごしの体の動きを画像認識で推測する仕組み。 Google Fit は従来から、スマホを持って歩いた際の位置情報や動きを使い、ウォ... 続きを読む

2020年超盛り上がり!自己教師あり学習の最前線まとめ! - Qiita

2020/12/01 このエントリーをはてなブックマークに追加 11 users Instapaper Pocket Tweet Facebook Share Evernote Clip Qiita ラベル SSL 手法 教師

2020年に大きく盛り上がりを見せた分野に自己教師あり学習(=Self-Supervised Learning(SSL))があります。SSLとは名前の通り自分で教師を用意するような手法で、データ自身から独自のラベルを機械的に作り画像の表現を学ばせるようなタスクです。なので、人間によるラベルは用いません。 最近の画像認識では特に大量のデ... 続きを読む

ラズパイで画像認識、1日30円~のエッジAIが快進撃 - ITmedia NEWS

2020/11/13 このエントリーをはてなブックマークに追加 213 users Instapaper Pocket Tweet Facebook Share Evernote Clip ラズパイ 快進撃 エッジAI ITmedia News

3000円台で手に入るシングルボードコンピュータ「Raspberry Pi」の性能をフルに生かした、エッジAIプラットフォームを展開しているスタートアップ企業、Ideinを取材した。 3000円台で手に入るシングルボードコンピュータ「Raspberry Pi」の性能をフルに生かした、エッジAIプラットフォームを展開しているスタートアップ... 続きを読む

 
(1 - 25 / 137件)