タグ「画像認識」 - はてブログ

タグ画像認識

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 25 / 138件)

次の25件 »

【Excel】PDFや画像を見ながら表を手入力する時代は終わった！画像認識を活用しよう【再掲】【今すぐ読みたい！人気記事】

2024/12/29 22 users 再掲 Excel PDF 時代画像

AIへの「ビジュアルプロンプトインジェクション」攻撃とは何か？

2024/11/14 17 users LLM 攻撃プロンプトインジェクションチャットボットAI

大規模言語モデル(LLM)のセキュリティを研究するスタートアップ・Lakeraのエンジニアであるダニエル・ティンブレル氏が、画像認識も可能なチャットボットAIに対する「ビジュアルプロンプトインジェクション」攻撃について解説しています。 The Beginner's Guide to Visual Prompt Injections: Invisibility Cloaks, Cann... 続きを読む

料理を撮影するとAIの画像認識でカロリーや栄養素を推定してくれるアプリ、なぜかメニューにお茶があるとカロリーが計算できない不具合が起きる

2024/08/15 27 users 栄養素カロリーお茶メニューアプリ

リンク Wikipedia ゼロ除算数学においてゼロ除算（ゼロじょさん、ゼロじょざん、0除算、英語: division by zero）とは、0で除す割り算のことである。このような除算は除される数をaとするならば、形式上は a/0と書くことができるが、このような式を矛盾なく定義することはできない。コンピュータにゼロ除算をさせようと... 続きを読む

有料生成AIが無料・無制限で使い放題の「リートン」でGPT対抗AI「Claude 3」が一般公開／画像認識ができる「vision」機能を実装

2024/07/12 106 users Vision リートン有料生成AI 実装 Claude 3

GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円

2024/05/29 21 users マルチモーダルモデル OpenAI 格段指標登場

画像認識が可能なオープンソースモデルの「Llama 3-V」が公開されました。Llama 3-Vは、OpenAIのマルチモーダルモデル「GPT4-V」よりも格段に小型で、事前トレーニングにかかる費用は500ドル(約78000円)程度なのにもかかわらず、ほとんどの指標で同等のパフォーマンスを示しています。 Llama 3-V: Matching GPT4-V with ... 続きを読む

イーロン・マスク氏の米AI企業xAIは4月12日（現地時間）、昨年11月に発表した独自LLM（大規模言語モデル）「Grok」の更新版「Grok-1.5V」を発表した。同社初のマルチモーダルモデルで、画像を認識する。既存のGrokユーザーに間もなく提供される予定。 1.5Vの最大の特徴は画像認識能力だ。手書きのフローチャートやスクリ... 続きを読む

中学生でもわかる深層学習

2024/03/29 508 users 深層学習中学生ニューラルネットワーク勾配降下法音声

第1章　理論編・深層学習とは (p.13-) ・ニューラルネットワークとは (p.31-) ・どうやって学習するか: 勾配降下法 (p.57-) ・深層学習の注意点 (p.91-) 第2章　応用編・分類問題 (p.110-) ・画像認識 (p.120-) ・音声認識／自然言語処理 (p.151-) ・講演のまとめ (p.167-) 続きを読む

Dockerで構築する機械学習環境【2024年版】

2024/03/11 192 users Docker LLM 機械学習環境 karaage0703

Dockerを使った機械学習環境の構築方法株式会社松尾研究所で働いているからあげ（@karaage0703）です。松尾研究所では、機械学習（ここでは、予測モデル、画像認識からLLMまで幅広く扱います）を使う多数のプロジェクトが走っています。プロジェクトの特性は多種多様なので、環境構築方法は様々なのですが、松尾研究所... 続きを読む

「死んだ祖母の形見」とウソをつくことでBingチャットにCAPTCHAの画像認識を解かせることに成功

2023/10/03 38 users CAPTCHA 形見 Bingチャットセキュリティテスト

BingチャットはMicrosoftが提供しているチャットボットAIで、ユーザーは画像をアップロードして検索したり議論したりすることが可能です。そんなBingチャットは、画像認識型のセキュリティテストであるCAPTCHAの問題は解かないように設定されているのですが、架空の亡くなった祖母のロケットペンダントだとウソをついてB... 続きを読む

ChatGPT、“目”と“耳”の実装を発表　写真の内容を認識、発話機能でおしゃべりも可能に

2023/09/25 23 users Enterpr chatgpt 米OpenAI おしゃべり

米OpenAIのチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載された。今後2週間かけて、PlusユーザーとEnterpriseユーザーに展開するという。米OpenAIは9月25日（現地時間）、同社のチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載されたと発表した。今後2週間かけて、PlusユーザーとEnterpr... 続きを読む

Googleの無料AI｢Bard｣に大アプデ：画像認識、シェア機能、そして待望のメールアクセス

2023/09/19 19 users 西谷茂リチャード勝者待望 Google 概要

Googleの無料AI｢Bard｣に大アプデ：画像認識、シェア機能、そして待望のメールアクセス2023.09.19 20:3016,870 西谷茂リチャード加熱するAI開発レース。勝者はユーザー？ GoogleのAIツール｢Bard｣が大規模アップデートされ、かなり便利そうな新機能がいくつか備わりました。アップデートの概要をご紹介します。 Googleレ... 続きを読む

Google BardでOCR文字認識してみた【画像認識】 - Qiita

2023/07/18 24 users Qiita Google Bard

まず、英語版のバードに行きます。画像をアップロードしてほしい情報を入力すると教えていただけます。生年月日について聞いてみました "平成元年3月31日生"と正しく認識できてます有効期限も聞きました "2025年3月31日まで有効"と正しく認識できてますまとめ言われたことしかできない人は、仕事がAIに取られるかも... 続きを読む

「GPT-4」登場。多くの試験を「人間レベル」で合格、画像認識も

2023/03/15 15 users GPT-4 合格試験人間登場

ナムチャン/南原徹也＠甲子化学工業 on Twitter: "さつまいもの自動梱包ロボが開発され、海外では運用され始めています。従来は人がサイズを選別して、綺麗に入るように箱詰めしていまし

2022/09/16 220 users 南原サツマイモイスラエルロボ on Twitter

さつまいもの自動梱包ロボが開発され、海外では運用され始めています。従来は人がサイズを選別して、綺麗に入るように箱詰めしていましたが、このロボは画像認識でパズルを組み立てるように自動で箱詰めしてくれます。ちなみにこれもイスラエルです… https://t.co/GiaCvJOSTQ 続きを読む

誰もdlshogiには敵わなくなって将棋AIの世界が終わってしまった件 | やねうら王公式サイト

2022/06/27 10 users dlshogi ResNet 将棋ＡＩやねうら王囲碁AI

いま大会上位に位置するDeep Learning系の将棋AIは、評価関数として画像認識などでよく使われているResNetを用いている。ResNetについては機械学習を齧っている人ならば誰でも知ってるぐらい有名だと思うので、詳しい説明は割愛する。(ググれば詳しい説明がいくらでも出てくる) 囲碁AIの世界では、このResNetのブロック... 続きを読む

画像の機械学習が劣化する理由 - Qiita

2022/04/30 194 users 主旨 Qiita 大半著者ヒント

主旨単純に学習データを追加するだけでは学習が改善しないことがある。そのような場合へのヒントを著者の限られた経験の中から記述する。はじめに画像認識の機械学習を改善するためにはデータを追加すればよい。そう思っている人が大半だろう。ただ、データを追加したからといって必ずしも機械学習結果は改善しない... 続きを読む

IoT Connect Gatewayを使ってみた番外編第2回～インターンシップでStorage転送機能を使って開発してみた～ - NTT Communications Engineers' Blog

2022/03/29 7 users インターンシップ目次トレーナー番外編カメラ

目次はじめにインターンシップ参加にあたって体験内容 IoT Connect GatewayとStorage転送機能についての理解新サービスの提案開発環境カメラの開発 IoT Connect Gatewayの設定 Amazon Web Services上での画像認識画像認識結果の可視化インターンシップを終えた感想トレーナーからのコメントはじめにこんにち... 続きを読む

会議中にスマホを触る政治家を機械学習と画像認識で検出

2022/01/18 29 users 検出機械学習政治家 Instagram Twitter

会議の最中であるにもかかわらず、政治家が集中せずに手遊びしていたり居眠りしていたりする様子が中継に映り込むことがあります。これを、中継映像から機械学習と画像認識を用いて自動的に検出し、TwitterとInstagramのアカウントで映像付きで報告する仕組みが運用されています。 The Flemish Scrollers, 2021-2022 – D... 続きを読む

“目が不自由な人が一人でランニング” グーグル新技術開発へ | IT・ネット | NHKニュース

2021/08/29 10 users グーグルランニング腹部ランナー NHKニュース

目が不自由な人が一人でもランニングを楽しめるよう、大手IT企業のグーグルは、スマートフォンの画像認識の機能を使って走る方向をランナーに知らせる、新しい技術の開発に乗り出しました。グーグルの日本法人が開発しているのは、カメラを正面に向けた状態でランナーの腹部にスマートフォンを取り付け、画像認識のAI＝... 続きを読む

京セラ、図書館の蔵書点検を効率化　本の背表紙をAIで画像解析、一括読み取り - ITmedia NEWS

2021/02/25 28 users 京セラ蔵書点検背表紙 KCCS ITmedia News

京セラが、図書館の蔵書点検業務をサポートするサービス「SHELF EYE」の提供を始めた。AIによる画像認識で本の背表紙を読み取り、まとめて蔵書確認することで、職員が1冊ずつバーコードを読み取るこれまでの作業を効率化できる。京セラコミュニケーションシステム（京都市、KCCS）は2月25日、図書館の蔵書点検業務をサ... 続きを読む

Google、スマホカメラで心拍と呼吸数を認識する新機能。Pixelから提供 - Engadget 日本版

2021/02/04 8 users Pixel 心拍うお計測スタンド

Google のフィットネスアプリ Google Fit に、スマホカメラを使った呼吸数・心拍数計測機能が加わります。呼吸数の計測は、スタンドなどに立てたスマホのカメラで胸から上をとらえることで、服ごしの体の動きを画像認識で推測する仕組み。 Google Fit は従来から、スマホを持って歩いた際の位置情報や動きを使い、ウォ... 続きを読む

2020年超盛り上がり！自己教師あり学習の最前線まとめ！ - Qiita

2020/12/01 11 users Qiita ラベル SSL 手法教師

2020年に大きく盛り上がりを見せた分野に自己教師あり学習(=Self-Supervised Learning(SSL))があります。SSLとは名前の通り自分で教師を用意するような手法で、データ自身から独自のラベルを機械的に作り画像の表現を学ばせるようなタスクです。なので、人間によるラベルは用いません。最近の画像認識では特に大量のデ... 続きを読む

(1 - 25 / 138件)

次の25件 »