タグ「画像認識」 - はてブログ

タグ画像認識

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 25 / 130件)

イーロン・マスク氏のLLM「Grok」、1.5更新で画像認識可能に

2024/04/13 9 users LLM スクリ Grok マルチモーダルモデル手書き

イーロン・マスク氏の米AI企業xAIは4月12日（現地時間）、昨年11月に発表した独自LLM（大規模言語モデル）「Grok」の更新版「Grok-1.5V」を発表した。同社初のマルチモーダルモデルで、画像を認識する。既存のGrokユーザーに間もなく提供される予定。 1.5Vの最大の特徴は画像認識能力だ。手書きのフローチャートやスクリ... 続きを読む

中学生でもわかる深層学習

2024/03/29 508 users 深層学習中学生ニューラルネットワーク勾配降下法音声

第1章　理論編・深層学習とは (p.13-) ・ニューラルネットワークとは (p.31-) ・どうやって学習するか: 勾配降下法 (p.57-) ・深層学習の注意点 (p.91-) 第2章　応用編・分類問題 (p.110-) ・画像認識 (p.120-) ・音声認識／自然言語処理 (p.151-) ・講演のまとめ (p.167-) 続きを読む

Dockerで構築する機械学習環境【2024年版】

2024/03/11 192 users Docker LLM 機械学習環境 karaage0703

Dockerを使った機械学習環境の構築方法株式会社松尾研究所で働いているからあげ（@karaage0703）です。松尾研究所では、機械学習（ここでは、予測モデル、画像認識からLLMまで幅広く扱います）を使う多数のプロジェクトが走っています。プロジェクトの特性は多種多様なので、環境構築方法は様々なのですが、松尾研究所... 続きを読む

「死んだ祖母の形見」とウソをつくことでBingチャットにCAPTCHAの画像認識を解かせることに成功

2023/10/03 38 users CAPTCHA 形見 Bingチャットセキュリティテスト

BingチャットはMicrosoftが提供しているチャットボットAIで、ユーザーは画像をアップロードして検索したり議論したりすることが可能です。そんなBingチャットは、画像認識型のセキュリティテストであるCAPTCHAの問題は解かないように設定されているのですが、架空の亡くなった祖母のロケットペンダントだとウソをついてB... 続きを読む

ChatGPT、“目”と“耳”の実装を発表　写真の内容を認識、発話機能でおしゃべりも可能に

2023/09/25 23 users Enterpr chatgpt 米OpenAI おしゃべり

米OpenAIのチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載された。今後2週間かけて、PlusユーザーとEnterpriseユーザーに展開するという。米OpenAIは9月25日（現地時間）、同社のチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載されたと発表した。今後2週間かけて、PlusユーザーとEnterpr... 続きを読む

Googleの無料AI｢Bard｣に大アプデ：画像認識、シェア機能、そして待望のメールアクセス

2023/09/19 19 users 西谷茂リチャード勝者待望 Google 概要

Googleの無料AI｢Bard｣に大アプデ：画像認識、シェア機能、そして待望のメールアクセス2023.09.19 20:3016,870 西谷茂リチャード加熱するAI開発レース。勝者はユーザー？ GoogleのAIツール｢Bard｣が大規模アップデートされ、かなり便利そうな新機能がいくつか備わりました。アップデートの概要をご紹介します。 Googleレ... 続きを読む

Google BardでOCR文字認識してみた【画像認識】 - Qiita

2023/07/18 24 users Qiita Google Bard

まず、英語版のバードに行きます。画像をアップロードしてほしい情報を入力すると教えていただけます。生年月日について聞いてみました "平成元年3月31日生"と正しく認識できてます有効期限も聞きました "2025年3月31日まで有効"と正しく認識できてますまとめ言われたことしかできない人は、仕事がAIに取られるかも... 続きを読む

「GPT-4」登場。多くの試験を「人間レベル」で合格、画像認識も

2023/03/15 15 users GPT-4 合格試験人間登場

ナムチャン/南原徹也＠甲子化学工業 on Twitter: "さつまいもの自動梱包ロボが開発され、海外では運用され始めています。従来は人がサイズを選別して、綺麗に入るように箱詰めしていまし

2022/09/16 220 users 南原サツマイモイスラエルロボ on Twitter

さつまいもの自動梱包ロボが開発され、海外では運用され始めています。従来は人がサイズを選別して、綺麗に入るように箱詰めしていましたが、このロボは画像認識でパズルを組み立てるように自動で箱詰めしてくれます。ちなみにこれもイスラエルです… https://t.co/GiaCvJOSTQ 続きを読む

誰もdlshogiには敵わなくなって将棋AIの世界が終わってしまった件 | やねうら王公式サイト

2022/06/27 10 users dlshogi ResNet 将棋ＡＩやねうら王囲碁AI

いま大会上位に位置するDeep Learning系の将棋AIは、評価関数として画像認識などでよく使われているResNetを用いている。ResNetについては機械学習を齧っている人ならば誰でも知ってるぐらい有名だと思うので、詳しい説明は割愛する。(ググれば詳しい説明がいくらでも出てくる) 囲碁AIの世界では、このResNetのブロック... 続きを読む

画像の機械学習が劣化する理由 - Qiita

2022/04/30 194 users 主旨 Qiita 大半著者ヒント

主旨単純に学習データを追加するだけでは学習が改善しないことがある。そのような場合へのヒントを著者の限られた経験の中から記述する。はじめに画像認識の機械学習を改善するためにはデータを追加すればよい。そう思っている人が大半だろう。ただ、データを追加したからといって必ずしも機械学習結果は改善しない... 続きを読む

IoT Connect Gatewayを使ってみた番外編第2回～インターンシップでStorage転送機能を使って開発してみた～ - NTT Communications Engineers' Blog

2022/03/29 7 users インターンシップ目次トレーナー番外編カメラ

目次はじめにインターンシップ参加にあたって体験内容 IoT Connect GatewayとStorage転送機能についての理解新サービスの提案開発環境カメラの開発 IoT Connect Gatewayの設定 Amazon Web Services上での画像認識画像認識結果の可視化インターンシップを終えた感想トレーナーからのコメントはじめにこんにち... 続きを読む

会議中にスマホを触る政治家を機械学習と画像認識で検出

2022/01/18 29 users 検出機械学習政治家 Instagram Twitter

会議の最中であるにもかかわらず、政治家が集中せずに手遊びしていたり居眠りしていたりする様子が中継に映り込むことがあります。これを、中継映像から機械学習と画像認識を用いて自動的に検出し、TwitterとInstagramのアカウントで映像付きで報告する仕組みが運用されています。 The Flemish Scrollers, 2021-2022 – D... 続きを読む

“目が不自由な人が一人でランニング” グーグル新技術開発へ | IT・ネット | NHKニュース

2021/08/29 10 users グーグルランニング腹部ランナー NHKニュース

目が不自由な人が一人でもランニングを楽しめるよう、大手IT企業のグーグルは、スマートフォンの画像認識の機能を使って走る方向をランナーに知らせる、新しい技術の開発に乗り出しました。グーグルの日本法人が開発しているのは、カメラを正面に向けた状態でランナーの腹部にスマートフォンを取り付け、画像認識のAI＝... 続きを読む

京セラ、図書館の蔵書点検を効率化　本の背表紙をAIで画像解析、一括読み取り - ITmedia NEWS

2021/02/25 28 users 京セラ蔵書点検背表紙 KCCS ITmedia News

京セラが、図書館の蔵書点検業務をサポートするサービス「SHELF EYE」の提供を始めた。AIによる画像認識で本の背表紙を読み取り、まとめて蔵書確認することで、職員が1冊ずつバーコードを読み取るこれまでの作業を効率化できる。京セラコミュニケーションシステム（京都市、KCCS）は2月25日、図書館の蔵書点検業務をサ... 続きを読む

Google、スマホカメラで心拍と呼吸数を認識する新機能。Pixelから提供 - Engadget 日本版

2021/02/04 8 users Pixel 心拍うお計測スタンド

Google のフィットネスアプリ Google Fit に、スマホカメラを使った呼吸数・心拍数計測機能が加わります。呼吸数の計測は、スタンドなどに立てたスマホのカメラで胸から上をとらえることで、服ごしの体の動きを画像認識で推測する仕組み。 Google Fit は従来から、スマホを持って歩いた際の位置情報や動きを使い、ウォ... 続きを読む

2020年超盛り上がり！自己教師あり学習の最前線まとめ！ - Qiita

2020/12/01 11 users Qiita ラベル SSL 手法教師

2020年に大きく盛り上がりを見せた分野に自己教師あり学習(=Self-Supervised Learning(SSL))があります。SSLとは名前の通り自分で教師を用意するような手法で、データ自身から独自のラベルを機械的に作り画像の表現を学ばせるようなタスクです。なので、人間によるラベルは用いません。最近の画像認識では特に大量のデ... 続きを読む

ラズパイで画像認識、1日30円～のエッジAIが快進撃 - ITmedia NEWS

2020/11/13 213 users ラズパイ快進撃エッジAI ITmedia News

3000円台で手に入るシングルボードコンピュータ「Raspberry Pi」の性能をフルに生かした、エッジAIプラットフォームを展開しているスタートアップ企業、Ideinを取材した。 3000円台で手に入るシングルボードコンピュータ「Raspberry Pi」の性能をフルに生かした、エッジAIプラットフォームを展開しているスタートアップ... 続きを読む

画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説！ - Qiita

2020/10/12 351 users Qiita Transformer frac Sota AI界

0. 忙しい方へ完全に畳み込みとさようならしてSoTA達成したよ Vision Transformerの重要なことは次の3つだよ画像パッチを単語のように扱うよアーキテクチャはTransformerのエンコーダー部分だよ巨大なデータセットJFT-300Mで事前学習するよ SoTAを上回る性能を約$\frac{1}{15}$の計算コストで得られたよ事前学習デ... 続きを読む

TensorFLowの機械学習による画像認識をScratch上で！子どもでもできるAI活用プログラミング - どれ使う？プログラミング教育ツール - 窓の杜

2020/09/09 8 users TensorFlow どれ使う機械学習子ども

物体検出のDeepLearning読むべき論文7選とポイントまとめ【EfficientDetまでの道筋】 - Qiita

2020/09/04 15 users Qiita Sota deeplearning 道筋脚光

お久しぶりです。 2012年のHintonさんのAlexNetによるILSVRCでの圧勝を皮切りに、画像認識の世界でもDeepLearningが脚光を浴びることとなりました。物体検出の世界でも現在DeepLearningを用いたモデルが主流になっています。 https://paperswithcode.com/sota/object-detection-on-coco を見ると、 COCO test-devにおい... 続きを読む

農業スタートアップのiFarmが4.2億円調達、画像認識と機械学習で約120種類の栽培を屋内垂直農園で自動化 | TechCrunch Japan

2020/08/22 6 users 栽培 TechCrunch JAPAN 機械学習ラウンド

垂直農法技術を提供するiFarmは、既存投資家であるGagarin Capitalが主導する400万ドル（約4億2300万円）のシードラウンドで資金を調達した。このラウンドのほかの投資家として、Matrix Capital、Impulse VC、IMI.VC、複数のエンジェル投資家が含まれている。 iFarmはフィンランド拠点のスタートアップで、食品加工会社... 続きを読む

Fashion-MNIST：ファッション商品（写真）の画像データセット：AI・機械学習のデータセット辞典 - ＠IT

2020/05/28 5 users TensorFlow Keras PyTorch データ説明

データセット「Fashion-MNIST」について説明。7万枚の写真（ファッション商品）の「画像＋ラベル」データが無料でダウンロードでき、画像認識などのディープラーニングに利用できる。scikit-learn、Keras／tf.keras、TensorFlow、PyTorchにおける利用コードも紹介。続きを読む

画像認識と深層学習

2020/05/22 15 users 深層学習セマ祐介物体検出内田

画像認識と深層学習 1. Mobility Technologies Co., Ltd. 画像認識と深層学習株式会社Mobility Technologies 内田祐介日本ロボット学会第126回ロボット工学セミナー 2. Mobility Technologies Co., Ltd. 深層学習が様々な画像認識タスクで活用されるようになった • クラス分類、物体検出、ランドマーク検出、セマ... 続きを読む

Raspberry Pi 3B + Webカメラを使って機械学習のためのロボット自動走行用データセット(画像＋ラベル)を用意しよう。 - Qiita

2020/05/17 8 users Qiita FPGA 手動背景ラベル付け

概要さて、最近話題の機械学習ですが（多分）、画像認識や自然言語処理等、まだまだできることに限りがあるように思われます。すごい人、がんばれ！背景としまして、（長いので読まなくていいです）元々はFPGAにPcamを刺して画像収集をして手動でラベル付けを済ませて学習させたのですが、その学習済みモデルはなんと... 続きを読む

(1 - 25 / 130件)

次の25件 »