タグ 文字認識
人気順 10 users 50 users 100 users 500 users 1000 users帝国議会会議録検索システムで全期間の本文テキストデータが利用できるようになりました(付・プレスリリース)|国立国会図書館―National Diet Library
2024年8月23日 帝国議会会議録検索システムで全期間の本文テキストデータが利用できるようになりました(付・プレスリリース) 国立国会図書館は、帝国議会会議録検索システムにおいて、戦前・戦中期分(明治23(1890)年11月~昭和20(1945)年8月)の速記録の画像データ(合計約27万ページ)からOCR(光学的文字認識)... 続きを読む
Florence-2をわかりやすく解説、なぜマイクロソフトの新AIは軽量でも大規模超えなのか
画像認識分野では、これまでタスク特化型のモデルが主流だった。たとえば、物体検出にはYOLOモデル、文字認識にはTesseract OCRなど、特定のタスクに特化したモデルが広く使用されてきた。 しかし、この状況を大きく変える可能性を持つモデルが登場し、AI開発コミュニティで注目を集めている。マイクロソフトのAzure AI... 続きを読む
GPT-4Vのモデルを利用してOCRできるか試してみた - Taste of Tech Topics
こんにちは、安部です。 気温の上下に翻弄されて最近風邪をひいてしまいましたが、皆さま元気にお過ごしでしょうか。 今回は、GPT-4Vのモデルを利用して、OCRができるか試していきます。 GPT-4Vによって、「ChatGPTに目ができた」などと騒がれましたが、文字認識はどれくらいできるのでしょうか? 得意分野ではなさそう... 続きを読む
iOSで文字認識(Text Recognition)
iOS 13以降で、待望だった「文字認識」機能が使えるようになりました。カメラなどで撮影した画像内にある文字を読み取る [1] ことができます。 iOS 9からあった「文字検出」との違い 文字認識は、Visionフレームワークの一機能として追加されました。 一方、Core ImageのCIDetectorというクラスでは、CIDetectorTypeText... 続きを読む
「文字を打つのが面倒」進化するLINEの新常識 ミュート・スクショ・文字認識…若者が使う便利機能を紹介|FNNプライムオンライン
寝ている相手を起こさないように…搭載されたばかりの新機能 2022年7月、LINEに新たな機能が追加された。その名も「ミュートメッセージ機能」。 夜遅くにLINEを送ると「相手を起こしてしまうのでは?」と気を使ってしまうが、そんな時、この機能がとっても便利! この記事の画像(25枚) 使い方は、LINEの右上にある設定... 続きを読む
写真を見ずに幾何学図形で学習できる画像認識AIを開発! 人間の手間が大幅に減る? - ナゾロジー
画像認識AIというとどんなイメージが浮かぶでしょうか? 身近な例では、スマホの顔認証や、画像の文字をテキスト化する文字認識などに使われるAI技術が挙げられます。 画像認識AIが世に出されるには、開発段階で使用されるデータセットに大量の写真が必要です。 しかし、データセットの作成は、従来のやり方では人間の作... 続きを読む
深層学習時代の文字認識とその周辺 / OCR and related technologies in the Deep Learning era
Transcript 深層学習時代の⽂字認識とその周辺 技術本部 DSOC R&D Automation Group 研究員 宮本 優⼀ 【SenseTimeJapan × Sansan】画像処理勉強会 Data Strategy and Operation Center 自己紹介 2010年〜2015年 デジタルカメラメーカー • 画像処理系研究開発 2015年〜2020年 広告制作会社 • イベントなどで使われる画像... 続きを読む
PythonとWinRT OCRで文字認識 - Qiita
pip install winrt # Pillowを使う人はインストール #pip install pillow # OpenCVを使う人はインストール #pip install opencv-python # API経由で使う人はインストール #pip install fastapi uvicorn # Jupyter, Colaboratorerはインストール #pip install --upgrade jupyter_http_over_ws>=0.0.7 #jupyter serverexte... 続きを読む
AIによる「超」軽量なOCR(文字認識)システムが登場【GitHub】 | アイブン
光学式文字認識(OCR)システムは、文書の電子化・工場での文字自動検出・オンライン教育・地図作成など幅広く使用されています。 BaiduのYuning Duらは、超軽量のOCRシステムであるPP-OCRを提案しています。 文字認識結果(図は論文から引用) PP-OCRはテキスト検出、検出フレーム修正などで構成されています。全体のサイ... 続きを読む
日本語OCRはなぜ難しい? NAVERのエンジニアが語る、テキスト検出における課題と解決策 - ログミーTech
日本語OCRはなぜ難しい? NAVERのエンジニアが語る、テキスト検出における課題と解決策 NAVER ClovaのOCR(光学的文字認識) #1/2 2019年11月20、21日の2日間、LINE株式会社が主催するエンジニア向け技術カンファレンス「LINE DEVELOPER DAY 2019」が開催されました。1日目は「Engineering」をテーマに、LINEの技術の深... 続きを読む
佐川急便、配送伝票の入力をAIシステムで自動化 かすれた数字なども高精度に読み取り - ITmedia エンタープライズ
佐川急便、SGシステム、フューチャーアーキテクトは2019年8月2日、佐川急便の配送伝票入力業務を自動化するAIシステムを2019年7月に本稼働させたと発表した。 同システムは、深層学習を活用した文字認識などのAI技術をベースに、配送伝票の情報を自動で読み取り、既存システムへのデータ連携までを自動化する。同社の配... 続きを読む
LINE MUSIC、強引な「プレイリスト引っ越し機能」を発表。プレイリストをスマホで撮って文字認識 - Engadget 日本版
LINEは「LINE MUSIC」で"強引な"プレイリスト引っ越し機能を発表しました。 LINE MUSICの新機能の1つとして発表されたこの機能は、他のサービスのプレイリストをスマホで撮ると、LINE MUSICの聴き放題楽曲で同じタイトルが入ったプレイリストを作成するというもの。プレイリストの内容を文字認識によって判別し、聴き放... 続きを読む
ニューラルネットワーク実装入門 - UUUM攻殻機動隊
2017 - 02 - 21 ニューラルネットワーク実装入門 コンピューターが賢くなって、人間がやる仕事が減るといいなと思っているkitabatakeです。 今流行りのニューラルネットワークについて説明したいと思います。 ニューラルネットワークとは 脳神経系をモデルにした情報処理システムで、 文字認識や、音声認識など、コンピュータが苦手とされている処理に対して有効です。 脳の中には多数のニューロン... 続きを読む
レオパレス21、入居者情報の入力業務にAI活用の文字認識システムを導入 - CNET Japan
レオパレス21は5月26日、AI insideと協業し、入居者情報入力業務に文字認識システム「Intelligent OCR」を導入すると発表した。年間約2万900時間の作業時間削減に結び付くとしている。導入開始は6月1日。 Intelligent OCRは、AI(人工知能)を活用し、手書き文字を含む書類の文字認識ができる技術。AI insideは、ニューラルネットワークを活用した文字認識に関する... 続きを読む
富士通、少数データで効率よく学習できる深層学習技術--中国古文書文字で成果 - CNET Japan
富士通研究開発中心(FRDC)は2月21日、中国古文書文字の文字認識において、少数の学習データでも高精度な文字認識を実現する深層学習技術を開発したと発表した。 同技術は、古文書の文字画像と文字を紐づけたデータ(教師データ)で学習させる深層学習の認識エンジンと、文字とは紐づけられていない2つの文字画像が、同じ文字かどうか特徴を学習する深層学習エンジンを組み合わせたもの。一文字当たり約70%少ない教師... 続きを読む
文字認識はCNNで終わるのか?
文字認識はCNNで終わるのか? 1. 文字認識は CNNで 終わるのか? 内田誠一・井手将太(九大) Dipesh Dangol(Univ. Kaiserslautern) Convolutional Neural Network 2. 突然ですが… 北九州市をご存じでしょうか? ここです 治安で度々お騒がせ JNN twitter 現在地 3. 突然ですが… 北九州市をご存じでしょうか?... 続きを読む
素人でもディープラーニングができる「NVIDIA DIGITS」で文字認識をやってみた (1/2) - ITmedia PC USER
素人でもディープラーニングが使えるようになる講座がある。そんな案内がNVIDIAから届いた。 ディープラーニングといえば、 2016年に囲碁でイ・セドルに勝利した「Alpha Go」 や、自動車の自動運転技術に採用されているアルゴリズムだ。 一般的に、ディープラーニングを自分でいじってみようと思うとPythonなどプログラミング言語の理解や、GPUの用意などハードウェア的な面である程度のハードルが... 続きを読む
【iOS9】Core Image の新機能:文字認識 /追加フィルタ47種 - Over&Out その後
iOS, 画像処理先日、Gunosy さん主催の勉強会「WWDC Afterparty Roppongi」にて標題の発表をさせていただきました。 iOS 9 の新機能 Core Image 編 from Shuichi Tsutsumi タイトルの通り、iOS 9 の Core Image の新機能について紹介&デモ *1 しました。 概要大きく分けて、文字認識、新フィルタの紹介の2つ。 文字認識... 続きを読む
紙の資料をデジタル化できる「スマホ用スキャナ」アプリ5選 | ライフハッカー[日本版]
旅行中にもらった領収証や、ホワイトボードの板書の内容、封筒に描いたスケッチなどを保存したい時は、スマートフォンのスキャナアプリを使えば簡単です。本記事でご紹介するオススメのアプリなら、紙資料のスナップショットを撮って、クラウド上に保存できるので、スキャンしたデータを後で別のデバイスからも参照できます(文字認識も可能です)。 それでは、領収証や板書、手書きのメモなどの記録に役立つ選りすぐりのスマート... 続きを読む
第1回 機械学習の基礎 · levelfour/machine-learning-2014 Wiki · GitHub
機械学習には様々な種類・アルゴリズムが存在するが、それらにほとんど100%共通して言えるのは、機械学習とは 「データの分類を計算機で自動化する」 技術である。 現代社会では至る所に機械学習が応用されているが、スパムフィルタも言語判定も文字認識も含め普く機械学習は 「計算機で自動的に受け取ったデータをいずれかのクラスに分類する」ことになる。 機械学習の種類 機械学習には学習の仕方によっていくつかの種... 続きを読む
富士通が指輪型デバイスを開発、ジェスチャーで文字認識が可能 - ケータイ Watch
ニュース 富士通が指輪型デバイスを開発、ジェスチャーで文字認識が可能 作業現場向けの操作デバイス、2015年度中の商用化を目指す (2015/1/13 14:55) 富士通研究所は、スマートフォンなどとBluetoothで連携し、指先のジェスチャー操作で操作を行ったり、空中に書いた文字を認識したりできる指輪型ウェアラブルデバイスを開発したと発表した。製造現場、保守点検などの作業現場に向けた製品で、... 続きを読む
クジラ飛行机「仕事に役立つJavaScript入門」 - JavaScriptで自動文字認識! Microsoftの無料OCRライブラリ...:ITpro
「JavaScriptで自動文字認識」プログラムについての解説の前編では、JavaScriptを使って、画像に書かれている文字をテキストで抽出するプログラムを作りました。 前編で簡単なテストプログラムを作るところまで進めましたが、今回は、複数の画像から連続で文字認識をして、テキストファイルに保存するプログラムを作ってみましょう。Webサイトのスクリーンキャプチャーや、スキャンした画像などをテキスト... 続きを読む
クジラ飛行机「仕事に役立つJavaScript入門」 - JavaScriptで自動文字認識! Microsoftの無料OCRライブラリ...:ITpro
今回は、画像の中に書かれている文字(テキスト)を抽出するプログラムを作ってみましょう。スマートフォンやデジカメで手軽に写真を撮れるようになった昨今では、撮影・スキャンした手書きメモや文字データなどをテキストに変換したい場面が多いのではないでしょうか。 画像の文字認識をするプログラム自体を一から作るのは大変です。Microsoftが提供する「MODI」のOCR機能を利用すれば、JavaScriptか... 続きを読む
Evernote の画像認識の仕組みについて | Evernote日本語版ブログ
(この記事は開発者向けの内容ですが、画像内の文字認識をより高めるためのヒントになる情報も含んでいます。Evernote に保存した画像の文字検索については、こちらの記事もご覧ください。) 画像に含まれるテキストの検索は、Evernote の最も人気ある機能の一つです。本日は、この仕組みについてご説明し、よくあるご質問に対してお答えします。 画像の処理方法 同期することによりノートが Evernot... 続きを読む
ドコモ、開発者向けのAPIサイトを提供へ--音声認識など5種類 - CNET Japan
NTTドコモは10月18日、開発者向けのAPI提供サイト「docomo Developer support」を11月11日に開設すると発表した。スマートフォン向けサービスやアプリの開発者に対して、同社が保有するAPIを提供する。利用料金は無料。 当初は、電話機に向かって発声した音声内容をテキスト化する「音声認識」、画像に書かれている単語とその位置を認識する「文字認識」、会話文のテキストをもとに雑談... 続きを読む