タグ OCR
人気順 5 users 10 users 100 users 500 users 1000 users日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました|Kotaro.Kinoshita
はじめに最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。 しかし、その多くは日本語をメインターゲットに開発されているわけではありません。日本語文書は、英数字に加えて、ひらがな、漢字、記号など数千種類の文字を識... 続きを読む
OCRはもう不要?視覚的特徴とテキストを高精度に捉える!次世代マルチモーダルAI『MPLUG-DOCOWL2』登場! - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 株式会社ulusageの技術ブログ生成AIです!今回は、PDF解析とドキュメントインテリジェンスの最先端技術 「MPLUG-DOCOWL2」 について、解説していきます。このモデルは、高解像度の... 続きを読む
帝国議会会議録検索システムで全期間の本文テキストデータが利用できるようになりました(付・プレスリリース)|国立国会図書館―National Diet Library
2024年8月23日 帝国議会会議録検索システムで全期間の本文テキストデータが利用できるようになりました(付・プレスリリース) 国立国会図書館は、帝国議会会議録検索システムにおいて、戦前・戦中期分(明治23(1890)年11月~昭和20(1945)年8月)の速記録の画像データ(合計約27万ページ)からOCR(光学的文字認識)... 続きを読む
GPT-4oをOCRとして使う - Re:ゼロから始めるML生活
OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか? さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。 普通にテキストでのやり取りをしつつも画像データを扱えるということで、「実はこれいい感じのOCRとして使えるんじゃね?」っ... 続きを読む
GPT-4oを使って2Dの図面から3DのCADモデルを作る
はじめに 株式会社ファースト・オートメーションCTOの田中(しろくま)です! 先日、 OpenAIからGPT-4oがリリース されました。 いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が... 続きを読む
OCR処理プログラム及び学習用データセットの公開について | NDLラボ
2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館(以下、「当館」とします。)が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR... 続きを読む
Pythonで始める ドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python
Transcript PythonͰ࢝ΊΔ υΩϡϝϯτɾΠϯςϦδΣϯεೖ 2021/10/1 5 Ubieגࣜձࣾ @yag_ays 2 Ԟా ༟थ Yuki Okuda Recruit → Sansan → Ubie @yag_ays ࣗݾհ https://yag-ays.github.io/ © Ubie, Inc. 3 ຊൃදʹ͍ͭͯ • ֓ཁ • υΩϡϝϯτɾΠϯςϦδΣϯεͷ֓ཁͷհ • PythonΛͬͨ։ൃࣄྫΛ௨ͯ͡ɺඞཁͱͳΔٕज़ཁૉʹ͍ͭͯհ • ࣮ࡍͷαʔϏε։ൃʹऔΓΉʹ͋ͨͬͯͷɺൃలతͳؔ࿈τϐοΫΛհ • ରͱ͢Δਓ • OCRը૾ղੳΛͬͨΞϓϦέʔγϣϯΛ࡞Γ͍ͨ։ൃऀ • ը૾ॲཧࣗવݴޠॲཧͷ࣮αʔ... 続きを読む
ASCII.jp:「目標はRPAではなく“知的プロセス自動化”」Kofax CEOが戦略語る (1/2)
RPAツール「Kofax Kapow(コファックス カパウ)」などの業務プロセス自動化ソフトウェアを提供する米Kofaxが2018年7月10日、都内で事業戦略説明会を開催した。来日したCEOのレイノルズ・ビッシュ氏は、Kofaxが目指すものはRPAではなく、OCRやワークフローなどの機能も備える統合基盤を用いた業務プロセス全体の「インテ... 続きを読む
Google Cloud Vision API の 光学式文字認識(OCR)機能 試してみた - freee Developers Blog
2017 - 12 - 10 Google Cloud Vision API の 光学式文字認識(OCR)機能 試してみた こんにちは!freee で モバイルアプリ 開発を担当している RyoAbe です。 freee Developers Advent Calendar の10日目として、 Google Cloud Vision API の導入 〜 OCR 機能の検証の結果についてまとめた記事... 続きを読む
AIベンチャーが実現した“99.2%”手書き文字認識ソフトの重要性──日本企業がAIを導入できない理由とは (1/2) - ITmedia NEWS
99.22%という、高い手書き文字認識精度をAIで実現した日本のベンチャー企業Cogent Labs。AI導入を検討する企業にとっての手書き文字認識の重要性を語る。 「Tegaki」という日本語の手書き文字認識(OCR)サービスがある。そのソフトはディープラーニングなど機械学習のアルゴリズムを用い、認識精度は99.22%という精度で、平仮名、片仮名、漢字、数字、アルファベット、記号を認識できる。申... 続きを読む
無料で画像・動画・保護されたPDFなどからテキスト文字列をOCRでコピーできるFirefoxアドオン「Copyfish」 - GIGAZINE
ブラウザFirefoxのアドオン「 Copyfish 」は、 OCR (光学文字認識)機能を追加して、ムービーの字幕やサイトロゴ、文字画像などを文字コード形式に変換することができます。テキスト変換すると同時に翻訳することも可能ということなので、さっそく使ってみました。 Copyfish :: Add-ons for Firefox https://addons.mozilla.org/en-us/... 続きを読む
Adobe、iOS/Androidで撮影した文書をPDF化できる「Adobe Scan」を無償提供 - 窓の杜
ニュース Adobe、iOS/Androidで撮影した文書をPDF化できる「Adobe Scan」を無償提供 “Adobe Sensei”で自動補正。OCRによるテキストの認識にも対応 樽井 秀人 2017年6月1日 17:10 iOS版「Adobe Scan」 米Adobe Systems Incorporatedは1日(現地時間)、iOS/Android向けのドキュメントスキャナーアプリ「A... 続きを読む
認識率98.66%?!たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた - BITA デジマラボ
Artificial Intelligence for Everyday Use: Coming Soon How four programmers with almost no knowledge of Japanese designed software to read handwriting. 気になりすぎたので、早速取材にいってみたところ、Reactive Inc.のデータサイエンティスト... 続きを読む
記者の眼 - 止まらないOCRの進化、江戸時代のくずし字攻略が目の前に:ITpro
約2カ月前、あるニュースに目が釘付けになった。凸版印刷が、江戸時代以前のくずし字を自動解読し、テキストデータ化する「くずし字OCR」なる技術を開発した、というのだ。多くの人にとっては日常的なニュースの一つかもしれない。しかし、大学時代に日本史を専攻・研究していた筆者にとっては驚くべき事態だ。 くずし字は、そう簡単に読めるものではない。少なくとも筆者はマスターできなかった。いくらテクノロジーの進化が... 続きを読む
ASCII.jp:凸版印刷、江戸以前のくずし字を高精度にOCRする技術を開発
「源氏物語」(絵入本,国文研所蔵)のOCRによるテキストデータ化 凸版印刷は7月3日、江戸期以前のくずし字で記されている古典籍の文字を判別し、テキストデータ化するOCR技術を開発したと発表した。 専門家の減少、資料の経年劣化という問題に加え、大規模災害によって失われる可能性もある歴史資料のデジタル化の必要性が高まっている。しかし総数100万点以上ともいわれる江戸期以前のくずし字で記されている古典籍... 続きを読む
Microsoft、iPhone/Android向けスキャンアプリ「Office Lens」公開 - ITmedia ニュース
名刺やホワイトボードを撮影し、OCRで文書として保存できるMicrosoftの「Office Lens」のiPhone版と、Android版プレビューが公開された。取り込んだコンテンツはOneNoteやWord、PDFとしてOneDrive上に保存したりメールに添付したりできる。 米Microsoftは4月2日(現地時間)、スキャンアプリ「Office Lens」のiPhone版をリリースしたと発... 続きを読む
OneNoteがEvernoteを猛追? iPad版でOCRと手書きメモにも対応 : ギズモード・ジャパン
iPad , iPad/iPod/iPhone/iTunes , 企業 , マイクロソフト OneNoteがEvernoteを猛追? iPad版でOCRと手書きメモにも対応 2015.02.23 10:00 着実に進化してます。 単なるメモアプリとしてくくれないほど多機能なマイクロソフトの「One Note」。ここ数年でiOS版やAndroid版、Mac版やWeb版も用意され、マルチプラットフォー... 続きを読む
「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」 原子力規制庁、サイトを修正 - ITmedia ニュース
原子力規制庁がWebサイトで公開している資料の1つで、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼく)と「口」(くち)になっていると指摘され、同庁が修正する騒ぎがあった。 原子力規制委員会がWebサイトで公開している資料の中で、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼく)と「口」(くち)になっていたとネットユーザーに指摘され、サイトを公開している原子力規制庁が修正する騒ぎがあっ... 続きを読む
大飯原発3 , 4 号機運転差止請求事件 判決言渡 「当裁判所の判断」 - kom's blog
2014-05-21 大飯原発3 , 4 号機運転差止請求事件 判決言渡 「当裁判所の判断」 おそらく歴史に残ることになる判決文なので紹介します。歴史に残る、というのは、再審でひっくり返るにしろなんにしろ、という意味です。いろいろ含蓄深い。 以下、 http://eforum.jp/2014-05-21-ooihanketsu.pdf をOCRで翻刻。ざくっとチェック・手直しはしましたが、まだ読み... 続きを読む
iOSで日本語OCR!ビルド編〜iOS SDK 6.1 + tesseract-ocr 3.02〜 | Developers.IO
iOSで日本語OCR!ビルド編〜iOS SDK 6.1 + tesseract-ocr 3.02〜 NEW: 2013年05月13日 最近iOSでOCR(Optical Character Recognition:工学文字認識)をしたいとの声をよく耳にするので調査してみました。 オープンソースのOCRエンジン「tesseract-ocr」 オープンソースで日本語に対応したOCRエンジンを探してみる... 続きを読む
無料でOCR(光学文字認識)したかったらGoogleDriveを試してみるといいかもね | 56docブログ
無料でOCR(光学文字認識)したかったらGoogleDriveを試してみるといいかもね 【オンラインストレージ】 wrote on 2012/11/15 http://blog.56doc.net/Entry/454/無料でOCR(光学文字認識)したかったらGoogleDriveを試してみるといいかもね 昨日ツイッターのフォロワーさんがTLで「人を殴ったらかなり痛いくらいの紙書類の束渡されて、一晩... 続きを読む
PDFの文字をテキスト化! オンラインで簡単に使えるOCRサービス : ライフハッカー[日本版]
Webツール , 仕事術 , 生産性向上 PDFの文字をテキスト化! オンラインで簡単に使えるOCRサービス 2012.06.05 23:00 コメント数:[ 0 ] Tweet 「Free Online OCR」は無料で利用できるOCRサービス。OCRは画像などに含まれる文字を認識してくれるもので、画像およびPDF内の文字をテキストやWordに変換してくれるサービスです。 以下に使ってみた様子を... 続きを読む
[iPhone] iPhoneのスキャナー(OCR)アプリはどれが一番いいの? | Appleちゃんねる
Follow @applechinfo Jotnot DocScanner Genius Scam CamScaner RectAce 2 :iPhone774G [↓] :2011/02/10(木) 09:36:56 ID:Ve7DVQqK0 [PC] 画質や他との連携考えたらDocScannerが1番と思った。 230円だし。 DocScanner (Version 5.0.5) カテゴリ: ... 続きを読む
Google DocsのOCR変換機能が日本語に対応 - ITmedia News
ニュースGoogle DocsのOCR変換機能が日本語に対応PDFファイルやスキャナで読み込んだ文書の画像ファイルをGoogle Docsにアップロードすると、編集可能なテキストファイルに変換できる機能が横書きの日本語に対応した。2011年03月01日 15時29分 更新米Googleは2月28日(現地時間)、昨年6月にGoogle Docsに追加したOCR(光学式文字認識)機能を、新たに日本語を... 続きを読む
画像ファイルをテキスト化してくれる「n1ne@freeOCR」(無料) : ライフハッカー[日本版]
GTD , Webツール , その他 , 仕事術 , 生活術 , 節約術 画像ファイルをテキスト化してくれる「n1ne@freeOCR」(無料) 掲載日時:2010.05.06 20:00 コメント [0] , トラックバック [0] OCRで書類を読ませるために、わざわざ一度プリントしてから、ドキュメントスキャナに...なんていう経験はないでしょうか? ブログ「Blog.IKUBON.com... 続きを読む