タグ OCR
人気順 5 users 10 users 50 users 500 users 1000 users日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました|Kotaro.Kinoshita
はじめに最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。 しかし、その多くは日本語をメインターゲットに開発されているわけではありません。日本語文書は、英数字に加えて、ひらがな、漢字、記号など数千種類の文字を識... 続きを読む
OCRはもう不要?視覚的特徴とテキストを高精度に捉える!次世代マルチモーダルAI『MPLUG-DOCOWL2』登場! - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 株式会社ulusageの技術ブログ生成AIです!今回は、PDF解析とドキュメントインテリジェンスの最先端技術 「MPLUG-DOCOWL2」 について、解説していきます。このモデルは、高解像度の... 続きを読む
GPT-4oをOCRとして使う - Re:ゼロから始めるML生活
OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか? さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。 普通にテキストでのやり取りをしつつも画像データを扱えるということで、「実はこれいい感じのOCRとして使えるんじゃね?」っ... 続きを読む
GPT-4oを使って2Dの図面から3DのCADモデルを作る
はじめに 株式会社ファースト・オートメーションCTOの田中(しろくま)です! 先日、 OpenAIからGPT-4oがリリース されました。 いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が... 続きを読む
OCR処理プログラム及び学習用データセットの公開について | NDLラボ
2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館(以下、「当館」とします。)が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR... 続きを読む
Pythonで始める ドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python
Transcript PythonͰ࢝ΊΔ υΩϡϝϯτɾΠϯςϦδΣϯεೖ 2021/10/1 5 Ubieגࣜձࣾ @yag_ays 2 Ԟా ༟थ Yuki Okuda Recruit → Sansan → Ubie @yag_ays ࣗݾհ https://yag-ays.github.io/ © Ubie, Inc. 3 ຊൃදʹ͍ͭͯ • ֓ཁ • υΩϡϝϯτɾΠϯςϦδΣϯεͷ֓ཁͷհ • PythonΛͬͨ։ൃࣄྫΛ௨ͯ͡ɺඞཁͱͳΔٕज़ཁૉʹ͍ͭͯհ • ࣮ࡍͷαʔϏε։ൃʹऔΓΉʹ͋ͨͬͯͷɺൃలతͳؔ࿈τϐοΫΛհ • ରͱ͢Δਓ • OCRը૾ղੳΛͬͨΞϓϦέʔγϣϯΛ࡞Γ͍ͨ։ൃऀ • ը૾ॲཧࣗવݴޠॲཧͷ࣮αʔ... 続きを読む
Adobe、iOS/Androidで撮影した文書をPDF化できる「Adobe Scan」を無償提供 - 窓の杜
ニュース Adobe、iOS/Androidで撮影した文書をPDF化できる「Adobe Scan」を無償提供 “Adobe Sensei”で自動補正。OCRによるテキストの認識にも対応 樽井 秀人 2017年6月1日 17:10 iOS版「Adobe Scan」 米Adobe Systems Incorporatedは1日(現地時間)、iOS/Android向けのドキュメントスキャナーアプリ「A... 続きを読む
認識率98.66%?!たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた - BITA デジマラボ
Artificial Intelligence for Everyday Use: Coming Soon How four programmers with almost no knowledge of Japanese designed software to read handwriting. 気になりすぎたので、早速取材にいってみたところ、Reactive Inc.のデータサイエンティスト... 続きを読む
「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」 原子力規制庁、サイトを修正 - ITmedia ニュース
原子力規制庁がWebサイトで公開している資料の1つで、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼく)と「口」(くち)になっていると指摘され、同庁が修正する騒ぎがあった。 原子力規制委員会がWebサイトで公開している資料の中で、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼく)と「口」(くち)になっていたとネットユーザーに指摘され、サイトを公開している原子力規制庁が修正する騒ぎがあっ... 続きを読む
無料でOCR(光学文字認識)したかったらGoogleDriveを試してみるといいかもね | 56docブログ
無料でOCR(光学文字認識)したかったらGoogleDriveを試してみるといいかもね 【オンラインストレージ】 wrote on 2012/11/15 http://blog.56doc.net/Entry/454/無料でOCR(光学文字認識)したかったらGoogleDriveを試してみるといいかもね 昨日ツイッターのフォロワーさんがTLで「人を殴ったらかなり痛いくらいの紙書類の束渡されて、一晩... 続きを読む
PDFの文字をテキスト化! オンラインで簡単に使えるOCRサービス : ライフハッカー[日本版]
Webツール , 仕事術 , 生産性向上 PDFの文字をテキスト化! オンラインで簡単に使えるOCRサービス 2012.06.05 23:00 コメント数:[ 0 ] Tweet 「Free Online OCR」は無料で利用できるOCRサービス。OCRは画像などに含まれる文字を認識してくれるもので、画像およびPDF内の文字をテキストやWordに変換してくれるサービスです。 以下に使ってみた様子を... 続きを読む
Google DocsのOCR変換機能が日本語に対応 - ITmedia News
ニュースGoogle DocsのOCR変換機能が日本語に対応PDFファイルやスキャナで読み込んだ文書の画像ファイルをGoogle Docsにアップロードすると、編集可能なテキストファイルに変換できる機能が横書きの日本語に対応した。2011年03月01日 15時29分 更新米Googleは2月28日(現地時間)、昨年6月にGoogle Docsに追加したOCR(光学式文字認識)機能を、新たに日本語を... 続きを読む
画像ファイルをテキスト化してくれる「n1ne@freeOCR」(無料) : ライフハッカー[日本版]
GTD , Webツール , その他 , 仕事術 , 生活術 , 節約術 画像ファイルをテキスト化してくれる「n1ne@freeOCR」(無料) 掲載日時:2010.05.06 20:00 コメント [0] , トラックバック [0] OCRで書類を読ませるために、わざわざ一度プリントしてから、ドキュメントスキャナに...なんていう経験はないでしょうか? ブログ「Blog.IKUBON.com... 続きを読む
画像ファイルをメールで送るだけでOCRで読み取ってくれる「n1ne@freeOCR」 | Blog.IKUBON.com
メールに画像ファイルを添付して送るだけで、画像ファイルを読み取ってワードの文書で返送してきます。メールだけでOCRが利用できるということです。 » n1ne@freeOCR 対応している画像のファイルフォーマットは .bmp, .dib, .rle, .dcx, .djvu, .djv, .gif, .jb2, .jbig2, .jp2, .j2k, .jpg, .jpeg, .pcx, .pdf... 続きを読む
橋本商会 » scansnapと裁断機を買って本を電子化しまくる
scansnapと裁断機を買った。合計3万6000円ぐらいだったと思う 最近はちょっとした待ち時間に、iPhoneでRubyレシピブックをよく読んでいる。 漫画なんかも、24インチの液晶に出せばむしろ元の本より大きくなっていい。 あと、中高の頃に毎年度みんなの作文や部活の大会記録がまとめられた200ページぐらいの本が作られていたんだけどそれもスキャンして全部パソコンに入れておいた。OCRもかかって... 続きを読む
iPhoneアプリ「翻訳ルーペ」 (Yahoo! JAPAN Tech Blog)
iPhoneのカメラに写った文字(英数字)をOCRで認識し、英和辞書を引く・WEBで検索をする・メモをする ことができるiPhoneアプリ。,ウェブテクノロジーに特化した技術系ブログ Yahoo!JAPANのサービスの動向や最新の技術情報を発信こんにちは、地図チームの吉田一星です。 翻訳ルーペというiPhoneアプリをリリースしたので、ご紹介します。 翻訳ルーペは、Yahoo! JAPANの公式実... 続きを読む
9800円のデジタルペンに脱帽! 文字認識率は想像以上で実用性十分!! - ライフ - 日経トレンディネット
「戸田覚の1万円研究所」では実売価格1万円以下の周辺機器やサプライ品などを自腹で購入し、独自の目線で検証していく。第65回は手書きのメモをそのままデジタルデータにできるデジタルペン。価格と使い勝手の良さで戸田氏もおすすめだ。 専用紙不要で手書き文字をデジタルデータとして取り込めるデジタルペン。A4サイズ50ページ分以上を保存できる。取り込んだデータは付属のOCRソフトでリッチテキストにも変換でき、... 続きを読む
MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介
オープンソース・フリーウェアを毎日紹介するブログ。日々の業務の効率化、新しいサービスのネタ探しにどうぞ。SNS、SBS、CMS、オフィス、画像編集、ユーティリティ、Firefoxアドオン、テキストエディタ、ゲーム…ジャンルは様々。 [C++] [ CUI] [ Google Code] [ MIT License] [ OCR] [ SourceForge.jp] [ オープンソース] [ 日本語... 続きを読む
3分LifeHacking:画像内の文字をコピー&ペーストする - ITmedia Biz.ID
ニュース 3分LifeHacking: 画像内の文字をコピー&ペーストする 資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。 2007年10月30日 13時30分 更新 資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像... 続きを読む