タグ「OCR」 - はてブログ

タグ OCR

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 19 / 19件)

日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました｜Kotaro.Kinoshita

2024/11/26 1327 users YomiToku LLM Rag メインターゲット記号

はじめに最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。しかし、その多くは日本語をメインターゲットに開発されているわけではありません。日本語文書は、英数字に加えて、ひらがな、漢字、記号など数千種類の文字を識... 続きを読む

OCRはもう不要？視覚的特徴とテキストを高精度に捉える！次世代マルチモーダルAI『MPLUG-DOCOWL2』登場！ - Qiita

2024/11/18 144 users Qiita 精度テキスト高解像度最先端技術

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 株式会社ulusageの技術ブログ生成AIです！今回は、PDF解析とドキュメントインテリジェンスの最先端技術「MPLUG-DOCOWL2」について、解説していきます。このモデルは、高解像度の... 続きを読む

GPT-4oをOCRとして使う - Re:ゼロから始めるML生活

2024/06/08 253 users OpenAI GPT-4o ChatGPT-4o ML生活

OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか？さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。普通にテキストでのやり取りをしつつも画像データを扱えるということで、「実はこれいい感じのOCRとして使えるんじゃね？」っ... 続きを読む

GPT-4oを使って2Dの図面から3DのCADモデルを作る

2024/05/19 161 users GPT-4o 図面 OpenAI GPT-4-Turbo 精度

はじめに株式会社ファースト・オートメーションCTOの田中(しろくま)です！先日、 OpenAIからGPT-4oがリリースされました。いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が... 続きを読む

OCR処理プログラム及び学習用データセットの公開について | NDLラボ

2022/04/25 244 users NDLラボ README GitHub NDLOCR 成果

2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館（以下、「当館」とします。）が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR... 続きを読む

Pythonで始めるドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python

2021/10/15 277 users Python Sansan Ubie yag_ays Inc

Transcript PythonͰ࢝ΊΔ υΩϡϝϯτɾΠϯςϦδΣϯεೖ໳ 2021/10/1 5 Ubieגࣜձࣾ @yag_ays 2 Ԟా ༟थ Yuki Okuda Recruit → Sansan → Ubie @yag_ays ࣗݾ঺հ https://yag-ays.github.io/ © Ubie, Inc. 3 ຊൃදʹ͍ͭͯ • ֓ཁ • υΩϡϝϯτɾΠϯςϦδΣϯεͷ֓ཁͷ঺հ • PythonΛ࢖ͬͨ։ൃࣄྫΛ௨ͯ͡ɺඞཁͱͳΔٕज़ཁૉʹ͍ͭͯ঺հ • ࣮ࡍͷαʔϏε։ൃ౳ʹऔΓ૊Ήʹ͋ͨͬͯͷɺൃలతͳ࿩୊΍ؔ࿈τϐοΫΛ঺հ • ର৅ͱ͢Δਓ • OCR΍ը૾ղੳΛ࢖ͬͨΞϓϦέʔγϣϯΛ࡞Γ͍ͨ։ൃऀ • ը૾ॲཧ΍ࣗવݴޠॲཧͷ࣮αʔ... 続きを読む

Adobe、iOS/Androidで撮影した文書をPDF化できる「Adobe Scan」を無償提供 - 窓の杜

2017/06/01 168 users Adobe 文書 Adobe Scan Android 樽井

ニュース Adobe、iOS/Androidで撮影した文書をPDF化できる「Adobe Scan」を無償提供 “Adobe Sensei”で自動補正。OCRによるテキストの認識にも対応樽井秀人 2017年6月1日 17:10 iOS版「Adobe Scan」　米Adobe Systems Incorporatedは1日（現地時間）、iOS/Android向けのドキュメントスキャナーアプリ「A... 続きを読む

認識率98.66％？！たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた - BITA デジマラボ

2016/06/13 483 users BITA デジマラボ２ヶ月

Artificial Intelligence for Everyday Use: Coming Soon How four programmers with almost no knowledge of Japanese designed software to read handwriting. 気になりすぎたので、早速取材にいってみたところ、Reactive Inc.のデータサイエンティスト... 続きを読む

「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」　原子力規制庁、サイトを修正 - ITmedia ニュース

2014/06/10 229 users ストロンチウムクチ漢字ボク原子力規制庁

原子力規制庁がWebサイトで公開している資料の1つで、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」（ぼく）と「口」（くち）になっていると指摘され、同庁が修正する騒ぎがあった。原子力規制委員会がWebサイトで公開している資料の中で、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」（ぼく）と「口」（くち）になっていたとネットユーザーに指摘され、サイトを公開している原子力規制庁が修正する騒ぎがあっ... 続きを読む

無料でOCR(光学文字認識)したかったらGoogleDriveを試してみるといいかもね | 56docブログ

2012/11/15 650 users GoogleDrive オンラインストレージ一晩 net

無料でOCR(光学文字認識)したかったらGoogleDriveを試してみるといいかもね【オンラインストレージ】 wrote on 2012/11/15 http://blog.56doc.net/Entry/454/無料でOCR(光学文字認識)したかったらGoogleDriveを試してみるといいかもね昨日ツイッターのフォロワーさんがTLで「人を殴ったらかなり痛いくらいの紙書類の束渡されて、一晩... 続きを読む

PDFの文字をテキスト化！オンラインで簡単に使えるOCRサービス : ライフハッカー［日本版］

2012/06/05 680 users ライフハッカー PDF 文字オンラインテキスト化

Webツール , 仕事術 , 生産性向上 PDFの文字をテキスト化！オンラインで簡単に使えるOCRサービス 2012.06.05 23:00 コメント数：[ 0 ] Tweet 「Free Online OCR」は無料で利用できるOCRサービス。OCRは画像などに含まれる文字を認識してくれるもので、画像およびPDF内の文字をテキストやWordに変換してくれるサービスです。以下に使ってみた様子を... 続きを読む

Google DocsのOCR変換機能が日本語に対応 - ITmedia News

2011/03/01 521 users Google Docs ITmedia News 横書き

ニュースGoogle DocsのOCR変換機能が日本語に対応PDFファイルやスキャナで読み込んだ文書の画像ファイルをGoogle Docsにアップロードすると、編集可能なテキストファイルに変換できる機能が横書きの日本語に対応した。2011年03月01日 15時29分更新米Googleは2月28日（現地時間）、昨年6月にGoogle Docsに追加したOCR（光学式文字認識）機能を、新たに日本語を... 続きを読む

画像ファイルをテキスト化してくれる「n1ne@freeOCR」（無料） : ライフハッカー［日本版］

2010/05/06 572 users ライフハッカードキュメントスキャナテキスト化 GTD

GTD , Webツール , その他 , 仕事術 , 生活術 , 節約術画像ファイルをテキスト化してくれる「n1ne@freeOCR」（無料）掲載日時：2010.05.06 20:00 コメント [0] , トラックバック [0] OCRで書類を読ませるために、わざわざ一度プリントしてから、ドキュメントスキャナに...なんていう経験はないでしょうか？　ブログ「Blog.IKUBON.com... 続きを読む

画像ファイルをメールで送るだけでOCRで読み取ってくれる「n1ne@freeOCR」 | Blog.IKUBON.com

2010/04/03 838 users PCX BMP ファイルフォーマット JPEG 画像ファイル

メールに画像ファイルを添付して送るだけで、画像ファイルを読み取ってワードの文書で返送してきます。メールだけでOCRが利用できるということです。 » n1ne@freeOCR 対応している画像のファイルフォーマットは .bmp, .dib, .rle, .dcx, .djvu, .djv, .gif, .jb2, .jbig2, .jp2, .j2k, .jpg, .jpeg, .pcx, .pdf... 続きを読む

橋本商会 » scansnapと裁断機を買って本を電子化しまくる

2010/01/03 1213 users ScanSnap iPhone 作文中高液晶

scansnapと裁断機を買った。合計3万6000円ぐらいだったと思う最近はちょっとした待ち時間に、iPhoneでRubyレシピブックをよく読んでいる。漫画なんかも、24インチの液晶に出せばむしろ元の本より大きくなっていい。あと、中高の頃に毎年度みんなの作文や部活の大会記録がまとめられた200ページぐらいの本が作られていたんだけどそれもスキャンして全部パソコンに入れておいた。OCRもかかって... 続きを読む

iPhoneアプリ「翻訳ルーペ」 (Yahoo! JAPAN Tech Blog)

2009/07/07 237 users iPhoneアプリ Yahoo ウェブテクノロジー吉田一星

iPhoneのカメラに写った文字（英数字）をOCRで認識し、英和辞書を引く・WEBで検索をする・メモをすることができるiPhoneアプリ。,ウェブテクノロジーに特化した技術系ブログ Yahoo!JAPANのサービスの動向や最新の技術情報を発信こんにちは、地図チームの吉田一星です。翻訳ルーペというiPhoneアプリをリリースしたので、ご紹介します。翻訳ルーペは、Yahoo! JAPANの公式実... 続きを読む

9800円のデジタルペンに脱帽! 文字認識率は想像以上で実用性十分!! - ライフ - 日経トレンディネット

2008/11/18 183 users 脱帽日経トレンディネット自腹デジタルペン戸田覚

「戸田覚の1万円研究所」では実売価格1万円以下の周辺機器やサプライ品などを自腹で購入し、独自の目線で検証していく。第65回は手書きのメモをそのままデジタルデータにできるデジタルペン。価格と使い勝手の良さで戸田氏もおすすめだ。専用紙不要で手書き文字をデジタルデータとして取り込めるデジタルペン。A4サイズ50ページ分以上を保存できる。取り込んだデータは付属のOCRソフトでリッチテキストにも変換でき、... 続きを読む

MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介

2008/09/11 344 users MOONGIFT CUI SourceForge.jp ネタ

オープンソース・フリーウェアを毎日紹介するブログ。日々の業務の効率化、新しいサービスのネタ探しにどうぞ。SNS、SBS、CMS、オフィス、画像編集、ユーティリティ、Firefoxアドオン、テキストエディタ、ゲーム…ジャンルは様々。 [C++] [ CUI] [ Google Code] [ MIT License] [ OCR] [ SourceForge.jp] [ オープンソース] [ 日本語... 続きを読む

3分LifeHacking：画像内の文字をコピー＆ペーストする - ITmedia Biz.ID

2007/10/30 577 users ITmedia Biz.ID コピー文字無償手元

ニュース 3分LifeHacking：画像内の文字をコピー＆ペーストする資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。 2007年10月30日 13時30分更新資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像... 続きを読む