はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ テキスト抽出

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 4 / 4件)
 

無料&ブラウザ上でPDF・JPEG・PNG・GIFファイルからOCRによるテキスト抽出ができる「OCR PDFs and images directly in your browser」

2024/04/03 このエントリーをはてなブックマークに追加 13 users Instapaper Pocket Tweet Facebook Share Evernote Clip OCR ファ gifファイル エンジニア 光学文字認識

PNG・JPEG・GIFといった画像ファイルやPDFファイルから、TesseractによるOCR(光学文字認識)でテキストを抽出できる「OCR PDFs and images directly in your browser」をエンジニアのサイモン・ウィルソン氏が公開しました。OCR PDFs and images directly in your browserはすべての処理をブラウザ上で実行するため、ファ... 続きを読む

PDFからテキストを抽出するのはなぜ難しいのか? - GIGAZINE

2020/03/04 このエントリーをはてなブックマークに追加 14 users Instapaper Pocket Tweet Facebook Share Evernote Clip てき GIGAZINE PDFファイル PDF テキスト

PDFファイルは、どんな環境のPCでもテキストや画像の表示を崩すことなく見られるデータ形式です。しかし、PDFからテキストデータをコピーしようとすると、うまく選択できなかったり、テキストの内容がおかしくなってしまったりすることがあります。なぜPDFファイルからのテキスト抽出が難しいのかを、PDFファイルのテキ... 続きを読む

[速報] OCR を超えたテキスト抽出が可能なマネージドサービス!Amazon Textract が発表されました! #reinvent | DevelopersIO

2018/11/28 このエントリーをはてなブックマークに追加 24 users Instapaper Pocket Tweet Facebook Share Evernote Clip DevelopersIO invent reinvent

AWS re:Inventのキーノート、熱い新サービスが続々と登場してきています。フルマネージドで OCR を超えた高機能なテキスト抽出サービスとして Amazon Textract が発表されました! Amazon T […] 続きを読む

PDFのテキスト抽出とHTML変換(KeiYu HelpLab)

2005/03/05 このエントリーをはてなブックマークに追加 36 users Instapaper Pocket Tweet Facebook Share Evernote Clip アクセシビリティ HTML変換 PDF 用途 テキスト

PDFの一般的なテキスト抽出、HTML変換の方法、ツールについてちょっと調べてみました。 というのも、検索エンジンで「PDF AND テキスト抽出」や「PDF AND HTML変換」で検索した方が、毎週のように「PDFとアクセシビリティ」のページに来られるからです。「PDFとアクセシビリティ」で取り上げているのは、主に視覚障害者がPDF中のテキストを読み取るための方法で、一般的な用途のものではあり... 続きを読む

 
(1 - 4 / 4件)