はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 文書データ

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 1 / 1件)
 

日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました|Kotaro.Kinoshita

2024/11/26 このエントリーをはてなブックマークに追加 1327 users Instapaper Pocket Tweet Facebook Share Evernote Clip YomiToku OCR LLM Rag メインターゲット

はじめに最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。 しかし、その多くは日本語をメインターゲットに開発されているわけではありません。日本語文書は、英数字に加えて、ひらがな、漢字、記号など数千種類の文字を識... 続きを読む

 
(1 - 1 / 1件)