タグ 日本語文書
人気順 5 users 50 users 100 users 500 users 1000 usersYomiToku で漫画のOCRを試す|npaka
「YomiToku」で漫画のOCRを試したのでまとめました。 1. YomiToku「YomiToku」は、ローカルサーバーで実行可能かつ、日本語文書に特化したOCRおよびドキュメント画像解析を行うPythonパッケージです。 2. Google Colabでの実行「Google Colab」での実行手順は、次のとおりです。 (1) パッケージのインストール。 # パッ... 続きを読む
日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました|Kotaro.Kinoshita
はじめに最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。 しかし、その多くは日本語をメインターゲットに開発されているわけではありません。日本語文書は、英数字に加えて、ひらがな、漢字、記号など数千種類の文字を識... 続きを読む
CNNと協調フィルタリングを使った日本語文書のリコメンド - エムスリーテックブログ
2018 - 03 - 07 CNNと協調フィルタリングを使った日本語文書のリコメンド 機械学習 エンジニアの西場( @m_nishba )です。主に 自然言語処理 を使ったリコメンドや文書分類、ユーザー分析を行っています。 最近、開発中のリコメンデーションの アルゴリズム について紹介します。 コンテンツ コンテンツ モチベーション 問題の概要 問題の検証結果 文書分類 文書分類の論文の紹介 精... 続きを読む
画像で撮った日本語文書をワードやPDFに--MSのスキャナアプリ「Office Lens」 - CNET Japan
Office Lensは、Microsoftからリリースされているスキャナアプリだ。高度な画像処理機能により、日本語の文書でも、テキスト検索が可能なPDFに変換できる。撮影モードは、「写真」「ドキュメント」「ホワイトボード」の3種類で、撮影した画像を、目的に合わせて自動的に処理してくれる。また、多少斜めから撮影しても、まっすぐになるように自動的に補正されるので、厳密にまっすぐ撮ろうとしなくても大丈... 続きを読む
今度は戦艦武蔵のマニュアルか 日本語文書も公開:朝日新聞デジタル
フィリピン中部シブヤン海の海底で「戦艦武蔵を発見した」と発表した米マイクロソフトの共同創業者ポール・アレン氏は7日、船で見つかったとされる日本語の文書の写真を投稿サイトのツイッターに投稿した。艦上装置の操作法についての文書とみられる。 投稿された写真からは「手入後ハ必ズ射出状態ニ復ス……」「作動筒手入装置」などの文字が読みとれる。カタパルト(艦載機の射出装置)の操作について書かれた文書とみられ、ア... 続きを読む
安倍首相の靖国神社参拝(12月26日)についての声明 | 米国大使館 東京・日本
安倍首相の靖国神社参拝(12月26日)についての声明 *下記の日本語文書は参考のための仮翻訳で、正文は英文です。 2013年12月26日 日本は大切な同盟国であり、友好国である。しかしながら、日本の指導者が近隣諸国との緊張を悪化させるような行動を取ったことに、米国政府は失望している。 米国は、日本と近隣諸国が過去からの微妙な問題に対応する建設的な方策を見いだし、関係を改善させ、地域の平和と安定とい... 続きを読む