タグ「OCR」 - はてブログ

タグ OCR

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 25 / 82件)

無料＆ブラウザ上でPDF・JPEG・PNG・GIFファイルからOCRによるテキスト抽出ができる「OCR PDFs and images directly in your browser」

2024/04/03 13 users ファテキスト抽出 gifファイルエンジニア光学文字認識

PNG・JPEG・GIFといった画像ファイルやPDFファイルから、TesseractによるOCR(光学文字認識)でテキストを抽出できる「OCR PDFs and images directly in your browser」をエンジニアのサイモン・ウィルソン氏が公開しました。OCR PDFs and images directly in your browserはすべての処理をブラウザ上で実行するため、ファ... 続きを読む

GPT-4Vのモデルを利用してOCRできるか試してみた - Taste of Tech Topics

2023/12/18 20 users GPT-4V Taste of Tech Topics

こんにちは、安部です。気温の上下に翻弄されて最近風邪をひいてしまいましたが、皆さま元気にお過ごしでしょうか。今回は、GPT-4Vのモデルを利用して、OCRができるか試していきます。 GPT-4Vによって、「ChatGPTに目ができた」などと騒がれましたが、文字認識はどれくらいできるのでしょうか？得意分野ではなさそう... 続きを読む

GoogleがLLMで「非構造化文書」高精度テキスト抽出OCR『LMDX』発表。Bardを強化する可能性 | AIDB

2023/09/28 12 users LLM Bard AIDB レシートテキスト

ホーム AI論文紹介, OCR, 大規模言語モデル GoogleがLLMで「非構造化文書」高精度テキスト抽出OCR『LMDX』発表。Bardを強化する可能性マイページに保存最終更新日：2023/09/28 Googleは、非構造化文書（例えばレシートなど）から高精度にテキストを抽出するOCR（Optical Character Recognition）技術『LMDX（Language M... 続きを読む

数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 | AIDB

2023/09/06 20 users Nougat AIDB 数式損失 Meta AI

マイページに保存最終更新日：2023/09/05 科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。この問題に対処するために、Meta AIの研究チームは『Nougat（Neural Optical Understanding for Academic Docume... 続きを読む

OCRは「マリオプラザーズ」の夢を見る | Colorful Pieces of Game

2023/06/10 10 users マリオブラザーズ

『ちょっとは正しいゲームの歴史』…というか、ともかく「ゲームの歴史」を批判するシリーズで困らされたのがOCRだった。 Kindle本からテキストで全部コピー出来ればいいのだけど、Kindleは出版社それぞれがコピーできる量を規制していて（当たり前だ）、それを超える量はコピーのしようがない。そしていうまでもなく、... 続きを読む

アノテーションなのに手入力ゼロ！？バクラクのOCRを支えるアノテーション基盤（アプリケーション編） - LayerX エンジニアブログ

2023/05/31 14 users Tomoaki アノテーションサジェストバクラク日付

こんにちは、全ての経済活動をデジタル化したいTomoakiです。バクラクのOCR バクラクでは請求書や領収書をはじめ、国税関係書類に対してOCRを実行し入力のサジェストを行うことで、ユーザーが書類の内容を手入力する手間を省いています。例えばこちらの領収書、日付、金額、支払先を自動で読み取ってユーザーにサジェス... 続きを読む

読み取りの精度の先の体験を追求するバクラクのAI-OCR - LayerX エンジニアブログ

2023/03/29 7 users AI-OCR バクラク精度 LayerX エンジニアブログ

こんにちは、全ての経済活動をデジタル化したいTomoakiです。推しのコンビニスイーツはセブンイレブンの草もちです。今回は読み取りの精度の先の体験を追求するバクラクのAI-OCR機能について紹介します。 TL;DR バクラクでは国税関係書類に対してOCRを実行し、書類の内容の入力作業の負担を減らしているお客様の業務... 続きを読む

国立国会図書館　NDL on Twitter: "国立国会図書館は、令和3年度にオープンソースのOCR（光学式文字認識）処理プログラム #NDLOCR を開発し、GitHubでソースコードを公開しています。商用・非商用

2023/01/05 10 users GitHub NDLOCR 商用国立国会 https

国立国会図書館は、令和3年度にオープンソースのOCR（光学式文字認識）処理プログラム #NDLOCR を開発し、GitHubでソースコードを公開しています。商用・非商用を問わず自由な利用が可能です。 NDLOCRについては国立国会… https://t.co/lXcBvWDClj 続きを読む

OCRの精度を担保するテスト基盤アーキテクチャ - LayerX エンジニアブログ

2022/12/11 13 users バクラク OCR機能精度ソフトウェアエンジニアテスト基盤

こんにちは！LayerXバクラク事業部 OCRチームソフトウェアエンジニアの秋野（@akino_1027）です。この記事では、バクラクシリーズの機能であるOCRのテスト基盤について紹介していきます。 ※本記事は LayerX Tech Advent Calendar 2022 11日目の記事となります。背景バクラクでは手入力ゼロを目指すべく、 OCR機能（... 続きを読む

機械学習で実現するヤフーのOCR（文字認識技術）〜 PayPayフリマ本棚出品での活用事例

2022/10/03 5 users PayPayフリマヤフーウェブサイト機械学習活用事例

こんにちは。ヤフーで画像処理エンジニアをしている吉橋です。この記事ではヤフーのさまざまなサービスで使われている独自の画像文字認識（OCR）技術と、特に最近のPayPayフリマ「本棚一括持ち物追加機能」での活用事例をご紹介します。画像文字認識とは皆さん、ウェブサイトを見ていて「このキーワード気になるな……よ... 続きを読む

機械学習でハタラクをバクラクにするために LayerX に入社しました #LayerX｜yu-ya4｜note

2022/09/14 10 users 松村 LayerX 帳票バクラク事業部機械学習エンジニア

こんにちは、2022年9月1日に LayerX にフルタイムの機械学習エンジニアとして入社した松村優也(@yu__ya4)と申します。バクラク事業部の AI-OCRチームに所属しています。チーム名の通り、請求書や領収書といった帳票の画像データを読み取り、人間が手入力せずとも必要な項目を自動で抽出してデータ化する OCR 機能の開発... 続きを読む

OCR処理プログラム及び学習用データセットの公開について | NDLラボ

2022/04/25 244 users NDLラボ README GitHub NDLOCR 成果

2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館（以下、「当館」とします。）が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR... 続きを読む

Pythonで始めるドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python

2021/10/15 277 users Python Sansan Ubie yag_ays Inc

Transcript PythonͰ࢝ΊΔ υΩϡϝϯτɾΠϯςϦδΣϯεೖ໳ 2021/10/1 5 Ubieגࣜձࣾ @yag_ays 2 Ԟా ༟थ Yuki Okuda Recruit → Sansan → Ubie @yag_ays ࣗݾ঺հ https://yag-ays.github.io/ © Ubie, Inc. 3 ຊൃදʹ͍ͭͯ • ֓ཁ • υΩϡϝϯτɾΠϯςϦδΣϯεͷ֓ཁͷ঺հ • PythonΛ࢖ͬͨ։ൃࣄྫΛ௨ͯ͡ɺඞཁͱͳΔٕज़ཁૉʹ͍ͭͯ঺հ • ࣮ࡍͷαʔϏε։ൃ౳ʹऔΓ૊Ήʹ͋ͨͬͯͷɺൃలతͳ࿩୊΍ؔ࿈τϐοΫΛ঺հ • ର৅ͱ͢Δਓ • OCR΍ը૾ղੳΛ࢖ͬͨΞϓϦέʔγϣϯΛ࡞Γ͍ͨ։ൃऀ • ը૾ॲཧ΍ࣗવݴޠॲཧͷ࣮αʔ... 続きを読む

画像の中の文字を認識してくれるオープンソースのOCR「PaddleOCR」レビュー - GIGAZINE

2021/09/19 30 users GIGAZINE ディープラーニングフレームワーク名刺

画像に含まれる文字をテキストデータ化する光学文字認識(OCR)は、請求書やレシート、名刺などの印刷物をデジタル化する手法として広く使われています。そんなOCRをディープラーニングフレームワークで実現したのが、オープンソースのOCRシステム「PP-OCRv2」のデモ版となる「PaddleOCR」です。 PaddleOCR - a Hugging Fa... 続きを読む

Windows 10の標準機能だけで画像からテキストを抽出する方法 | マイナビニュース

2021/01/08 14 users テキストマイナビニュース標準機能画像 Windows 1

画像ファイルからテキストを抽出したい場合、何らかのOCR（光学式文字認識）ソフトウェアを利用するのが一般的だ。しかし、BetaNewsは1月6日(米国時間)、「Windows 10 has a secret way to grab text from images」において、特定のソフトウェアを使わずに、Windows 10に付属する標準機能だけでテキストの抽出を行う方法... 続きを読む

AIによる「超」軽量なOCR（文字認識）システムが登場【GitHub】 | アイブン

2020/10/07 12 users GitHub baidu アイブン論文文書

光学式文字認識（OCR）システムは、文書の電子化・工場での文字自動検出・オンライン教育・地図作成など幅広く使用されています。 BaiduのYuning Duらは、超軽量のOCRシステムであるPP-OCRを提案しています。文字認識結果(図は論文から引用) PP-OCRはテキスト検出、検出フレーム修正などで構成されています。全体のサイ... 続きを読む

MNTSQプロダクト開発チームのカンバン運営を紹介します！｜ikutani41｜note

2020/08/28 10 users ikutani41｜note モンテスキュー MNTSQ

リーガルテック・カンパニーMNTSQ（モンテスキュー）を創業して1年と9ヶ月が経ちました。今日はMNTSQ（モンテスキュー）のプロダクト開発チームでは日々どんな流れで仕事が行われているのか、特にカンバン運営に焦点を当てて紹介しようと思います。 MNTSQのプロダクト開発の全体像としては、OCRやアルゴリズム開発やリ... 続きを読む

SARS本の概要をOCRでおこしてみた。｜たまやん｜note

2020/05/14 19 users 概要

新型コロナウイルス感染症については、必ず1次情報として厚生労働省や首相官邸のウェブサイトなど公的機関で発表されている発生状況やQ&A、相談窓口の情報もご確認ください。※非常時のため、すべての関連記事に本注意書きを一時的に出しています。 21世紀のはじめに世界を震撼させたSARS、その記録が2007年に出版、... 続きを読む

日本語OCRはなぜ難しい？　NAVERのエンジニアが語る、テキスト検出における課題と解決策 - ログミーTech

2020/04/07 22 users NAVER ログミーTech Engineering 課題

日本語OCRはなぜ難しい？ NAVERのエンジニアが語る、テキスト検出における課題と解決策 NAVER ClovaのOCR（光学的文字認識） #1/2 2019年11月20、21日の2日間、LINE株式会社が主催するエンジニア向け技術カンファレンス「LINE DEVELOPER DAY 2019」が開催されました。1日目は「Engineering」をテーマに、LINEの技術の深... 続きを読む

iOS 13でアップデートされたメモアプリはチェックリストの自動ソートや、OCR/画像認識を利用し添付ファイルや写真のテキスト/被写体検索が可能に。 | AAPL Ch.

2019/09/23 37 users メモアプリ AAPL 添付ファイルテキスト iOS 13

自動ソート : チェック済みリストがリストの下に自動的に移動する。リストのネスト化 : リストを右にスワイプすることでリストにサブリストを作成できる。リストの一括操作 : タップメニューから「すべてにチェックを付ける」や「すべてのチェックを外す」、「チェックした項目を削除」、「チェックしたものを一番下に... 続きを読む

AI OCRで精度100％は無理、でもRPAと一緒に使わないのはもったいない | 日経 xTECH（クロステック）

2019/01/08 14 users オートメーション xTech ＲＰＡ筆者人工知能

登録会員限定記事　現在はどなたでも閲覧可能です筆者は、働き方改革に積極的な企業や、RPA（ロボティック・プロセス・オートメーション）といった働き方改革に役立つ技術の動向を継続的に取材している。2019年に入り、筆者は今後、企業が取り入れるべき技術をあえて1つだけ選んでみた。人工知能（AI）を組み込んだOCR... 続きを読む

自動運転ミニカー、OCR、機械学習チップ ── 「AWS re:Invent 2018」で発表された主要AI系アップデートまとめ | Ledge.ai

2018/11/30 19 users amazo Ledge.ai AWS re 自動運転ミニカー

TOP > Topic Keywords > AI:人工知能 > 自動運転ミニカー、OCR、機械学習チップ ── 「AWS re:Invent 2018」で発表された主要AI系アップデートまとめ 11月26日から11月30日まで開催されている「AWS re:Invent 2018」。発表された機械学習系のアップデートをまとめました。機械学習の経験がなくとも予測が可能に。「Amazo... 続きを読む

AWS、OCRを越えるテキスト抽出サービス「Amazon Textract」発表 | マイナビニュース

2018/11/29 22 users AWS データベース AWS re 年次イベントセキュリティ

Amazon Web Servicesの年次イベント「AWS re:Invent 2018」では、ファイルシステム、データベース、セキュリティ、機械学習など多岐にわたるサービスが発表されたが、その中から「Amazon Textract」を紹介しておきたい。 OCRを越えたテキスト抽出サービス Amazon Textractはスキャン文書からテキストおよびデータを自動... 続きを読む

[速報] OCR を超えたテキスト抽出が可能なマネージドサービス！Amazon Textract が発表されました！ #reinvent ｜ DevelopersIO

2018/11/28 24 users invent reinvent DevelopersIO

AWS re:Inventのキーノート、熱い新サービスが続々と登場してきています。フルマネージドで OCR を超えた高機能なテキスト抽出サービスとして Amazon Textract が発表されました！ Amazon T […] 続きを読む

Dropboxにユーザーのすべての画像とPDFを自動的にOCRする機能が登場 | TechCrunch Japan

2018/10/10 23 users Dropbox TechCrunch JAPAN PDF

Enterprise Dropboxに、一部のユーザーが待ち焦がれていたと思われる便利な機能がやってきた。それは画像やPDFファイル中の文字を自動的にテキストデータへ書き起こす光学式文字認識(optical character recognition/reader, OCR)機能だ。これからは、セーブした写真をかき回してレシートを探さなくてもよいし、目的の情... 続きを読む