タグ NDLラボ
人気順 10 users 50 users 100 users 500 users 1000 usersNDL古典籍OCR-Liteの公開について | NDLラボ
2024年11月26日 NDL古典籍OCR-Liteの公開について NDLラボ公式GitHub(外部サイト)から、NDL古典籍OCR-Liteを公開しました。 NDL古典籍OCR-Liteは、ノートパソコン等の一般的な家庭用コンピュータやOS環境で、江戸期以前の和古書、清代以前の漢籍といった古典籍資料のデジタル化画像からテキストデータが作成できる軽量... 続きを読む
NDL Ngram Viewer | NDLラボ
サービスURL https://lab.ndl.go.jp/ngramviewer/ 概要 OCRによって作成されたテキストデータから、出版年代ごとの出現頻度を可視化・列挙することができるサービスです。 可視化グラフの縦軸は、年代ごとに何回出現したかを表す出現頻度と、出現頻度を出版年代ごとの総ngram数で割った値を表す出現比率の2種類を切り替... 続きを読む
OCR処理プログラム及び学習用データセットの公開について | NDLラボ
2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館(以下、「当館」とします。)が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR... 続きを読む
「次世代デジタルライブラリー」を公開しました | NDLラボ
「次世代デジタルライブラリー」は、国立国会図書館次世代システム開発研究室が開発した、実験的な機能を備えたデータベースです。 「キーワードで探す」では全文検索ができ、「絵で探す」では自動で抽出された各資料の画像・図版の中から似たものを探すことができます。その他の機能についてはトップページをご覧くださ... 続きを読む
文字画像データセット(漢字300文字版)を試験公開しました | NDLラボ
こちらからダウンロードできます(どの形式でも内容は同じです)。 文字画像データセット(漢字300文字版)(7z形式) (約371MB) 文字画像データセット(漢字300文字版)(tar.gz形式) (約373MB) 文字画像データセット(漢字300文字版)(zip形式) (約446MB) 内訳は次のとおりです。 文字 ディレクトリ 画像数 文字 ディレクトリ 画像数 文字 ディレクトリ 画像... 続きを読む
「国立国会図書館のデータを使い尽くそうハッカソン」のご案内 | NDLラボ
国立国会図書館(NDL)は、「LODチャレンジ2015」「アーバンデータチャレンジ2015」の開催に合わせて、NDLのデータの利活用をテーマとしたハッカソンを実施します。NDLでは、出版物の書誌データをはじめとする各種のデータを提供しています。これらのデータは、「国立国会図書館サーチ」「Web NDL Authorities」「NDL東日本大震災アーカイブ」「国立国会図書館デジタルコレクション」「... 続きを読む
国立国会図書館、“NDLラボ”をスタート | カレントアウェアネス・ポータル
カレントアウェアネス・ポータルは、図書館界、図書館情報学に関する最新の情報をお知らせする、国立国会図書館のサイトです。 2013年5月7日、国立国会図書館が“NDLラボ”のサイトをオープンしました。このサイトは、国立国会図書館が、国内外の機関と協力して実験的なサービスを提供するものであり、同日より「電子読書支援システム」の実験公開を行っています。 この「電子読書支援システム」については、5月7日の... 続きを読む