タグ 古典籍
人気順 5 users 10 users 100 users 500 users 1000 users「くずし字」の認識に世界のAI研究者・技術者が挑戦<BR> ―全世界的コンペティションをKaggleで7月から開催― - 国立情報学研究所 / National Institute of Informatics
日本は、古典籍、古文書、古記録などの過去の資料(史料)を千年以上も大切に受け継いでおり、数億点規模という世界でも稀なほど大量の資料が現存しています。日本の歴史・文化の研究や、過去の災害などの自然現象の解明を進めるには、これらの資料をデジタル化・オープン化するとともに、その内容を読み解く必要があり... 続きを読む
【iBooks Store】国立国会図書館所蔵の歴史的図書580点を無料配信
iBooks Storeで「 目で楽しむ日本の古典 」特集ページが公開されています。 国立国会図書館に所蔵されている歴史的図書を電子書籍化したものが、無料で配信されています。 国立国会図書館デジタルコレクションで無料公開されている、著作権の消滅した古典籍(古書)です。 “約7万点の蔵書の中から、特によく知られている文学作品や挿絵の美しいもの”として、iBooks Storeでは580点が公開されて... 続きを読む
ASCII.jp:凸版印刷、江戸以前のくずし字を高精度にOCRする技術を開発
「源氏物語」(絵入本,国文研所蔵)のOCRによるテキストデータ化 凸版印刷は7月3日、江戸期以前のくずし字で記されている古典籍の文字を判別し、テキストデータ化するOCR技術を開発したと発表した。 専門家の減少、資料の経年劣化という問題に加え、大規模災害によって失われる可能性もある歴史資料のデジタル化の必要性が高まっている。しかし総数100万点以上ともいわれる江戸期以前のくずし字で記されている古典籍... 続きを読む
江戸期以前の“くずし字”、精度80%以上でOCR処理、凸版印刷が技術開発 -INTERNET Watch
ニュース 江戸期以前の“くずし字”、精度80%以上でOCR処理、凸版印刷が技術開発 (2015/7/3 17:44) 凸版印刷株式会社は3日、江戸期以前の“くずし字”を高精度でテキストデータ化する新方式のOCR技術を開発したと発表した。同社では、この技術を使った古典籍のテキストデータ化サービスを2015年夏より試験的に開始する予定。 「源氏物語」(絵入本、国文学研究資料館蔵)のOCR処理の例 凸版... 続きを読む