タグ 古典籍
人気順 5 users 50 users 100 users 500 users 1000 users「日本語のくずし字をAIで活字に直す試み」の活発化に海外の研究者らも注目 - GIGAZINE
by Peter Roan 日本の古典籍や古文書で用いられている「くずし字」を現代日本語の文字に変換する作業を「翻刻」と呼びます。多くの現代日本人はくずし字を読むことができないので、変換は誰にでもできるものではありません。そこで注目が集まっているのが、機械学習を利用して翻刻する試みです。モントリオール大学の博... 続きを読む
くずし字をAIが解読する時代が来たことに喜びを覚える人たち。くずし字認識AIの作者が制作意図を語る展開も「資料の面白さを一般の人にわかってもらえたら」 - Togetter
数億点規模という世界でも稀な量の古典籍・古文書を有しながら「くずし字」で書かれているため読める人が殆どいない現代日本。全世界のデータサイエンティストにAIを活用した認識モデルを募り、今日、その結果発表と授賞式が行われます。新時代に古典知の扉をみんなで開こうと #Kaggle #NIJL #NII pic.twitter.com/ba8j... 続きを読む
「くずし字」の認識に世界のAI研究者・技術者が挑戦<BR> ―全世界的コンペティションをKaggleで7月から開催― - 国立情報学研究所 / National Institute of Informatics
日本は、古典籍、古文書、古記録などの過去の資料(史料)を千年以上も大切に受け継いでおり、数億点規模という世界でも稀なほど大量の資料が現存しています。日本の歴史・文化の研究や、過去の災害などの自然現象の解明を進めるには、これらの資料をデジタル化・オープン化するとともに、その内容を読み解く必要があり... 続きを読む
「今昔物語集」を電子化--国文学研究資料館とPFU、歴史的典籍の電子化実証実験 - CNET Japan
人間文化研究機構 国文学研究資料館(国文研)とPFUは8月1日、歴史的典籍(古典籍)に特化したブックスキャナの実証実験を実施したと発表した。 この実験は、「日本語の歴史的典籍の国際共同研究ネットワーク構築計画」(歴史的典籍NW事業)の一環として行っているもの。古典籍の研究者を擁する国文研の専門的知見のもと、PFUが開発中の可搬型ブックスキャナを世界文化遺産「紀伊山地の霊場と参詣道」に登録されている... 続きを読む
【iBooks Store】国立国会図書館所蔵の歴史的図書580点を無料配信
iBooks Storeで「 目で楽しむ日本の古典 」特集ページが公開されています。 国立国会図書館に所蔵されている歴史的図書を電子書籍化したものが、無料で配信されています。 国立国会図書館デジタルコレクションで無料公開されている、著作権の消滅した古典籍(古書)です。 “約7万点の蔵書の中から、特によく知られている文学作品や挿絵の美しいもの”として、iBooks Storeでは580点が公開されて... 続きを読む
源氏物語・豆腐百珍…古典籍の画像データをネット公開:朝日新聞デジタル
日本の古典籍を広く活用してもらおうと、国文学研究資料館(東京都立川市)が所蔵資料の画像データなどをネット上で公開する取り組みを始めた。第1弾として11月に源氏物語や十六夜日記など350点の画像を公開。誰でもダウンロードできるようにし、新たな研究を呼び込む。 古典籍は主に江戸時代以前に書写されたり印刷されたりしたもので、同資料館では約1万6千点を所蔵。国立情報学研究所(東京都千代田区)の協力で、同... 続きを読む
国文学研究資料館、『国文研古典籍データセット(第0.1版)』を公開へ | カレントアウェアネス・ポータル
カレントアウェアネス・ポータルは、図書館界、図書館情報学に関する最新の情報をお知らせする、国立国会図書館のサイトです。 国文学研究資料館が、古典籍を自由に研究・活用いただくため、国立情報学研究所の協力のもと、同館所蔵の日本の古典籍350点の全冊画像データ(画像約6万3千コマ)とその書誌データを、同研究所の「情報学研究データリポジトリIDR」より、データセットとして、2015年11月10日から一般公... 続きを読む
まだ白手袋で本さわってるの? : 古典籍と手袋にまつわるエトセトラなメモ: egamiday 3
長野県短大:学園祭で「和書喫茶」 古書を気軽に楽しんで - 毎日新聞 http://mainichi.jp/select/news/20151018k0000m040026000c.html 古典籍(以下、和装本、和本、貴重書等いろいろ)を手袋で取り扱うという類の報道写真・映像があとをたたず、時折思い出したように、あれはダメだ、え、ダメなの、ダメだよ、的な話が軽くこんがりします。あるいはその逆... 続きを読む
凸版印刷|凸版印刷、江戸期以前のくずし字を 高精度でテキストデータ化する新方式OCR技術を開発
凸版印刷、江戸期以前のくずし字を 高精度でテキストデータ化する新方式OCR技術を開発 ~江戸期以前のくずし字が80%以上の精度でOCR処理可能に~ 凸版印刷株式会社(本社:東京都千代田区、代表取締役社長:金子眞吾、以下 凸版印刷)は、江戸期以前のくずし字で記されている古典籍(内容・形態の優れた古い書物のこと)の文字を判別し、テキストデータ化するOCR(光学文字認識)技術を開発しました。凸版印刷は、... 続きを読む
ASCII.jp:凸版印刷、江戸以前のくずし字を高精度にOCRする技術を開発
「源氏物語」(絵入本,国文研所蔵)のOCRによるテキストデータ化 凸版印刷は7月3日、江戸期以前のくずし字で記されている古典籍の文字を判別し、テキストデータ化するOCR技術を開発したと発表した。 専門家の減少、資料の経年劣化という問題に加え、大規模災害によって失われる可能性もある歴史資料のデジタル化の必要性が高まっている。しかし総数100万点以上ともいわれる江戸期以前のくずし字で記されている古典籍... 続きを読む
貴重な資料を後世に--江戸期以前の“くずし字”を判読するOCR技術が凸版印刷から - インターネットコム
凸版印刷は、江戸期以前の書物に記された“くずし字”を判別してテキストデータ化するOCR(光学文字認識)技術を開発した。 近年、災害による資料アーカイブの必要性や専門家の減少、資料の経年劣化などを理由に、歴史的資料のデジタル化・テキストデータ化が求められている。しかし、総数100万点以上ともいわれる江戸期以前のくずし字で記されている古典籍は、専門家による判読が必要とされ、テキストデータ化が遅れていた... 続きを読む
江戸期以前の“くずし字”、精度80%以上でOCR処理、凸版印刷が技術開発 -INTERNET Watch
ニュース 江戸期以前の“くずし字”、精度80%以上でOCR処理、凸版印刷が技術開発 (2015/7/3 17:44) 凸版印刷株式会社は3日、江戸期以前の“くずし字”を高精度でテキストデータ化する新方式のOCR技術を開発したと発表した。同社では、この技術を使った古典籍のテキストデータ化サービスを2015年夏より試験的に開始する予定。 「源氏物語」(絵入本、国文学研究資料館蔵)のOCR処理の例 凸版... 続きを読む
国立国会図書館デジタルコレクションが提供する資料約10万件にDOIを付与 | カレントアウェアネス・ポータル
カレントアウェアネス・ポータルは、図書館界、図書館情報学に関する最新の情報をお知らせする、国立国会図書館のサイトです。 国立国会図書館は、国立国会図書館デジタルコレクションが提供する貴重書等の古典籍、国立国会図書館が刊行した図書、雑誌、電子書籍、電子雑誌、計約10万件について、2015年2月にDOIの付与を行いました。 国立国会図書館のプレフィックスを用いたDOIは、国立国会図書館デジタルコレクシ... 続きを読む
国立国会図書館、入手困難な資料を全国の図書館にデジタル配信 約131万点を提供 - はてなブックマークニュース
国立国会図書館は1月21日(火)、同館がデジタル化した入手困難な資料を、全国の図書館に配信するサービスを開始しました。提供数は、絶版した図書や古典籍、雑誌など約131万点。サービス開始時点で参加している図書館は、札幌市中央図書館や、大阪府立中央図書館など全国23館です。 ▽ 図書館向けデジタル化資料送信サービス|国立国会図書館―National Diet Library ▽ 図書館向けデジタル化資... 続きを読む
神田の古書店に4億円超の品…南宋期の漢詩選集 : 文化 : 社会 : YOMIURI ONLINE(読売新聞)
東京都千代田区神田神保町の古書店「一誠堂書店」が11日、古典籍の展示即売会で、中国の南宋時代の12世紀頃に刊行された漢詩選集「唐人絶句」を4億6000万円で売り出した。 中国では早くから木版の印刷技術が発達し、当時出版された書籍は「宋版」と呼ばれ、書体や造本の美しさ、現存例の希少さからすでに明代から高額で取引されてきた。しかも21冊がまとまっていることから、極めて貴重という。 同店の目録などによる... 続きを読む