タグ 国立国語研究所
人気順 5 users 50 users 100 users 500 users 1000 users「江戸時代の日本人の識字率は世界イチ」という説は「嘘」だった…!882人調査から読み解く、日本の「知性格差」(佐藤 喬) @gendai_biz
「江戸時代の日本人の識字率は世界イチ」という説は「嘘」だった…!882人調査から読み解く、日本の「知性格差」 江戸の庶民は文字が読めた? まるで人間のような自然な作文をするAIが話題になった2023年、いくつかの新聞が、「読み書き」を巡る目立たないニュースを報じた。それは、国立国語研究所(東京)が、1948年以... 続きを読む
出前授業 : 捜真女学校(中学部) - ニュース - ことば研究館
国立国語研究所では、小・中学生が「ことばっておもしろい」と感じてくれるようなプログラムを実施しています。2023年6月21日(水)、柏野和佳子准教授が横浜市の捜真女学校を訪問し、「めざせ! 辞書引きの達人」というテーマで中学1年生のみなさんに出前授業を実施しました。 『岩波国語辞典 第八版』の編者も務めた柏... 続きを読む
書評『ルポ 誰が国語力を殺すのか』(石井光太著 文藝春秋 2022年7月刊) | 未草
国立国語研究所名誉所員 甲斐睦朗 1.はじめに 全国紙に上掲図書『ルポ 誰が国語力を殺すのか』の衝撃的な広告が掲載されていたので、急いで取り寄せた。その衝撃的な広告は、図書の帯にも再掲されている次の表現である。 〈「ごんぎつね」で「母の死体を煮ている」と誤読する小学生たち〉 この内容は、本書の序章「『... 続きを読む
西大寺本金光明最勝王経平安初期点の「ひまわり」用XMLを読み解く - kzhr's diary
国立国語研究所からこの11月30日に「西大寺本金光明最勝王経平安初期点」訓読文の「ひまわり」用XMLとテキストデータが公開されました。 www2.ninjal.ac.jp 今回は、そのXMLについて読み解いてみたいと思います。 (当初は書きかけで公開していました。これで完全版です。) 西大寺本金光明最勝王経平安初期点って? 西... 続きを読む
国立国語研究所、「語彙研究文献語別目録」の全文テキストデータを公開 | カレントアウェアネス・ポータル
2019年10月25日、国立国語研究所は、「語彙研究文献語別目録」の全文テキストデータの公開を発表しました。 「語彙研究文献語別目録」は、佐藤喜代治氏編『講座日本語の語彙別巻』(明治書院、1983年)所収の目録であり、個々の語にどのような研究文献があるかを語別に検索することが可能です。今回、「編集のことば」「... 続きを読む
GiNZAで始める日本語依存構造解析 〜CaboCha, UDPipe, Stanford NLPとの比較〜
GiNZAで始める日本語依存構造解析 〜CaboCha, UDPipe, Stanford NLPとの比較〜 1. GiNZAで始める 日本語依存構造解析 CaboCha, UDPipe, Stanford NLP との比較 2019.09.04 Universal Dependencies シンポジウム@ 国立国語研究所 Megagon Labs リサーチサイエンティスト 松田寛 @hmtd223 (twitter) 2. 発表者略歴 • 松田... 続きを読む
Python向け日本語自然言語処理ライブラリ「GiNZA」、リクルートがGitHubで公開:新元号「令和」にも対応 - @IT
リクルートは2019年4月2日、Python向け日本語自然言語処理ライブラリ「GiNZA(ギンザ)」をオープンソースソフトとして公開したと発表した。1.0.1版では新元号「令和」にも対応した。 公開したのは同社のAI(人工知能)研究機関であるMegagon Labs。同ライブラリでは、国立国語研究所との共同研究成果の学習モデルを用い... 続きを読む
リクルートのAI研究機関、国立国語研究所との共同研究成果を用いた日本語の自然言語処理ライブラリ「GiNZA」を公開 | Recruit - リクルートグループ
株式会社リクルートホールディングスの中間持ち株会社である株式会社リクルート(本社:東京都千代田区、代表取締役社長:北村吉弘、以下リクルート)は、このたび、当社のAI研究機関であるMegagon Labsより、国立国語研究所との共同研究成果の学習モデルを用いたPython(※1)向け日本語自然言語処理オープンソースライ... 続きを読む
シンポジウム 「変体仮名のこれまでとこれから」 | 国立国語研究所
プロジェクト名・リーダー名 人間文化研究機構 広領域連携基幹研究プロジェクト 「異分野融合による総合書物学の構築」 国立国語研究所ユニット 「表記情報と書誌形態情報を加えた日本語歴史コーパスの精緻化」 高田 智和 (国立国語研究所 言語変化研究領域 准教授) 共催 情報処理推進機構 国際標準推進センター 国文学研究資料館 古典籍共同研究事業センター 開催期日 平成29年11月25日 (土) 13:... 続きを読む
258億語の日本語コーパスをウェブで公開~国立国語研究所 -INTERNET Watch
ニュース 258億語の日本語コーパスをウェブで公開~国立国語研究所 言語研究や自然言語処理技術開発での基礎資料 岩崎 宰守 2017年3月6日 14:51 大学共同利用機関法人人間文化研究機構国立国語研究所は、258億語規模の「国語研日本語ウェブコーパス(NWJC)」と、これを対象にした検索システム「梵天」を3月7日より一般公開する。 生活で使われた書きことばや話しことばのデータを大量に集積し... 続きを読む
国立国語研究所が「学術情報交換用変体仮名」データベース試験公開、文字画像のPNG/JPGファイルをCCライセンスで提供 -INTERNET Watch
ニュース 国立国語研究所が「学術情報交換用変体仮名」データベース試験公開、文字画像のPNG/JPGファイルをCCライセンスで提供 (2015/10/20 15:52) 大学共同利用機関法人人間文化研究機構国立国語研究所(NINJAL)は、ウェブサイトで公開しているデータベース集として「学術情報交換用変体仮名」の試験提供を開始した。 293文字の文字画像(字形)と変体仮名番号の一覧のほか、各種字典や... 続きを読む
日本人は「バイリンガル化」 方言と共通語使い分け :日本経済新聞
60年間で日本人は「バイリンガル化」し、時と場合に応じて方言と共通語を使い分けるようになった――。国立国語研究所(東京都立川市)などは、山形県鶴岡市の住民を対象に20年に1度実施している「鶴岡調査」の4回目の結果から、こんな報告をまとめた。 調査は日本人の言葉の使い方の変化をみるのが目的。他の方言の影響が小さいとみられた鶴岡弁に注目し、1950年に約500人の鶴岡市民を対象に第1回調査を実施。第2... 続きを読む
横浜発祥じゃないじゃん なぜ横浜弁に?:朝日新聞デジタル
「そう言ったじゃん」「いいじゃんよ」。語尾につく「じゃん」は横浜弁とも言われるが、長年方言を研究し、国語審議会委員も務めた国立国語研究所の井上史雄客員教授(72)は「横浜発祥ではありません」。なぜ横浜弁として知られるようになったのか――。 「三河地方(愛知県)では昔からじゃんを使っている」「山梨こそ本家だ」。井上名誉教授が以前、あるテレビ番組で「じゃん」について話をしたら、各地から名乗りが上がった... 続きを読む
「鼻濁音」来世紀ほぼ消滅? もともと使わない地域も…:朝日新聞デジタル
日本語で優しく響く発音とされるガ行の「鼻濁音(びだくおん)」を日常生活で使う人は5人に1人しかおらず、全国的に著しく衰退しつつあることが、国立国語研究所の調査でわかった。来世紀には東北地方でわずかに残るだけとなり、それ以外の地域は消滅する可能性が高いという。 ガギグゲゴには通常の濁音と、息を鼻に抜いてやわらかく発音する鼻濁音がある。たとえば「学校」のガは通常の濁音で、「鏡」のガは鼻濁音で発音する。... 続きを読む
「鼻濁音」来世紀ほぼ消滅? もともと使わない地域も… (朝日新聞デジタル) - Yahoo!ニュース
日本語で優しく響く発音とされるガ行の「鼻濁音(びだくおん)」を日常生活で使う人は5人に1人しかおらず、全国的に著しく衰退しつつあることが、国立国語研究所の調査でわかった。来世紀には東北地方でわずかに残るだけとなり、それ以外の地域は消滅する可能性が高いという。 ガギグゲゴには通常の濁音と、息を鼻に抜いてやわらかく発音する鼻濁音がある。たとえば「学校」のガは通常の濁音で、「鏡」のガは鼻濁音で発音する。... 続きを読む
国立国語研究所が米国議会図書館蔵『源氏物語』原本画像を公開 まずは「桐壺」のみを試験的に | カレントアウェアネス・ポータル
2013年3月27日、国立国語研究所は、米国議会図書館(LC)の所蔵する『源氏物語』の原本画像を公開しました。現在は、「桐壺」巻のみを試験的に公開している段階のようです。 このウェブサイトでは、原本画像を表示させるほか、画像と翻字本文とを対照表示させることもできるようになっています。 米国議会図書館蔵 『源氏物語』画像(桐壺・須磨・柏木) http://www2.ninjal.ac.jp/lcge... 続きを読む
日本語話し言葉コーパス
『日本語話し言葉コーパス』は、日本語の自発音声を大量にあつめて多くの研究用情報を付加した話し言葉研究用のデータベースであり、国立国語研究所・ 情報通信研究機構(旧通信総合研究所)・ 東京工業大学 が共同開発した、質・量ともに世界最高水準の話し言葉データベースです。本コーパスは音声言語情報処理、自然言語処理、 日本語学、言語学、音声学、心理学、社会学、日本語教育、辞書編纂など幅広い領域で利用されて... 続きを読む
国立国語研究所、書籍やブログなどから抽出した1億語の現代日本語コーパスを検索できる「中納言」を公開 | カレントアウェアネス・ポータル
2011年8月9日、国立国語研究所が「現代日本語書き言葉均衡コーパス」をオンラインで検索できるツール「中納言」を公開しました。短単位、長単位、文字列の3つの方法による検索ができるのが特徴だそうです。「現代日本語書き言葉均衡コーパス」は人間文化研究機構国立国語研究所が構築した現代日本語のコーパスで、書籍、雑誌、新聞、白書、教科書、広報紙、Webの掲示板、ブログなどから抽出した約1億語の日本語が含まれ... 続きを読む
国立国語研究所、雑誌『国語学』の論文テキストデータを全面公開 | カレントアウェアネス・ポータル
2011年5月31日に国立国語研究所は、提供している「雑誌『国語学』全文データベース」において、日本語学会の(旧)機関誌である『国語学』掲載論文のテキストデータを全面的に公開したようです。併せて、2010年7月までに一般公開されていた範囲のPDFファイルについても公開したと発表しています。 雑誌『国語学』全文データベース (国立国語研究所のウェブサイト) http://www.ninjal.ac.... 続きを読む