タグ 国立情報学研究所
人気順 10 users 50 users 100 users 500 users 1000 users“学習データも全てオープン”なLLM、NIIが公開 GPT-3級モデルのプレビュー版
国立情報学研究所(NII)は9月17日、パラメータ数約1720億の大規模言語モデル(LLM)のプレビュー版「LLM-jp-3 172B beta1」を公開した。NIIが開発するLLMは、データをフルスクラッチで学習しており、AIモデルの他に学習データもオープンになっているのが特徴。プレビュー版モデルは、学習データの約3分の1までを学習し... 続きを読む
【全篇】『大震災以前 帝都の壯觀』1925年|「関東大震災映像デジタルアーカイブ」より ‘Films of the Great Kanto Earthquake of 1923’
本作品は、国立映画アーカイブ所蔵の震災関連映画を紹介するWEBサイト「関東大震災映像デジタルアーカイブ」https://kantodaishinsai.filmarchives.jp (制作:国立映画アーカイブ、国立情報学研究所)の公開作品です。 『大震災以前 帝都の壯觀』(ダイシンサイイゼン テイトノソウカン、1925年) 作品クレジット=八千... 続きを読む
国立情報学研究所における大規模言語モデル構築への協力について|国立国会図書館―National Diet Library
2024年1月29日、国立国会図書館は、国立国会図書館インターネット資料収集保存事業(WARP)において収集保存した数十億件のファイルのURLリストを提供することについて、国立情報学研究所(NII)と合意しました。 提供したURLリストは、NIIにおける大規模言語モデル(LLM)の構築を目的として、主にコーパス用データを収... 続きを読む
第6回 LLM 勉強会
2023年11月29日(水)に国立情報学研究所にて第6回 LLM 勉強会を開催しました。 プログラム LLM-jp 状況報告(黒橋) [資料] LLMの安全対策サーベイと日本語データ(理研AIP 鈴木久美) [資料] ビジネスのドメインや最新情報に対応した130億パラメータの日本語事前学習モデルの開発(ストックマーク 近江) [資料] 医療... 続きを読む
注目の日本語大規模モデルLLM-JP 13Bを試す(JSON吐けた)|shi3z
国立情報学研究所が作ったLLM-JP 13Bが公開されていたので早速試してみた。色々なモデルが公開されているが、全部盛りっぽい 「llm-jp/llm-jp-13b-instruct-full-jaster-dolly-oasst-v1.0」を試す。 マシンはもちろんドスパラ製Memeplexマシン(A6000x2)だ。 import torch from transformers import AutoTokenizer, AutoM... 続きを読む
NII、130億パラメータのLLM構築 コーパスなども全公開 「今後の研究に資するため」
国立情報学研究所(NII)は10月20日、パラメータ数130億の大規模言語モデル(LLM)「LLM-jp-13B」を公開した。初期段階のモデルだが、アカデミアや産業界の研究開発に資するため、コーパスやツールなどを含めてすべてオープンにする。 公開したLLMの学習データ量は合計約3000億トークン。うち日本語は約1450億トークン(... 続きを読む
歴史的地名の「行政区画変遷」を大規模オープンデータ化~『日本歴史地名大系』を平凡社地図出版との協働により機械可読データとして強化~ - 国立情報学研究所 / National Institute of Informat
2023/10/18 歴史的地名の「行政区画変遷」を大規模オープンデータ化 ~『日本歴史地名大系』を平凡社地図出版との協働により機械可読データとして強化~ 情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター(以下ROIS-DS CODH、センター長 北本朝展)と株式会社平凡社地図... 続きを読む
「世界トップレベルの大規模言語モデルの開発に着手」──産総研らが表明 目指すのは“GPT-3級の日本語LLM”
「世界トップレベルの大規模言語モデル(LLM)の開発を始める」──産業技術総合研究所は、そんな声明を発表した。 産業技術総合研究所は10月17日、世界トップレベルの大規模言語モデル(LLM)の開発を始めると発表した。産総研の他にも東京工業大学や、国立情報学研究所が主宰するLLM研究開発チーム「LLM-jp」(東北大学... 続きを読む
「OpenAIはもはやオープンではない」国立情報学研究所・黒橋所長がLLM研究語る
「研究開発が一部の組織の寡占状態にあることは健全とは思えない」――。 米OpenAI(オープンAI)の「ChatGPT」など大規模言語モデル(LLM)が注目を集める中で、国立情報学研究所所長で京都大学特定教授の黒橋禎夫氏が2023年9月27日、「日経クロステックNEXT 東京 2023」(主催:日経BP、東京国際フォーラム)に登壇し、... 続きを読む
丸善雄松堂株式会社、国立情報学研究所(NII)に電子書籍に係る書誌データを提供することで合意
2023年8月23日、丸善雄松堂株式会社が、国立情報学研究所(NII)に、同社が保有する電子書籍に係る書誌データ約12万件を提供することについて、2023年7月に合意したことを発表しました。 発表によると、同社の電子図書館サービスである「Maruzen eBook Library」で提供されている電子書籍の書誌データについて、NIIが構... 続きを読む
第2回 LLM 勉強会
2023年6月19日(月)に国立情報学研究所にて第2回 LLM 勉強会を開催しました。 プログラム 勉強会の運営に関する議論(黒橋) NII からの話題提供(相澤) [資料] NICT の活動報告(鳥澤) [資料] ABCI トライアルの報告(坂口) [資料] レトリバからの話題提供(西鳥羽) [資料] サイバーエージェントからの話題提供(... 続きを読む
第1回 LLM 勉強会
2023年5月15日(月)に国立情報学研究所にて初回となる LLM 勉強会を開催しました。 プログラム 勉強会の趣旨、国の動向など [資料] 黒橋禎夫(国立情報学研究所) 現状の LLM のサーベイ [資料] 河原大輔(早稲田大学) 菅原朔(国立情報学研究所) 栗田修平(理化学研究所) 各機関での試みの紹介 河原大輔(早稲田大... 続きを読む
第1回 LLM 勉強会
2023年5月15日(月)に国立情報学研究所にて初回となる LLM 勉強会を開催しました。 プログラム 勉強会の趣旨、国の動向など [資料] 黒橋禎夫(国立情報学研究所) 現状の LLM のサーベイ [資料] 河原大輔(早稲田大学) 菅原朔(国立情報学研究所) 栗田修平(理化学研究所) 各機関での試みの紹介 河原大輔(早稲田大... 続きを読む
ChatGPTが教育にもたらす影響は? NIIが「講演映像まとめリスト」公開
NIIが、過去に実施したChatGPTに関する講演映像をリストにまとめた。4月28日時点では全5本を掲載しており、いずれも無料で視聴できる。 国立情報学研究所(NII)は4月28日、定期開催している教育機関向けオンラインシンポジウムで配信した映像のうち、ChatGPTに関する講演をまとめたリストを公開した。 28日時点で5本の... 続きを読む
米国、即座OAの方針を発表|学術情報流通|国立情報学研究所 オープンサイエンス基盤研究センター
昨日2022年8月25日、米・科学技術政策局(OSTP)は、公的資金を得て生み出された研究成果について、論文出版と同時に、論文及び根拠データがオープンアクセス(OA)となる、「即座OA」の方針を打ち出しました。 米国の研究助成機関は、1億ドル以上の年間研究開発費の研究助成について180日以内、それ以外の研究助成につ... 続きを読む
国立情報学研究所の次期所長に黒橋禎夫氏が決定 2023年4月1日付けで就任|KKS Web:教育家庭新聞ニュース|教育家庭新聞社
情報・システム研究機構は、2023年3月31日をもって任期満了となる国立情報学研究所長について、同機構教育研究評議会での審議を経て、黒橋禎夫(くろはし さだお)氏を次期国立情報学研究所長とすることを決定した。なお、次期国立情報学研究所長は、2023年4月1日付けで発令となる。 ■任期満了に伴い次年度から黒橋禎夫... 続きを読む
超高速学術ネットの開通式 「サイネット6」―国立情報学研究所:時事ドットコム
超高速学術ネットの開通式 「サイネット6」―国立情報学研究所 2022年05月30日22時26分 学術情報通信ネットワーク「サイネット6」のオンライン開通式で説明する国立情報学研究所の喜連川優所長(右)=30日午後、東京都千代田区の学術総合センター 国立情報学研究所(東京都千代田区)は30日、全国約1000の大... 続きを読む
CiNii - お知らせ - CiNii ArticlesのCiNii Researchへの統合の延期について - サポート - 学術コンテンツサービス - 国立情報学研究所
これまでCiNii ArticlesのCiNii Researchへの統合について、2022年3月31日(木)18時にCiNii ArticlesのアクセスをCiNii Researchにリダイレクトさせるとお知らせしましたが、この統合時期を延期し、CiNii Articlesに、2022年3月31日(木)18時以降もアクセスできるようにします。 延期期間中のCiNii Articlesでは、引き続き... 続きを読む
関東大震災の記録映画をウェブ公開 国立映画アーカイブ:朝日新聞デジタル
記録映画を通して巨大災害についての知識や関心を高めてもらおうと、国立映画アーカイブと国立情報学研究所(いずれも東京)は1日、ウェブサイト「関東大震災映像デジタルアーカイブ」を開設し、震災後の東京や横浜を映した記録映画「関東大震大火実況(かんとうたいしんたいかじっきょう)」を公開した。発生から100年... 続きを読む
大学図書館向け学術情報システムを36年ぶりに一新学術資料のデジタル化に対応した目録所在情報サービスを2022年から順次運用開始 - 国立情報学研究所 / National Institute of Informatics
2021/06/17 大学図書館向け学術情報システムを36年ぶりに一新 学術資料のデジタル化に対応した目録所在情報サービスを2022年から順次運用開始 大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(NIIエヌアイアイ、所長:喜連川 優、東京都千代田区)は、大学図書館を中心に約1,300機関が利用する目録所在... 続きを読む
(修正)機械学習デザインパターン(ML Design Patterns)の解説
(修正)機械学習デザインパターン(ML Design Patterns)の解説 1. 機械学習デザインパターン (ML Design Patterns)の解説 鷲崎 弘宜 早稲田大学 / 国立情報学研究所 / システム情報 / エクスモーション 2021年 3月30日 v20210330-2 washizaki@waseda.jp http://www.washi.cs.waseda.ac.jp/ 1 スマートエスイー JST未... 続きを読む
双方向授業に待ったがかかる。国立情報学研究所「オンライン授業のデータダイエットにご協力ください」 - Togetter
休校期間延長によりオンライン授業に取り組む学校が増えています。これらのオンライン授業による通信量をダイエット(削減)するよう国立情報学研究所は呼びかけてました。この呼びかけに反応した大学の先生たちの意見を中心にまとめました。 続きを読む
データダイエットへの協力のお願い:遠隔授業を主催される先生方へ - イベント - 国立情報学研究所 / National Institute of Informatics
情報通信回線は全国民が共有する有限の資源です。通信量が情報通信回線の限界を超えるとすべての利用者が大きな影響を受けます。1600万人の生徒・学生が、この世界的な災禍の中でも十分な学習ができるように、「データダイエット」に協力しましょう。 オンライン授業は通信量(データ量)が極力小さくなるように工夫... 続きを読む
全国の「自粛率」算出 地域によって大きな差 新型コロナ | NHKニュース
新型コロナウイルスの感染拡大で全国に緊急事態宣言が出される中、国立情報学研究所などのグループが携帯電話のデータを基に全国各地で外出がどれだけ自粛されているかを推計した結果、地域によって大きな差があることが分かりました。 グループでは、住宅が多い地域の昼と夜の人口の差からどれだけ外出したかを500メー... 続きを読む
職場が遠い人 優先的に出勤減で感染拡大防止の効果大 | NHKニュース
新型コロナウイルスの対策として職場に出勤する人を減らす取り組みが広がっていますが、国立情報学研究所などのグループが自宅が遠い人の出勤を優先的に減らすことで感染拡大を防ぐ効果を大幅に高められるとするシミュレーションの結果をまとめました。 グループでは、東京都と埼玉県、神奈川県、千葉県、それに茨城県の... 続きを読む