タグ うどん記
人気順 5 users 50 users 100 users 500 users 1000 users論文紹介: The Ramanujan Machine: Automatically Generated Conjectures on Fundamental Constants - うどん記
2019/06/30 に arXiv にアップロードされた論文である The Ramanujan Machine: Automatically Generated Conjectures on Fundamental Constants を読んだのでその概要をメモしようと思います。 概要 円周率 $\pi$ や自然対数の底 $e$ といった数学の定数を含む式は規則的な項を持つ連分数で表現できることが知られていま... 続きを読む
PFN で働いて5年が経ちました - うどん記
気がついたらPFNでエンジニアとして働いてほぼ5年が経過しました。入社までの過程とそれ以降について軽く振り返ってみたいと思います。 大学入学より前 さかのぼりすぎ?って感じもしますが、せっかくなので書きます。 小学6年生の冬休みあたりからプログラミングを始めました。当時は子供心ながらゲームを自分で作って... 続きを読む
最高落下速度環境で動くテトリスのゲームAIを作った - うどん記
2017 - 11 - 05 最高落下速度環境で動くテトリスのゲームAIを作った 「最高落下速度(20G)」かつ「クラシック方式の回転法則」という高難易度環境の テトリス で良い感じに動くゲームAIを作りました。以下はそのデモです。 ソースコード を github で公開しています: https://github.com/ir5/tetris20g-ai ゲームのルール テトリス は知っている方が... 続きを読む
AlphaGo と AlphaGo Zero の自己対戦による学習部分の違い - うどん記
2017 - 10 - 29 AlphaGo と AlphaGo Zero の自己対戦による学習部分の違い 流し読みだとちゃんと分からなかったのでメモ。 準備(AlphaGo) policy network : 盤面とその特徴量を入力として受け取り、各マスに打つ確率を返す ニューラルネット 。 value network: 盤面とその特徴量を入力として受け取り、その盤面での勝率を返す ニューラルネ... 続きを読む
論文:Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning - うどん記
2017 - 02 - 25 論文:Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning モデルフリー系の深層強化学習の手法を用いて スマブラDX のゲームAIを作ったという論文が出ていたので読んだ。以下はそのメモ。 概要 論文URL : https://arxiv.org/abs/... 続きを読む
情報オリンピック春合宿で講義しました - うどん記
2015-03-29 情報オリンピック春合宿で講義しました 1週間前の出来事ですが「機械学習とその理論」というタイトルで講義しました.大体 PAC 学習の話してます.スライドを公開しているので以下にそのリンクを載せます. 機械学習とその理論 (情報オリンピック2015春合宿講義資料) from irrrrr 今回の講義では,才能がありそうな若い人らを前にどんなことを話せばいいか,テーマ選びに少し悩... 続きを読む
ICALP 2014 に論文採択されました - うどん記
2014-04-12 ICALP 2014 に論文採択されました M.Kusumoto, and Y.Yoshida . "Testing Forest-Isomorphism in the Adjacency List Model." ICALP 2014, to appear.修論の成果で投稿した論文が国際会議のICALP2014に採択されました. ICALP(International Co... 続きを読む