はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 深層強化学習

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 13 / 13件)
 

AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃 - WirelessWire News(ワイヤレスワイヤーニュース)

2020/10/08 このエントリーをはてなブックマークに追加 113 users Instapaper Pocket Tweet Facebook Share Evernote Clip ブレイクスルー WirelessWire News 衝撃

AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃 2020.10.08 Updated by Ryo Shimizu on October 8, 2020, 11:13 am JST 「最近のAIがすごい」と言われてからもう6年ほどが経過した。 なかでも人目を引いたのは、なんといっても2016年のAlphaGoだろう。最難関ゲームの一つと言われる囲碁におい... 続きを読む

強化学習における好奇心 - Speaker Deck

2019/05/02 このエントリーをはてなブックマークに追加 57 users Instapaper Pocket Tweet Facebook Share Evernote Clip Speaker Deck 好奇心 強化学習 スパーズ 報酬

強化学習では,環境で得られる報酬がスパースである場合,うまく学習することができない.この問題を解決するための手法として,強化学習のエージェントに「好奇心」を与える研究が注目されている.本スライドでは,深層強化学習の登場以降に発表された「好奇心」を利用した強化学習の研究をまとめた.特に主要ベンチマ... 続きを読む

深層強化学習の最前線 - Speaker Deck

2018/12/19 このエントリーをはてなブックマークに追加 291 users Instapaper Pocket Tweet Facebook Share Evernote Clip Speaker Deck 最前線

All slide content and descriptions are owned by their creators. 続きを読む

深層学習用ライブラリを自作して二足歩行を学習させてみた – EL-EMENT blog

2018/06/30 このエントリーをはてなブックマークに追加 94 users Instapaper Pocket Tweet Facebook Share Evernote Clip WebGL CUDA 二足歩行 ライブラリ ツッコミ

WebGLとCUDAで動く深層学習用のライブラリを作って深層強化学習 (Deep Deterministic Policy Gradient, DDPG) で二足歩行を学習させました。学習環境の作成にはOimoPhysicsを使いました。 開発の経緯や以下実装方法、学習結果などです。例によって怪しい個所へのツッコミは歓迎です。 >> Open Repository on GitHub これ... 続きを読む

ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learni…

2018/03/24 このエントリーをはてなブックマークに追加 378 users Instapaper Pocket Tweet Facebook Share Evernote Clip 藤田康博 Reinforcement Learning

ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning 1. ゼロから始める深層強化学習 株式会社 Preferred Networks 前田新一, 藤田康博 2. チュートリアルでお話したいこと 15分 40分前田 藤田 (3) 最近の応用事例 (4) 強化学習を使いこなすためのTips (5) 学習のための... 続きを読む

ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learni…

2018/03/24 このエントリーをはてなブックマークに追加 378 users Instapaper Pocket Tweet Facebook Share Evernote Clip 藤田康博 Reinforcement Learning

ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning 1. ゼロから始める深層強化学習 株式会社 Preferred Networks 前田新一, 藤田康博 2. チュートリアルでお話したいこと 15分 40分前田 藤田 (3) 最近の応用事例 (4) 強化学習を使いこなすためのTips (5) 学習のための... 続きを読む

深層強化学習の動向 / survey of deep reinforcement learning // Speaker Deck

2017/07/20 このエントリーをはてなブックマークに追加 322 users Instapaper Pocket Tweet Facebook Share Evernote Clip Speaker Deck 動向

All slide content and descriptions are owned by their creators. 続きを読む

最近のスパースなニューラルネットワークについて - SmartNews 開発者ブログ

2017/06/01 このエントリーをはてなブックマークに追加 150 users Instapaper Pocket Tweet Facebook Share Evernote Clip スパーズ ニューラルネット GaN ニューラルネットワーク

こんにちは、スマートニュースの徳永です。深層学習業界はGANだとか深層強化学習だとかで盛り上がっていますが、今日は淡々と、スパースなニューラルネットワークの話をします。 要約すると ニューラルネットのスパース化によって、精度はほとんど犠牲にせずに、計算効率は3〜5倍程度まで向上できる スパース化にはまだ課題が多く、ニューラルネットの高速化という意味では、次の戦場はたぶんここになる スパースとは、ス... 続きを読む

ニューラルネットワークの量子化についての最近の研究の進展と、その重要性 - SmartNews 開発者ブログ

2017/03/08 このエントリーをはてなブックマークに追加 491 users Instapaper Pocket Tweet Facebook Share Evernote Clip ニューラルネットワーク SmartNews GaN 進展 推論

こんにちは、スマートニュースの徳永です。深層学習業界はGANだとか深層強化学習だとかで盛り上がっていますが、今日は淡々と、ニューラルネットワークの量子化の話をします。 TL;DR パラメータだけを量子化するのであれば、ほぼ精度を落とさずに、パラメータのデータ容量は1/16程度にまで削減できる パラメータ、アクティベーション、勾配のすべてを量子化し、推論だけでなく学習までもビット演算だけで実現する研... 続きを読む

論文:Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning - うどん記

2017/02/25 このエントリーをはてなブックマークに追加 66 users Instapaper Pocket Tweet Facebook Share Evernote Clip Reinforcement Learning 論文 手法

2017 - 02 - 25 論文:Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning モデルフリー系の深層強化学習の手法を用いて スマブラDX のゲームAIを作ったという論文が出ていたので読んだ。以下はそのメモ。 概要 論文URL : https://arxiv.org/abs/... 続きを読む

深層強化学習でシステムトレードをやる時に役に立ちそうな資料まとめ - ニートの言葉

2016/11/15 このエントリーをはてなブックマークに追加 381 users Instapaper Pocket Tweet Facebook Share Evernote Clip ニート システムトレード AlphaGo 言葉 資料まとめ

2016 - 11 - 15 深層強化学習でシステムトレードをやる時に役に立ちそうな資料まとめ 人工知能 Photo via Visual Hunt 少し前のことですが、AlphaGoという囲碁の人工知能プログラムがイ・セドル九段に勝利したことで話題になりました。 *1 また、一部のゲームにおいて「DQN(Deep Q-network)」が人間よりも上手くプレイするようになったというニュースも話題... 続きを読む

ディープラーニングが活かすIoT

2015/06/12 このエントリーをはてなブックマークに追加 322 users Instapaper Pocket Tweet Facebook Share Evernote Clip IoT pfn RNN ディープラーニング VAE

Transcript 1. ディープラーニングが 活かすIoT 岡野原  ⼤大輔 hillbig@preferred.jp Preferred  Networks,  Inc. 2015/06/09 Interop 2015 セミナー 2. アジェンダ l  IoT時代の深層学習 –  RNN –  VAE –  深層強化学習 l  PFNの取り組み –  デモ:深層強化学習  +  データ同... 続きを読む

Google、ゼロからゲームをプレイして自力で攻略方法を見つける人工知能「DQN」開発 -INTERNET Watch

2015/02/26 このエントリーをはてなブックマークに追加 81 users Instapaper Pocket Tweet Facebook Share Evernote Clip DQN Deep Q-Network 自力 人工知能 制御

ニュース Google、ゼロからゲームをプレイして自力で攻略方法を見つける人工知能「DQN」開発 (2015/2/26 16:52) 米Googleは、深層強化学習アルゴリズムを用いた人工知能「DQN」を開発したと発表した。DQNは「Deep Q-network」の略で、自力でコンピューターゲームをプレイし、攻略方法を見つけ出すことができる。 深層強化学習を通して人間レベルの制御を可能にするもの。... 続きを読む

 
(1 - 13 / 13件)