タグ「深層強化学習」

タグ深層強化学習

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 13 / 13件)

AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃 - WirelessWire News（ワイヤレスワイヤーニュース）

2020/10/08 113 users ブレイクスルー WirelessWire News 衝撃

AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃 2020.10.08 Updated by Ryo Shimizu on October 8, 2020, 11:13 am JST 「最近のAIがすごい」と言われてからもう6年ほどが経過した。なかでも人目を引いたのは、なんといっても2016年のAlphaGoだろう。最難関ゲームの一つと言われる囲碁におい... 続きを読む

強化学習における好奇心 - Speaker Deck

2019/05/02 57 users Speaker Deck 好奇心強化学習スパーズ報酬

強化学習では，環境で得られる報酬がスパースである場合，うまく学習することができない．この問題を解決するための手法として，強化学習のエージェントに「好奇心」を与える研究が注目されている．本スライドでは，深層強化学習の登場以降に発表された「好奇心」を利用した強化学習の研究をまとめた．特に主要ベンチマ... 続きを読む

深層強化学習の最前線 - Speaker Deck

2018/12/19 291 users Speaker Deck 最前線

All slide content and descriptions are owned by their creators. 続きを読む

深層学習用ライブラリを自作して二足歩行を学習させてみた – EL-EMENT blog

2018/06/30 94 users WebGL CUDA 二足歩行ライブラリツッコミ

WebGLとCUDAで動く深層学習用のライブラリを作って深層強化学習 (Deep Deterministic Policy Gradient, DDPG) で二足歩行を学習させました。学習環境の作成にはOimoPhysicsを使いました。開発の経緯や以下実装方法、学習結果などです。例によって怪しい個所へのツッコミは歓迎です。 >> Open Repository on GitHub これ... 続きを読む

ゼロから始める深層強化学習（NLP2018講演資料）/ Introduction of Deep Reinforcement Learni…

2018/03/24 378 users 藤田康博 Reinforcement Learning

ゼロから始める深層強化学習（NLP2018講演資料）/ Introduction of Deep Reinforcement Learning 1. ゼロから始める深層強化学習株式会社 Preferred Networks 前田新一, 藤田康博 2. チュートリアルでお話したいこと 15分 40分前田藤田 (3) 最近の応用事例 (4) 強化学習を使いこなすためのTips (5) 学習のための... 続きを読む

ゼロから始める深層強化学習（NLP2018講演資料）/ Introduction of Deep Reinforcement Learni…

2018/03/24 378 users 藤田康博 Reinforcement Learning

深層強化学習の動向 / survey of deep reinforcement learning // Speaker Deck

2017/07/20 322 users Speaker Deck 動向

All slide content and descriptions are owned by their creators. 続きを読む

最近のスパースなニューラルネットワークについて - SmartNews 開発者ブログ

2017/06/01 150 users スパーズニューラルネット GaN ニューラルネットワーク

こんにちは、スマートニュースの徳永です。深層学習業界はGANだとか深層強化学習だとかで盛り上がっていますが、今日は淡々と、スパースなニューラルネットワークの話をします。要約するとニューラルネットのスパース化によって、精度はほとんど犠牲にせずに、計算効率は3〜5倍程度まで向上できるスパース化にはまだ課題が多く、ニューラルネットの高速化という意味では、次の戦場はたぶんここになるスパースとは、ス... 続きを読む

ニューラルネットワークの量子化についての最近の研究の進展と、その重要性 - SmartNews 開発者ブログ

2017/03/08 491 users ニューラルネットワーク SmartNews GaN 進展推論

こんにちは、スマートニュースの徳永です。深層学習業界はGANだとか深層強化学習だとかで盛り上がっていますが、今日は淡々と、ニューラルネットワークの量子化の話をします。 TL;DR パラメータだけを量子化するのであれば、ほぼ精度を落とさずに、パラメータのデータ容量は1/16程度にまで削減できるパラメータ、アクティベーション、勾配のすべてを量子化し、推論だけでなく学習までもビット演算だけで実現する研... 続きを読む

論文：Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning - うどん記

2017/02/25 66 users Reinforcement Learning 論文手法

2017 - 02 - 25 論文：Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning モデルフリー系の深層強化学習の手法を用いてスマブラDX のゲームAIを作ったという論文が出ていたので読んだ。以下はそのメモ。概要論文URL : https://arxiv.org/abs/... 続きを読む

深層強化学習でシステムトレードをやる時に役に立ちそうな資料まとめ - ニートの言葉

2016/11/15 381 users ニートシステムトレード AlphaGo 言葉資料まとめ

2016 - 11 - 15 深層強化学習でシステムトレードをやる時に役に立ちそうな資料まとめ人工知能 Photo via Visual Hunt 少し前のことですが、AlphaGoという囲碁の人工知能プログラムがイ・セドル九段に勝利したことで話題になりました。 *1 また、一部のゲームにおいて「DQN（Deep Q-network）」が人間よりも上手くプレイするようになったというニュースも話題... 続きを読む

ディープラーニングが活かすIoT

2015/06/12 322 users IoT pfn RNN ディープラーニング VAE

Transcript 1. ディープラーニングが活かすIoT 岡野原　⼤大輔 hillbig@preferred.jp Preferred Networks, Inc. 2015/06/09 Interop 2015 セミナー 2. アジェンダ l  IoT時代の深層学習 –  RNN –  VAE –  深層強化学習 l  PFNの取り組み –  デモ：深層強化学習 + データ同... 続きを読む

Google、ゼロからゲームをプレイして自力で攻略方法を見つける人工知能「DQN」開発 -INTERNET Watch

2015/02/26 81 users DQN Deep Q-Network 自力人工知能制御

ニュース Google、ゼロからゲームをプレイして自力で攻略方法を見つける人工知能「DQN」開発（2015/2/26 16:52）米Googleは、深層強化学習アルゴリズムを用いた人工知能「DQN」を開発したと発表した。DQNは「Deep Q-network」の略で、自力でコンピューターゲームをプレイし、攻略方法を見つけ出すことができる。深層強化学習を通して人間レベルの制御を可能にするもの。... 続きを読む

(1 - 13 / 13件)