タグ「Reinforcement Learning」

タグ Reinforcement Learning

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 5 / 5件)

Microsoftが公開したテキストアドベンチャーゲームで強化学習を行うためのツールTextWorldで人間が遊んでみた｜ Developers.IO

2018/08/15 54 users テキストアドベンチャーゲームアドベンチャーゲーム人間

はじめに先月、Microsoftからテキストアドベンチャーゲームで強化学習を行うためのツールTextWorldが公開されました。 TextWorld: A learning environment for training reinforcement learning agents, inspired by text-based games - Microsoft Research テキストアドベンチャーゲームとは、アドベンチャーゲームと... 続きを読む

ゼロから始める深層強化学習（NLP2018講演資料）/ Introduction of Deep Reinforcement Learni…

2018/03/24 378 users 藤田康博 Preferred Networks Tips

ゼロから始める深層強化学習（NLP2018講演資料）/ Introduction of Deep Reinforcement Learning 1. ゼロから始める深層強化学習株式会社 Preferred Networks 前田新一, 藤田康博 2. チュートリアルでお話したいこと 15分 40分前田藤田 (3) 最近の応用事例 (4) 強化学習を使いこなすためのTips (5) 学習のための... 続きを読む

ゼロから始める深層強化学習（NLP2018講演資料）/ Introduction of Deep Reinforcement Learni…

2018/03/24 378 users 藤田康博 Preferred Networks Tips

論文：Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning - うどん記

2017/02/25 66 users スマブラDX arXiv.org 論文深層強化学習手法

2017 - 02 - 25 論文：Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning モデルフリー系の深層強化学習の手法を用いてスマブラDX のゲームAIを作ったという論文が出ていたので読んだ。以下はそのメモ。概要論文URL : https://arxiv.org/abs/... 続きを読む

深層強化学習ライブラリChainerRL | Preferred Research

2017/02/20 159 users Preferred Research pfnet 藤田以下

Chainerを使った深層強化学習ライブラリChainerRLを公開しました． https://github.com/pfnet/chainerrl PFNエンジニアの藤田です．社内でChainerを使って実装していた深層強化学習アルゴリズムを”ChainerRL”というライブラリとしてまとめて公開しました．RLはReinforcement Learning（強化学習）の略です．以下のような最近の... 続きを読む

(1 - 5 / 5件)