タグ「深層強化学習」

タグ深層強化学習

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 23 / 23件)

ニューラルネットワークの量子化についての最近の研究の進展と、その重要性 - SmartNews 開発者ブログ

2017/03/08 491 users ニューラルネットワーク SmartNews GaN 進展推論

こんにちは、スマートニュースの徳永です。深層学習業界はGANだとか深層強化学習だとかで盛り上がっていますが、今日は淡々と、ニューラルネットワークの量子化の話をします。 TL;DR パラメータだけを量子化するのであれば、ほぼ精度を落とさずに、パラメータのデータ容量は1/16程度にまで削減できるパラメータ、アクティベーション、勾配のすべてを量子化し、推論だけでなく学習までもビット演算だけで実現する研... 続きを読む

深層強化学習でシステムトレードをやる時に役に立ちそうな資料まとめ - ニートの言葉

2016/11/15 381 users ニートシステムトレード AlphaGo 言葉資料まとめ

2016 - 11 - 15 深層強化学習でシステムトレードをやる時に役に立ちそうな資料まとめ人工知能 Photo via Visual Hunt 少し前のことですが、AlphaGoという囲碁の人工知能プログラムがイ・セドル九段に勝利したことで話題になりました。 *1 また、一部のゲームにおいて「DQN（Deep Q-network）」が人間よりも上手くプレイするようになったというニュースも話題... 続きを読む

ゼロから始める深層強化学習（NLP2018講演資料）/ Introduction of Deep Reinforcement Learni…

2018/03/24 378 users 藤田康博 Reinforcement Learning

ゼロから始める深層強化学習（NLP2018講演資料）/ Introduction of Deep Reinforcement Learning 1. ゼロから始める深層強化学習株式会社 Preferred Networks 前田新一, 藤田康博 2. チュートリアルでお話したいこと 15分 40分前田藤田 (3) 最近の応用事例 (4) 強化学習を使いこなすためのTips (5) 学習のための... 続きを読む

ゼロから始める深層強化学習（NLP2018講演資料）/ Introduction of Deep Reinforcement Learni…

2018/03/24 378 users 藤田康博 Reinforcement Learning

深層強化学習の動向 / survey of deep reinforcement learning // Speaker Deck

2017/07/20 322 users Speaker Deck 動向

All slide content and descriptions are owned by their creators. 続きを読む

ディープラーニングが活かすIoT

2015/06/12 322 users IoT pfn RNN ディープラーニング VAE

Transcript 1. ディープラーニングが活かすIoT 岡野原　⼤大輔 hillbig@preferred.jp Preferred Networks, Inc. 2015/06/09 Interop 2015 セミナー 2. アジェンダ l  IoT時代の深層学習 –  RNN –  VAE –  深層強化学習 l  PFNの取り組み –  デモ：深層強化学習 + データ同... 続きを読む

深層強化学習の最前線 - Speaker Deck

2018/12/19 291 users Speaker Deck 最前線

All slide content and descriptions are owned by their creators. 続きを読む

最近のスパースなニューラルネットワークについて - SmartNews 開発者ブログ

2017/06/01 150 users スパーズニューラルネット GaN ニューラルネットワーク

こんにちは、スマートニュースの徳永です。深層学習業界はGANだとか深層強化学習だとかで盛り上がっていますが、今日は淡々と、スパースなニューラルネットワークの話をします。要約するとニューラルネットのスパース化によって、精度はほとんど犠牲にせずに、計算効率は3〜5倍程度まで向上できるスパース化にはまだ課題が多く、ニューラルネットの高速化という意味では、次の戦場はたぶんここになるスパースとは、ス... 続きを読む

AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃 - WirelessWire News（ワイヤレスワイヤーニュース）

2020/10/08 113 users ブレイクスルー WirelessWire News 衝撃

AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃 2020.10.08 Updated by Ryo Shimizu on October 8, 2020, 11:13 am JST 「最近のAIがすごい」と言われてからもう6年ほどが経過した。なかでも人目を引いたのは、なんといっても2016年のAlphaGoだろう。最難関ゲームの一つと言われる囲碁におい... 続きを読む

深層学習用ライブラリを自作して二足歩行を学習させてみた – EL-EMENT blog

2018/06/30 94 users WebGL CUDA 二足歩行ライブラリツッコミ

WebGLとCUDAで動く深層学習用のライブラリを作って深層強化学習 (Deep Deterministic Policy Gradient, DDPG) で二足歩行を学習させました。学習環境の作成にはOimoPhysicsを使いました。開発の経緯や以下実装方法、学習結果などです。例によって怪しい個所へのツッコミは歓迎です。 >> Open Repository on GitHub これ... 続きを読む

Google、ゼロからゲームをプレイして自力で攻略方法を見つける人工知能「DQN」開発 -INTERNET Watch

2015/02/26 81 users DQN Deep Q-Network 自力人工知能制御

ニュース Google、ゼロからゲームをプレイして自力で攻略方法を見つける人工知能「DQN」開発（2015/2/26 16:52）米Googleは、深層強化学習アルゴリズムを用いた人工知能「DQN」を開発したと発表した。DQNは「Deep Q-network」の略で、自力でコンピューターゲームをプレイし、攻略方法を見つけ出すことができる。深層強化学習を通して人間レベルの制御を可能にするもの。... 続きを読む

論文：Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning - うどん記

2017/02/25 66 users Reinforcement Learning 論文手法

2017 - 02 - 25 論文：Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning モデルフリー系の深層強化学習の手法を用いてスマブラDX のゲームAIを作ったという論文が出ていたので読んだ。以下はそのメモ。概要論文URL : https://arxiv.org/abs/... 続きを読む

強化学習における好奇心 - Speaker Deck

2019/05/02 57 users Speaker Deck 好奇心強化学習スパーズ報酬

強化学習では，環境で得られる報酬がスパースである場合，うまく学習することができない．この問題を解決するための手法として，強化学習のエージェントに「好奇心」を与える研究が注目されている．本スライドでは，深層強化学習の登場以降に発表された「好奇心」を利用した強化学習の研究をまとめた．特に主要ベンチマ... 続きを読む

DQNからRainbowまで〜深層強化学習の最新動向〜

2018/02/13 45 users rainbow DQN DeNA Co 最新動向

DQNからRainbowまで〜深層強化学習の最新動向〜 1. DQNからRainbowまで〜深層強化学習の最新動向〜強化学習アーキテクチャ勉強会 #12 February 13, 2018 Jun Ernesto Okumura AI System Dept. DeNA Co., Ltd. 2. Copyright (C) DeNA Co.,Ltd. All Rights Reserved.... 続きを読む

スマートフォンで人工生命数十体がリアルタイムに学習可能な深層強化学習 - dmv.nico

2018/08/06 37 users 未知リアルタイム学習仮想生物

仮想の未知の生物でも，我々はその形状から自然な動きを想像することができる．この研究では，そのような，未知の形状の生物に対して自然な動きを与える手法を提案します．自然な動きを，効率の良い動きと考え，なるべく短時間で目的(報酬)を最大化する動きを深層強化学習で得ます．近年このような深層強化学習による... 続きを読む

「自然な着衣」を深層強化学習でシミュレートすることに成功 - GIGAZINE

2018/11/02 31 users GIGAZINE 着衣成功

「アニメーションのキャラクターの着替え動作」はキャラクターと衣服の関係から複雑な動きとなり、コンピューターを使っての作成は非常に難しいものとされてきました。そんな中、キャラクターアニメーションやロボット工学について研究するジョージア工科大学のAlexander Clegg氏はモデルフリーのDeep Reinforcement Lea... 続きを読む

マインクラフトで深層強化学習ハンズオン - connpass

2018/11/28 24 users connpass ハンズオンマインクラフト

キャンセル・参加費用の払い戻しについて主催者からの説明: ご入金後のキャンセルはお受けいたしかねますのであらかじめご了承ください。代理で参加いただくことは可能ですので、連絡先のメールアドレスへご連絡をお願いいたします。概要 Deep Learning Labとは、Chainerを提供するPreferred Networksと、Azure クラウ... 続きを読む

AI最大の課題「フレーム問題」解決の糸口をグリッドが開発！強化学習とアンサンブル学習を連携米国物理学協会発刊学術誌が掲載 - ロボスタロボスタ - ロボット情報WEBマガジン

2022/08/02 14 users 糸口グリッドロボスタアンサンブル学習成果

シェア 0 ツイート 0 はてブ 0 株式会社グリッドは、エネルギー分野における「不確実な環境における深層強化学習による最適化」の開発に成功した。これは現在のAIにとって最大の課題のひとつとされている「フレーム問題」を解決する糸口になる、と言う。そして、その成果を、米国物理学協会が発刊する「Journal of Renew... 続きを読む

Google DeepMindのCEO、ChatGPT競合の次世代モデル「Gemini」を語る

2023/06/27 13 users GEMINI chatgpt デミス・ハサビスCEO CEO

米Google傘下のGoogle DeepMindのデミス・ハサビスCEOが、“次世代基盤モデル”の「Gemini」について、6月26日付の米Wiredのインタビューで語った。記事のタイトルは「次のアルゴリズムはChatGPTを超えると発言」となっている。ハサビス氏はインタビューで、Geminiは、大まかに言うと、AlphaGoタイプの深層強化学習による... 続きを読む

東大松尾研、深層強化学習の無料講座　受講学生を募集

2023/01/27 12 users 東大松尾研高専大学院無料講座物理シミュレーション

東京大学松尾豊研究室が、深層強化学習のオンライン無料講座を2月13日にスタートする。深層学習の基礎を習得済みの学生向け。ロボット制御、ゲームAI、物理シミュレーションなどの研究・社会実装のスタートラインに立てるレベルの知識・実装力の習得を目指す。大学院、大学、高専、専門学校、高校、中学などの学生向け... 続きを読む

深層強化学習をベースとしたAIトレードの検討〈準備編〉

2017/08/10 11 users ベース検討準備編

こんにちは、Trading Studioです。本組織では、仮想通貨の取引データの解析や変動パターンの抽出、およびハイパフォーマンス投資アルゴリズムの研究開発を行なっています。　前回の記事では、単一のテクニカル指標に基づくシステムトレードでも十分な収益を上げることができる可能性を示しました。しかし、記事を投稿した6月下旬以降、価格が大きく変動し、明らかに５月とは異なる動きとなりました。果たし... 続きを読む

DeepMindが深層強化学習を利用してアルゴリズムを改善するAI「AlphaDev」を発表、すでにソートアルゴリズムやハッシュ関数の高速化に成功

2023/06/08 5 users ソートアルゴリズム DeepMind AlphaGo 論文

AlphaGoの開発元として有名なGoogle DeepMind社が深層強化学習を応用してさまざまなコンピューティングアルゴリズムを改善するAI「AlphaDev」を発表しました。同時に、AlphaDevを利用してソートアルゴリズムを高速化できたという論文がNatureに掲載されています。 AlphaDev discovers faster sorting algorithms https:/... 続きを読む

20 年度前期 AI 公開講座

2020/01/15 5 users 公開講座 DAISY 大澤昇平ロボティクス備考

株式会社 Daisy による第 1 回 AI 公開講座の参加受付フォームです。 1. 日時：毎週日曜午後 1 時～午後 3 時、初回 4/5 (日) 、全 13 回 2. 場所：都内 3. キーワード：ディープラーニング、深層強化学習、ゲーム理論、自動トレード、ロボティクス 4. 参加資格：学生（無料）、社会人 5. 講師：大澤昇平【備考】＊こ... 続きを読む

(1 - 23 / 23件)