タグ 深層強化学習
新着順 10 users 50 users 100 users 500 users 1000 usersニューラルネットワークの量子化についての最近の研究の進展と、その重要性 - SmartNews 開発者ブログ
こんにちは、スマートニュースの徳永です。深層学習業界はGANだとか深層強化学習だとかで盛り上がっていますが、今日は淡々と、ニューラルネットワークの量子化の話をします。 TL;DR パラメータだけを量子化するのであれば、ほぼ精度を落とさずに、パラメータのデータ容量は1/16程度にまで削減できる パラメータ、アクティベーション、勾配のすべてを量子化し、推論だけでなく学習までもビット演算だけで実現する研... 続きを読む
深層強化学習でシステムトレードをやる時に役に立ちそうな資料まとめ - ニートの言葉
2016 - 11 - 15 深層強化学習でシステムトレードをやる時に役に立ちそうな資料まとめ 人工知能 Photo via Visual Hunt 少し前のことですが、AlphaGoという囲碁の人工知能プログラムがイ・セドル九段に勝利したことで話題になりました。 *1 また、一部のゲームにおいて「DQN(Deep Q-network)」が人間よりも上手くプレイするようになったというニュースも話題... 続きを読む
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learni…
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning 1. ゼロから始める深層強化学習 株式会社 Preferred Networks 前田新一, 藤田康博 2. チュートリアルでお話したいこと 15分 40分前田 藤田 (3) 最近の応用事例 (4) 強化学習を使いこなすためのTips (5) 学習のための... 続きを読む
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learni…
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning 1. ゼロから始める深層強化学習 株式会社 Preferred Networks 前田新一, 藤田康博 2. チュートリアルでお話したいこと 15分 40分前田 藤田 (3) 最近の応用事例 (4) 強化学習を使いこなすためのTips (5) 学習のための... 続きを読む
深層強化学習の動向 / survey of deep reinforcement learning // Speaker Deck
All slide content and descriptions are owned by their creators. 続きを読む
ディープラーニングが活かすIoT
Transcript 1. ディープラーニングが 活かすIoT 岡野原 ⼤大輔 hillbig@preferred.jp Preferred Networks, Inc. 2015/06/09 Interop 2015 セミナー 2. アジェンダ l IoT時代の深層学習 – RNN – VAE – 深層強化学習 l PFNの取り組み – デモ:深層強化学習 + データ同... 続きを読む
深層強化学習の最前線 - Speaker Deck
All slide content and descriptions are owned by their creators. 続きを読む
最近のスパースなニューラルネットワークについて - SmartNews 開発者ブログ
こんにちは、スマートニュースの徳永です。深層学習業界はGANだとか深層強化学習だとかで盛り上がっていますが、今日は淡々と、スパースなニューラルネットワークの話をします。 要約すると ニューラルネットのスパース化によって、精度はほとんど犠牲にせずに、計算効率は3〜5倍程度まで向上できる スパース化にはまだ課題が多く、ニューラルネットの高速化という意味では、次の戦場はたぶんここになる スパースとは、ス... 続きを読む
AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃 - WirelessWire News(ワイヤレスワイヤーニュース)
AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃 2020.10.08 Updated by Ryo Shimizu on October 8, 2020, 11:13 am JST 「最近のAIがすごい」と言われてからもう6年ほどが経過した。 なかでも人目を引いたのは、なんといっても2016年のAlphaGoだろう。最難関ゲームの一つと言われる囲碁におい... 続きを読む
深層学習用ライブラリを自作して二足歩行を学習させてみた – EL-EMENT blog
WebGLとCUDAで動く深層学習用のライブラリを作って深層強化学習 (Deep Deterministic Policy Gradient, DDPG) で二足歩行を学習させました。学習環境の作成にはOimoPhysicsを使いました。 開発の経緯や以下実装方法、学習結果などです。例によって怪しい個所へのツッコミは歓迎です。 >> Open Repository on GitHub これ... 続きを読む
Google、ゼロからゲームをプレイして自力で攻略方法を見つける人工知能「DQN」開発 -INTERNET Watch
ニュース Google、ゼロからゲームをプレイして自力で攻略方法を見つける人工知能「DQN」開発 (2015/2/26 16:52) 米Googleは、深層強化学習アルゴリズムを用いた人工知能「DQN」を開発したと発表した。DQNは「Deep Q-network」の略で、自力でコンピューターゲームをプレイし、攻略方法を見つけ出すことができる。 深層強化学習を通して人間レベルの制御を可能にするもの。... 続きを読む
論文:Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning - うどん記
2017 - 02 - 25 論文:Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning モデルフリー系の深層強化学習の手法を用いて スマブラDX のゲームAIを作ったという論文が出ていたので読んだ。以下はそのメモ。 概要 論文URL : https://arxiv.org/abs/... 続きを読む
強化学習における好奇心 - Speaker Deck
強化学習では,環境で得られる報酬がスパースである場合,うまく学習することができない.この問題を解決するための手法として,強化学習のエージェントに「好奇心」を与える研究が注目されている.本スライドでは,深層強化学習の登場以降に発表された「好奇心」を利用した強化学習の研究をまとめた.特に主要ベンチマ... 続きを読む
DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜 1. DQNからRainbowまで 〜深層強化学習の最新動向〜 強化学習アーキテクチャ勉強会 #12 February 13, 2018 Jun Ernesto Okumura AI System Dept. DeNA Co., Ltd. 2. Copyright (C) DeNA Co.,Ltd. All Rights Reserved.... 続きを読む
スマートフォンで人工生命数十体がリアルタイムに学習可能な深層強化学習 - dmv.nico
仮想の未知の生物でも,我々はその形状から自然な動きを想像することができる. この研究では,そのような,未知の形状の生物に対して自然な動きを与える手法を提案します. 自然な動きを,効率の良い動きと考え,なるべく短時間で目的(報酬)を最大化する動きを深層強化学習で得ます. 近年このような深層強化学習による... 続きを読む
「自然な着衣」を深層強化学習でシミュレートすることに成功 - GIGAZINE
「アニメーションのキャラクターの着替え動作」はキャラクターと衣服の関係から複雑な動きとなり、コンピューターを使っての作成は非常に難しいものとされてきました。そんな中、キャラクターアニメーションやロボット工学について研究するジョージア工科大学のAlexander Clegg氏はモデルフリーのDeep Reinforcement Lea... 続きを読む
マインクラフトで深層強化学習 ハンズオン - connpass
キャンセル・参加費用の払い戻しについて主催者からの説明: ご入金後のキャンセルはお受けいたしかねますのであらかじめご了承ください。代理で参加いただくことは可能ですので、連絡先のメールアドレスへご連絡をお願いいたします。 概要 Deep Learning Labとは、Chainerを提供するPreferred Networksと、Azure クラウ... 続きを読む
AI最大の課題「フレーム問題」解決の糸口をグリッドが開発!強化学習とアンサンブル学習を連携 米国物理学協会発刊学術誌が掲載 - ロボスタ ロボスタ - ロボット情報WEBマガジン
シェア 0 ツイート 0 はてブ 0 株式会社グリッドは、エネルギー分野における「不確実な環境における深層強化学習による最適化」の開発に成功した。これは現在のAIにとって最大の課題のひとつとされている「フレーム問題」を解決する糸口になる、と言う。そして、その成果を、米国物理学協会が発刊する「Journal of Renew... 続きを読む
Google DeepMindのCEO、ChatGPT競合の次世代モデル「Gemini」を語る
米Google傘下のGoogle DeepMindのデミス・ハサビスCEOが、“次世代基盤モデル”の「Gemini」について、6月26日付の米Wiredのインタビューで語った。記事のタイトルは「次のアルゴリズムはChatGPTを超えると発言」となっている。 ハサビス氏はインタビューで、Geminiは、大まかに言うと、AlphaGoタイプの深層強化学習による... 続きを読む
東大松尾研、深層強化学習の無料講座 受講学生を募集
東京大学 松尾豊研究室が、深層強化学習のオンライン無料講座を2月13日にスタートする。深層学習の基礎を習得済みの学生向け。ロボット制御、ゲームAI、物理シミュレーションなどの研究・社会実装のスタートラインに立てるレベルの知識・実装力の習得を目指す。 大学院、大学、高専、専門学校、高校、中学などの学生向け... 続きを読む
深層強化学習をベースとしたAIトレードの検討〈準備編〉
こんにちは、Trading Studioです。本組織では、仮想通貨の取引データの解析や変動パターンの抽出、およびハイパフォーマンス投資アルゴリズムの研究開発を行なっています。 前回の記事 では、単一のテクニカル指標に基づくシステムトレードでも十分な収益を上げることができる可能性を示しました 。しかし、記事を投稿した6月下旬以降、価格が大きく変動し、明らかに5月とは異なる動きとなりました。 果たし... 続きを読む
DeepMindが深層強化学習を利用してアルゴリズムを改善するAI「AlphaDev」を発表、すでにソートアルゴリズムやハッシュ関数の高速化に成功
AlphaGoの開発元として有名なGoogle DeepMind社が深層強化学習を応用してさまざまなコンピューティングアルゴリズムを改善するAI「AlphaDev」を発表しました。同時に、AlphaDevを利用してソートアルゴリズムを高速化できたという論文がNatureに掲載されています。 AlphaDev discovers faster sorting algorithms https:/... 続きを読む
20 年度前期 AI 公開講座
株式会社 Daisy による第 1 回 AI 公開講座の参加受付フォームです。 1. 日時:毎週日曜午後 1 時~午後 3 時、初回 4/5 (日) 、全 13 回 2. 場所:都内 3. キーワード:ディープラーニング、深層強化学習、ゲーム理論、自動トレード、ロボティクス 4. 参加資格:学生(無料)、社会人 5. 講師:大澤昇平 【備考】 *こ... 続きを読む