タグ「評価関数」 - はてブログ

タグ評価関数

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 2 / 2件)

強化学習に出てくるベルマン方程式を理解しよう - HELLO CYBERNETICS

2019/09/22 161 users 離散化 HELLO CYBERNETICS ヘルマン最後

はじめにベルマン方程式の概要最適制御と評価関数最適制御評価関数価値関数ベルマンの最適性原理ベルマン方程式価値関数の離散化状態の時間発展再訪ベルマン方程式まとめ最後にはじめに強化学習の基礎に置かれている「ベルマン方程式」について、言葉は知っているが実はちゃんと理解していないという方は... 続きを読む

今の将棋ソフトはAlphaZeroを超えている件 - コンピュータ将棋 Qhapaq

2018/10/06 144 users AlphaZero elmo 将棋ソフト ponanza 囲碁

AlphaZeroの論文は世界に衝撃をもたらしました。曰く、ディープラーニングと強化学習で作られた評価関数は激烈に強く、囲碁だけでなく、チェス・将棋でも人間を超え最強のソフトを超えたと。人間 vs コンピュータに終止符を打ち最後まで絶対的強さを魅せつけたPonanza、そのPonanzaをWCSC27で破ったelmo、そのelmoを90-... 続きを読む

(1 - 2 / 2件)

タグ評価関数

強化学習に出てくるベルマン方程式を理解しよう - HELLO CYBERNETICS

今の将棋ソフトはAlphaZeroを超えている件 - コンピュータ将棋 Qhapaq

本日の新着エントリー

本日の人気エントリー

1年前の人気エントリー

先週のランキング

人気エントリーにあるタグ

最近の注目エントリー

最近の注目タグ

タグ 評価関数

強化学習に出てくるベルマン方程式を理解しよう - HELLO CYBERNETICS

今の将棋ソフトはAlphaZeroを超えている件 - コンピュータ将棋 Qhapaq

本日の新着エントリー

本日の人気エントリー

1年前の人気エントリー

先週のランキング

人気エントリーにあるタグ

最近の注目エントリー

最近の注目タグ

タグ評価関数