はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 評価関数

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 11 / 11件)
 

チェスAIはNNUE導入以降、どう変わったのか? | やねうら王 公式サイト

2024/04/07 このエントリーをはてなブックマークに追加 14 users Instapaper Pocket Tweet Facebook Share Evernote Clip チェスAI やねうら王 棋風 チェス 公式サイト

やねうら王の評価関数にNNUE(差分計算可能な3層程度の全結合ニューラルネットワーク)が採用されて数年の時を経たのちに、チェスのAIであるStockfishにNNUEが導入された。 これによってチェスの世界はどのように変わったのであろうか? 将棋AIの世界ではNNUEが導入されて、確かに強くなったが「棋風がこう変わった」みた... 続きを読む

誰もdlshogiには敵わなくなって将棋AIの世界が終わってしまった件 | やねうら王 公式サイト

2022/06/27 このエントリーをはてなブックマークに追加 10 users Instapaper Pocket Tweet Facebook Share Evernote Clip dlshogi ResNet 将棋AI やねうら王 囲碁AI

いま大会上位に位置するDeep Learning系の将棋AIは、評価関数として画像認識などでよく使われているResNetを用いている。ResNetについては機械学習を齧っている人ならば誰でも知ってるぐらい有名だと思うので、詳しい説明は割愛する。(ググれば詳しい説明がいくらでも出てくる) 囲碁AIの世界では、このResNetのブロック... 続きを読む

強化学習に出てくるベルマン方程式を理解しよう - HELLO CYBERNETICS

2019/09/22 このエントリーをはてなブックマークに追加 161 users Instapaper Pocket Tweet Facebook Share Evernote Clip 離散化 HELLO CYBERNETICS ヘルマン 最後

はじめに ベルマン方程式の概要 最適制御と評価関数 最適制御 評価関数 価値関数 ベルマンの最適性原理 ベルマン方程式 価値関数の離散化 状態の時間発展再訪 ベルマン方程式 まとめ 最後に はじめに 強化学習の基礎に置かれている「ベルマン方程式」について、言葉は知っているが実はちゃんと理解していないという方は... 続きを読む

今の将棋ソフトはAlphaZeroを超えている件 - コンピュータ将棋 Qhapaq

2018/10/06 このエントリーをはてなブックマークに追加 144 users Instapaper Pocket Tweet Facebook Share Evernote Clip AlphaZero elmo 将棋ソフト ponanza 囲碁

AlphaZeroの論文は世界に衝撃をもたらしました。曰く、ディープラーニングと強化学習で作られた評価関数は激烈に強く、囲碁だけでなく、チェス・将棋でも人間を超え最強のソフトを超えたと。 人間 vs コンピュータに終止符を打ち最後まで絶対的強さを魅せつけたPonanza、そのPonanzaをWCSC27で破ったelmo、そのelmoを90-... 続きを読む

人間の棋譜を用いずに評価関数の学習に成功 | やねうら王 公式サイト

2017/06/12 このエントリーをはてなブックマークに追加 71 users Instapaper Pocket Tweet Facebook Share Evernote Clip 棋譜 Apery やねうら王 勝率 棋力

今回、新たに評価関数をゼロベクトルから学習させた。elmo絞りを使うと意外と簡単にApery(WCSC26)相当の棋力を持つ評価関数にまで出来るようだ。追試できるように記事の前半に手順を記しておく。また、記事の後半には何回目のelmo絞りでどの程度の強さであったかも示す。 elmo絞りを知らない人のために簡単に説明すると、今回、将棋ソフトが人間の棋譜を用いずに勝率の高い形を強化学習でソフト自らが自... 続きを読む

第27回世界コンピュータ将棋選手権優勝ソフト、elmoの導入方法を説明します - コンピュータ将棋研究Blog

2017/05/05 このエントリーをはてなブックマークに追加 18 users Instapaper Pocket Tweet Facebook Share Evernote Clip elmo 定跡 TREE bin github.com

elmoの評価関数と定跡をSILENT_MAJORITY1.25をもとにして使用する場合 1、 elmo.shogi.zip - Google ドライブ からzipをダウンロードする。 2、ダウンロードしたフォルダを右クリックして展開を選択する。 3、 https://github.com/Jangja/silent_majority/tree/1.2/bin からSILENT_MAJORITY_... 続きを読む

elmo優勝記念!elmoの使い方、導入の仕方を簡単に解説します。 - rewritemath’s blog

2017/05/05 このエントリーをはてなブックマークに追加 10 users Instapaper Pocket Tweet Facebook Share Evernote Clip elmo 定跡 瀧澤 申し訳 https

2017 - 05 - 05 elmo優勝記念!elmoの使い方、導入の仕方を簡単に解説します。 まずは、公開されているelmoの場所から案内します elmoの評価関数と定跡を公開します。 https://t.co/NJQ95elVma ご自由にお使いください。説明文等無く申し訳ございませんが、使っていただけると幸いです。 — 瀧澤 誠@elmo (@mktakizawa) 2017年5月5日 こ... 続きを読む

WCSC27はelmoが優勝 | やねうら王 公式サイト

2017/05/05 このエントリーをはてなブックマークに追加 43 users Instapaper Pocket Tweet Facebook Share Evernote Clip elmo WCSC 全勝優勝 やねうら王 WCSC27

WCSC(世界コンピュータ将棋選手権)決勝日は、elmoの全勝優勝で幕を閉じた。今後数年は無敗を誇るのではないかと言われたPonanza Chainerに予選2日目、決勝日の2回当たり、どちらも勝利。 その思考エンジンには、やねうら王が(ほぼそのまま)使われているらしく、elmoの評価関数についてはすでに公開されている。導入手順などは次の記事を参考にして欲しい。 やねうら王 セットアップ質問スレッ... 続きを読む

驚異のスピードで人間を超えていく人工知能の「思考」とは?(小野田 博一) | 現代ビジネス | 講談社(1/2)

2017/01/26 このエントリーをはてなブックマークに追加 14 users Instapaper Pocket Tweet Facebook Share Evernote Clip チェス 核心 チェッカー 囲碁 原理

人工知能(AI)とは何か チェス、チェッカー、囲碁などの対戦型AIは、何を「思考」し、何を「学習」しているのだろうか。進化を続ける人工知能の基本から、「深層学習とは何か」「画像認識に原理とは」「評価関数の意味」「完全解析の思考法」など最新技術の核心を理解します。 誤解される人工知能 “AI(人工知能)について何も知らない広く一般の人”にとって、AIとは、「考えることができるコンピューター」です。そ... 続きを読む

JavaScript の Array#sort で return 0 するとこうなります - latest log

2015/06/22 このエントリーをはてなブックマークに追加 21 users Instapaper Pocket Tweet Facebook Share Evernote Clip latest log Sort function 実装 順番

2015-06-22 JavaScript の Array#sort で return 0 するとこうなります JavaScript の Array#sort は仕様上も実際上も非安定ソートです。実装により異なる結果が得られます。 より具体的には、 [...].sort(function(a, b) { return 0; }); と評価関数の中で return 0; してしまうと要素の順番は保証... 続きを読む

何故私は駒得のみの評価関数の将棋に魅せられるのか - やねうらお−ノーゲーム・ノーライフ

2014/11/22 このエントリーをはてなブックマークに追加 13 users Instapaper Pocket Tweet Facebook Share Evernote Clip 将棋 棋譜 やねうらお−ノーゲーム ノーライフ 代名詞

駒得のみの評価関数の将棋ソフトとして私が作った「ひよこ将棋」がある。将棋ソフトの開発者のなかで「ひよこ」と言えば「駒得のみ」の代名詞ともなっているぐらいである。私は駒得のみの評価関数の将棋ソフトに命をかけていると言っても良い。 駒得のみということは、評価関数の学習のために人間の棋譜を用いていないし、評価関数もあってないようなもので、純粋に探索のみでどれだけの強さになるのかという指標としての意味があ... 続きを読む

 
(1 - 11 / 11件)