タグ「Q学習」 - はてブログ

タグ Q学習

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 3 / 3件)

誰でもわかる強化学習

2023/11/24 311 users 強化学習 LLM DQN Deep Q-Network 手法

本資料は，東京大学松尾研究室で開催された強化学習セミナーの講義資料をもとに，講演目的でより初学者向けに内容を調整したものです．特に強化学習で最も基本的かつ最重要手法であるQ学習や，それの深層強化学習版のDQN（Deep Q-Network）を中心に解説しています. 昨今，ChatGPT等の大規模言語モデル（LLM）の開発に強... 続きを読む

強化学習の基礎まとめ - Qiita

2023/05/12 13 users Qiita deep 手法強化学習コード

こんにちは、すきにーです。強化学習の基礎的な手法についてまとめました。はじめにこの記事では以下を説明しています動的計画法モンテカルロ法 TD法(SARSA、Q学習) コードはゼロから作るDeepLearning4 強化学習編に載っているものを参考にしています。参考記事深層強化学習アルゴリズムまとめゼロからDeepまで... 続きを読む

機械学習の「Q学習」にベイズ推定を取り入れると一体何が起こるのか？ - GIGAZINE

2020/11/02 7 users GIGAZINE ベイズ推定 github.io 一種報酬

機械学習における強化学習の一種である「Q学習」は、行動主体となるエージェントが現在の状況と未来の状況、そして得られる報酬から最適な答えを学習する手法です。そんなQ学習にベイズ推定の要素を取り込む研究が機械学習エンジニアのBrandon Da Silva氏によって行われています。 brandinho.github.io/bayesian-perspec... 続きを読む

(1 - 3 / 3件)

タグ Q学習

誰でもわかる強化学習

強化学習の基礎まとめ - Qiita

機械学習の「Q学習」にベイズ推定を取り入れると一体何が起こるのか？ - GIGAZINE

本日の新着エントリー

本日の人気エントリー

1年前の人気エントリー

先週のランキング

人気エントリーにあるタグ

最近の注目エントリー

最近の注目タグ