Product Details
ISBN/Catalogue Number
:
ISBN 13 : 9784297115159
ISBN 10 : 4297115158
ISBN 10 : 4297115158
Format
:
Books
Release Date
:
July/2020
Content Description
強化学習の基礎となるアルゴリズムを体系的に学ぶ。
目次 : 1 強化学習のゴールと課題(強化学習の考え方/ 実行環境のセットアップ/ バンディットアルゴリズム(基本編)/ バンディットアルゴリズム(応用編))/ 2 環境モデルを用いた強化学習の枠組み(マルコフ決定過程による環境のモデル化/ エージェントの行動ポリシーと状態価値関数/ 動的計画法による状態価値関数の決定)/ 3 行動ポリシーの改善アルゴリズム(ポリシー反復法/ 価値反復法/ より実践的な実装例)/ 4 サンプリングデータを用いた学習法(モンテカルロ法/ TD(Temporal‐Difference)法)/ 5 ニューラルネットワークによる関数近似(ニューラルネットワークによる状態価値関数の計算/ ニューラルネットワークを用いたQ‐Learning)
(「BOOK」データベースより)
Customer Reviews
Book Meter Reviews
Recommend Items
Feedback
Missing or incorrect information?
Product information of this page .