Books

Itエンジニアのための強化学習理論入門

中井悦司

Product Details

ISBN/Catalogue Number
ISBN 13 : 9784297115159
ISBN 10 : 4297115158
Format
Books
Publisher
Release Date
July/2020
Japan
Co-Writer, Translator, Featured Individuals/organizations
:

Content Description

強化学習の基礎となるアルゴリズムを体系的に学ぶ。

目次 : 1 強化学習のゴールと課題(強化学習の考え方/ 実行環境のセットアップ/ バンディットアルゴリズム(基本編)/ バンディットアルゴリズム(応用編))/ 2 環境モデルを用いた強化学習の枠組み(マルコフ決定過程による環境のモデル化/ エージェントの行動ポリシーと状態価値関数/ 動的計画法による状態価値関数の決定)/ 3 行動ポリシーの改善アルゴリズム(ポリシー反復法/ 価値反復法/ より実践的な実装例)/ 4 サンプリングデータを用いた学習法(モンテカルロ法/ TD(Temporal‐Difference)法)/ 5 ニューラルネットワークによる関数近似(ニューラルネットワークによる状態価値関数の計算/ ニューラルネットワークを用いたQ‐Learning)

(「BOOK」データベースより)

Customer Reviews

Comprehensive Evaluation

☆
☆
☆
☆
☆

0.0

★
★
★
★
★
 
0
★
★
★
★
☆
 
0
★
★
★
☆
☆
 
0
★
★
☆
☆
☆
 
0
★
☆
☆
☆
☆
 
0

Book Meter Reviews

こちらは読書メーターで書かれたレビューとなります。

powered by

  • M_Study

    最初は難解に感じるかもしれないが、数式とコードを照らし合わせて地道に一つずつ追いかけて行けば、強化学習の基礎は理解できる。Q学習は知っているけど、なぜあの数式の形になるか理解できない人におすすめ。Pythonに関する説明はあまり無いので、あらかじめ学習しておくことを推奨。

レビューをもっと見る

(外部サイト)に移動します

Recommend Items