ITエンジニアのための強化学習理論入門

中井悦司

基本情報

ジャンル
ISBN/カタログNo
ISBN 13 : 9784297115159
ISBN 10 : 4297115158
フォーマット
出版社
発行年月
2020年07月
日本
共著・訳者・掲載人物など
:
追加情報
:
296p;22

内容詳細

強化学習の基礎となるアルゴリズムを体系的に学ぶ。

目次 : 1 強化学習のゴールと課題(強化学習の考え方/ 実行環境のセットアップ/ バンディットアルゴリズム(基本編)/ バンディットアルゴリズム(応用編))/ 2 環境モデルを用いた強化学習の枠組み(マルコフ決定過程による環境のモデル化/ エージェントの行動ポリシーと状態価値関数/ 動的計画法による状態価値関数の決定)/ 3 行動ポリシーの改善アルゴリズム(ポリシー反復法/ 価値反復法/ より実践的な実装例)/ 4 サンプリングデータを用いた学習法(モンテカルロ法/ TD(Temporal‐Difference)法)/ 5 ニューラルネットワークによる関数近似(ニューラルネットワークによる状態価値関数の計算/ ニューラルネットワークを用いたQ‐Learning)

(「BOOK」データベースより)

ユーザーレビュー

総合評価

☆
☆
☆
☆
☆

0.0

★
★
★
★
★
 
0
★
★
★
★
☆
 
0
★
★
★
☆
☆
 
0
★
★
☆
☆
☆
 
0
★
☆
☆
☆
☆
 
0

読書メーターレビュー

こちらは読書メーターで書かれたレビューとなります。

powered by

  • M_Study さん

    最初は難解に感じるかもしれないが、数式とコードを照らし合わせて地道に一つずつ追いかけて行けば、強化学習の基礎は理解できる。Q学習は知っているけど、なぜあの数式の形になるか理解できない人におすすめ。Pythonに関する説明はあまり無いので、あらかじめ学習しておくことを推奨。

レビューをもっと見る

(外部サイト)に移動します

建築・理工 に関連する商品情報

おすすめの商品