ITエンジニアのための強化学習理論入門

レビューを書く

基本情報

ジャンル

：

建築・理工

ISBN/カタログNo

：

ISBN 13 : 9784297115159
ISBN 10 : 4297115158

フォーマット

：

本

出版社

：

技術評論社

発行年月

：

2020年07月

発売国

：

日本

共著・訳者・掲載人物など

中井悦司 ,

追加情報

２９６ｐ；22

内容詳細

強化学習の基礎となるアルゴリズムを体系的に学ぶ。

目次 : １　強化学習のゴールと課題（強化学習の考え方/ 実行環境のセットアップ/ バンディットアルゴリズム（基本編）/ バンディットアルゴリズム（応用編））/ ２　環境モデルを用いた強化学習の枠組み（マルコフ決定過程による環境のモデル化/ エージェントの行動ポリシーと状態価値関数/ 動的計画法による状態価値関数の決定）/ ３　行動ポリシーの改善アルゴリズム（ポリシー反復法/ 価値反復法/ より実践的な実装例）/ ４　サンプリングデータを用いた学習法（モンテカルロ法/ ＴＤ（Ｔｅｍｐｏｒａｌ‐Ｄｉｆｆｅｒｅｎｃｅ）法）/ ５　ニューラルネットワークによる関数近似（ニューラルネットワークによる状態価値関数の計算/ ニューラルネットワークを用いたＱ‐Ｌｅａｒｎｉｎｇ）

（「BOOK」データベースより）

ユーザーレビュー

総合評価

0.0

レビューを書く

読書メーターレビュー

こちらは読書メーターで書かれたレビューとなります。

powered by

M_Study さん

読了日：2021/02/19

最初は難解に感じるかもしれないが、数式とコードを照らし合わせて地道に一つずつ追いかけて行けば、強化学習の基礎は理解できる。Q学習は知っているけど、なぜあの数式の形になるか理解できない人におすすめ。Pythonに関する説明はあまり無いので、あらかじめ学習しておくことを推奨。

レビューをもっと見る

(外部サイト)に移動します

建築・理工に関連する商品情報

アンテナ工学の知識を習得するのに最適な一冊無線工学の中枢であるアンテナ。そのアンテナの解析法技術を学ぶとができる『IoTシステムの極小アンテナ設計技術』。小形... |2016年01月04日 (月)　12:14
AR（拡張現実）の基礎から実践までを網羅した専門書 ARの全てを集約した一冊。ARの基礎から実践までを網羅し、現場エンジニアがすぐに使える他にはない「ARの体系書」とも... |2015年10月05日 (月)　12:31
円周率を100万桁まで掲載した不思議な本 3.14で始まる円周率を、ひたすら100万桁まで掲載した『円周率1000000桁表』。1行に100桁を記載した見やす... |2015年10月02日 (金)　10:18
クヌース先生の名著の邦訳版が登場クヌース先生の名著シリーズの第一弾として有名な本の『The Art Of Computer Programming ... |2015年08月05日 (水)　19:04
Windows10の基礎から応用までを解説以前からのユーザーにはおなじみのスタートメニューも復活し、アプリや設定にアクセスしやすくなるWindows10。『W... |2015年07月28日 (火)　11:25
SQLを使った、ラクで実用的な分析手法企業においてSQLは、現実的で制約の少ない方法。ビジネスに役立つ分析を行いたいマーケターや、ビッグデータをどうにかし... |2015年06月23日 (火)　17:20