Product Details
ISBN 10 : 4873119758
Content Description
人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。
目次 : 1章 バンディット問題/ 2章 マルコフ決定過程/ 3章 ベルマン方程式/ 4章 動的計画法/ 5章 モンテカルロ法/ 6章 TD法/ 7章 ニューラルネットワークとQ学習/ 8章 DQN/ 9章 方策勾配法/ 10章 さらに先へ/ 付録
【著者紹介】
斎藤康毅 : 1984年長崎県対馬生まれ。東京工業大学工学部卒、東京大学大学院学際情報学府修士課程修了。現在、企業にて人工知能に関する研究開発に従事(本データはこの書籍が刊行された当時に掲載されていたものです)
Customer Reviews
Book Meter Reviews
こちらは読書メーターで書かれたレビューとなります。
powered by
富士獣
読了日:2024/01/22
みるか
読了日:2022/04/27
ᚹγअәc0̸א
Go Extreme
読了日:2022/07/12
naoki85
読了日:2023/07/17
(外部サイト)に移動します
Recommend Items
Feedback
Missing or incorrect information?
Product information of this page .