ゼロから作る Deep Learning 4 強化学習編

Write review

Product Details

Genre

：

Architecture&Engineering

ISBN/Catalogue Number

：

ISBN 13 : 9784873119755
ISBN 10 : 4873119758

Format

：

Books

Publisher

：

オライリー・ジャパン

Release Date

：

April/2022

Release Country

：

Japan

Co-Writer, Translator, Featured Individuals/organizations

斎藤康毅 ,

Content Description

人気シリーズの第４弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。

目次 : １章　バンディット問題/ ２章　マルコフ決定過程/ ３章　ベルマン方程式/ ４章　動的計画法/ ５章　モンテカルロ法/ ６章　ＴＤ法/ ７章　ニューラルネットワークとＱ学習/ ８章　ＤＱＮ/ ９章　方策勾配法/ １０章　さらに先へ/ 付録

【著者紹介】
斎藤康毅 : １９８４年長崎県対馬生まれ。東京工業大学工学部卒、東京大学大学院学際情報学府修士課程修了。現在、企業にて人工知能に関する研究開発に従事（本データはこの書籍が刊行された当時に掲載されていたものです）

（「BOOK」データベースより）

Customer Reviews

Comprehensive Evaluation

0.0

Write you own review

Book Meter Reviews

こちらは読書メーターで書かれたレビューとなります。

powered by

富士獣

読了日：2024/01/22

（非深層）強化学習の入門としてとても良かった。最適化やゲームAI作成の中で知りたかったこと、ボンヤリ考えていたことが定式化されていて、勉強になったゼロつく1や3に比べると「手を動かして実装レベルで理解する」より「理論の直感や数式変形が分かれば、実装はまぁ自然にできる」感が強いけど、数式変形の解説も丁寧で追いやすい。深層強化学習入門としてもさわりは分かりやすいけど、少なくとも自分は、理論寄りの本と実践寄りの本をあと1冊ずつ読まないと「深層強化学習を実課題に適用できる」レベルには至らないなぁと思った。

みるか

読了日：2022/04/27

シリーズ 4 作目．本作は強化学習がテーマである．報酬の確率分布が定常で与えられるバンディット問題から始めて，報酬の確率分布が非定常な問題，マルコフ決定過程，ベルマン方程式の導出，と話題が進んでいく．強化学習と言うと，エージェントが環境と相互に作用しながら，何らかの報酬が最大化されるように行動を学習する方法論，くらいのお気持ち程度の理解しかしていなかったが，本書は強化学習の初歩から流行りの DQN まで詳細されている．

ᚹγअәc0̸א

方策勾配定理の導出がカバーされており有難い。

Go Extreme

読了日：2022/07/12

バンディット問題：機械学習の分類と強化学習バンディット問題バンディットアルゴリズムバンディットアルゴリズムの実装非定常問題マルコフ決定過程： MDPとは環境とエージェントの定式化 MDPの目標ベルマン方程式動的計画法 TD法ニューラルネットワークとQ学習 DQN 方策勾配法さらに先へ：深層強化学習アルゴリズムの分類方策勾配法系列の発展アルゴリズム DQN系列の発展アルゴリズム深層強化学習の課題と可能性

naoki85

読了日：2023/07/17

E 資格の勉強も兼ねて取り組んだ。座学だけではピンと来なかった方策の話もなんとなく理解できた気がした。とはいえ、一度けでは身についた感覚はないので、何回か捲ることになりそうだ。

レビューをもっと見る

(外部サイト)に移動します

Recommend Items

Sell This Item

Feedback

Missing or incorrect information?

Product information of this page .