基本情報

内容詳細
強化学習の基礎となるアルゴリズムを体系的に学ぶ。
目次 : 1 強化学習のゴールと課題(強化学習の考え方/ 実行環境のセットアップ/ バンディットアルゴリズム(基本編)/ バンディットアルゴリズム(応用編))/ 2 環境モデルを用いた強化学習の枠組み(マルコフ決定過程による環境のモデル化/ エージェントの行動ポリシーと状態価値関数/ 動的計画法による状態価値関数の決定)/ 3 行動ポリシーの改善アルゴリズム(ポリシー反復法/ 価値反復法/ より実践的な実装例)/ 4 サンプリングデータを用いた学習法(モンテカルロ法/ TD(Temporal‐Difference)法)/ 5 ニューラルネットワークによる関数近似(ニューラルネットワークによる状態価値関数の計算/ ニューラルネットワークを用いたQ‐Learning)
(「BOOK」データベースより)
ユーザーレビュー
読書メーターレビュー
建築・理工 に関連する商品情報
-
アンテナ工学の知識を習得するのに最適な一冊 無線工学の中枢であるアンテナ。そのアンテナの解析法技術を学ぶとができる『IoTシステムの極小アンテナ設計技術』。小形... |2016年01月04日 (月) 12:14
-
AR(拡張現実)の基礎から実践までを網羅した専門書 ARの全てを集約した一冊。ARの基礎から実践までを網羅し、現場エンジニアがすぐに使える他にはない「ARの体系書」とも... |2015年10月05日 (月) 12:31
-
円周率を100万桁まで掲載した不思議な本 3.14で始まる円周率を、ひたすら100万桁まで掲載した『円周率1000000桁表』。1行に100桁を記載した見やす... |2015年10月02日 (金) 10:18
-
クヌース先生の名著の邦訳版が登場 クヌース先生の名著シリーズの第一弾として有名な本の『The Art Of Computer Programming ... |2015年08月05日 (水) 19:04
-
Windows10の基礎から応用までを解説 以前からのユーザーにはおなじみのスタートメニューも復活し、アプリや設定にアクセスしやすくなるWindows10。『W... |2015年07月28日 (火) 11:25
-
SQLを使った、ラクで実用的な分析手法 企業においてSQLは、現実的で制約の少ない方法。ビジネスに役立つ分析を行いたいマーケターや、ビッグデータをどうにかし... |2015年06月23日 (火) 17:20
おすすめの商品
商品情報の修正
ログインのうえ、お気づきの点を入力フォームにご記入頂けますと幸いです。確認のうえ情報修正いたします。
このページの商品情報に・・・
