Books

ゼロから作るdeep Learning 5 生成モデル編

斎藤康毅

Product Details

ISBN/Catalogue Number
ISBN 13 : 9784814400591
ISBN 10 : 4814400594
Format
Books
Release Date
April/2024
Japan
Co-Writer, Translator, Featured Individuals/organizations
:

Content Description

人気シリーズの第5弾。生成モデルの今を実装する!
人気シリーズの第5弾。今回のテーマは「生成モデル」です。本書では「正規分布」から「拡散モデル」に至るまでの技術を繋がりのあるストーリーとして展開します。読者は小さな学びを積み重ねながら、ステップバイステップで実装し、最終的には「Stable Diffusion」のような画像生成AIを完成させます。技術の面白さは細部にあります??ゼロから作る、数式に挑む。

Customer Reviews

Comprehensive Evaluation

☆
☆
☆
☆
☆

0.0

★
★
★
★
★
 
0
★
★
★
★
☆
 
0
★
★
★
☆
☆
 
0
★
★
☆
☆
☆
 
0
★
☆
☆
☆
☆
 
0

Book Meter Reviews

こちらは読書メーターで書かれたレビューとなります。

powered by

  • nbhd

    心の中でドヒャーと叫びながら読んだ。おもしろいけどむずかしい、むずかしいけどおもしろい。StableDiffusionに代表される現在の画像生成の主流になっている「拡散モデル」についてゼロから学んでいける本。AIを学んでつくづく感じるのは「確率統計を身体化すること」の大切さだ。この本でも、正規分布から順を追って解説してくれているのだけど、後半にかけて、「確率脳」を要求される。たんに確率統計を理解しただけでは済まされず、脳になじむくらいに身体化された感覚が必要だ。統計学、もうちょっと勉強してからリトライしよ

  • smatsu

    腹落ちまで繰返し読みたい本。一口に生成AIと言ってもLLM系の話とVAEや拡散モデルといった画像生成系の話とがあって、本書で扱っているのは後者の方。単純な確率モデルから始めて、VAEでデータの潜在的構造を学習できるようになるまで。拡散モデルでは「加えたノイズ」を予測してそのノイズを除去していくという逆再生的な処理を経て画像を生成する。混合ガウス分布=GMMのパラメータ推定は解析的にはできないのでEMアルゴリズムを使う、潜在変数の生成、ELBOの最大化、逆拡散過程、正弦波位置エンコーディングなど盛りだくさん

  • 愛楊

    2024年4月出版。「ゼロから作るDeep Learning」シリーズの第5巻。いつも通りの高品質だった。変分オートエンコーダから拡散モデルまでを熱力学・統計力学の知識なしで説明してくれるのだからありがたいこと限りなしである。理論の比重が大きいことが高く評価できる。KLダイバージェンスに帰着させることが理論の肝になっているのは、非常に面白かった。次回作は大規模言語モデルについてらしい。2年毎に出版されているので、2026年に出版といったところか。

  • このシリーズは毎度わかりやすく、しっかり説明してくれるのでよく読んでいるのだが、これは発売してすぐ買ったのにプライベートが忙しくて時間がかかってしまった。変分オートエンコーダの説明のためにボトムアップの材料を最初から丁寧に用意してくれていて、良い復習になった。KLダイバージェンスに帰着させて、ガンガン計算を簡潔にしていく過程はとても面白かった。正直細かいとこまで全部理解できたとは言えないが、こういう説明してくれる本を読むのは潜在意識にちょっとでも入力を与えておくという点で意義があると考えている。

  • naoki85

    最新刊が出たということで購入。 ちょうど stable diffusion をいじっていたので興味があるところだった。 いつもの通り、実際のサンプルコードもあって理解しやすかった。 理論の証明も多めだが、この辺りは慣れてないと読むのが苦しいかもしれない。 次の巻も楽しみにしたい。

レビューをもっと見る

(外部サイト)に移動します

Recommend Items