Books

拡散モデル データ生成技術の数理

岡野原大輔

Product Details

Genre
ISBN/Catalogue Number
ISBN 13 : 9784000063432
ISBN 10 : 400006343X
Format
Books
Publisher
Release Date
February/2023
Japan
Co-Writer, Translator, Featured Individuals/organizations
:

Content Description

多様で高品質な画像を生成し、人々を驚かせているアプリケーションは、どのような理論と技術により可能になったのか。従来は困難であった高次元のデータを創り出す生成モデルが注目されている。現在、最高の性能を発揮し、画像・動画・音声・化合物の生成など、多様な応用が期待されているのが拡散モデルである。その数理の本質から課題までを世界に先駆けて解説し、理論のさらなる発展を追究する。

目次 : 1 生成モデル(生成モデルとは何か/ エネルギーベースモデル・分配関数 ほか)/ 2 拡散モデル(スコアベースモデルとデノイジング拡散確率モデル/ スコアベースモデル ほか)/ 3 連続時間化拡散モデル(確率微分方程式/ SBMとDDPMのSDE表現 ほか)/ 4 拡散モデルの発展(条件付き生成におけるスコア/ 分類器ガイダンス ほか)/ 5 アプリケーション(画像生成・超解像・補完・画像変換/ 動画・パノラマ生成 ほか)/ 付録

【著者紹介】
岡野原大輔 : 1982年生まれ。2010年東京大学大学院情報理工学系研究科博士課程修了、情報理工学博士。2006年Preferred Infrastructureを共同で創業、2014年Preferred Networks(PFN)を共同で創業。PFN代表取締役最高研究責任者およびPreferred Computational Chemistry代表取締役社長を務める(本データはこの書籍が刊行された当時に掲載されていたものです)

(「BOOK」データベースより)

Customer Reviews

Comprehensive Evaluation

☆
☆
☆
☆
☆

0.0

★
★
★
★
★
 
0
★
★
★
★
☆
 
0
★
★
★
☆
☆
 
0
★
★
☆
☆
☆
 
0
★
☆
☆
☆
☆
 
0

Book Meter Reviews

こちらは読書メーターで書かれたレビューとなります。

powered by

  • 月をみるもの

    物理でフォッカープランクや SDE 解いたことある人なら、枠組み自体は見たことあるはず。なるほど、こういうふうに使うと生成モデルになるんかー。こちの画象モデルと Transformer による大規模言語モデル、モダリティの違うものが本格的に結合して、いよいよ新しい世界が見えてくる予感。

  • shin_ash

    岡野原さんの拡散モデルの解説である。難しい話しをわかりやすく解説し、わかった気にさせてくれる。頭のいい人が文章を書くとこうもわかりやすいのかと感動する。心が洗われる様なわかりやすさだ。一方、内容的には大変難しい。フンフン機嫌良く読んでいても「あれ?拡散モデルって何ができるの?」とふと気づく。しばらく読み進めると「ああ、そう言うことができるのね」と解説される。拡散モデルは技術的な美しさを感じる。誤差の分布にすることで認識モデルを固定にし、平均との差分にすることで誤差を学習する。非常に上手くできてると思う。

  • nos

    世間の拡散モデルの説明として拡散の逆回しみたいな話を見てそんなこと不可能だろうと気になっていたので読んだ。スコアベースモデルのランジュバン・モンテカルロという多次元多峰性分布をうまくサンプリングする手法とデノイジング拡散確率モデルという手法は一見大きく異なるが統一的に理解できるという説明の仕方でその辺納得できてよかった。3章は確率微分方程式の知識がないので流し読み。

  • yyhhyy

    stable diffusionで話題の拡散モデルについていち早く日本語で紹介。敵対的生成ネットワークにとって変わってこの先色んなライブラリが提供されていく仕組みになるんだろうと思う。

  • icon

    スコアの勾配はヘッシアン。Probabilistic flow ODE: 任意のsdeは同じ周辺分布をもつodeに変換可能。認識モデルが複雑すぎて事後分布のモードをカバーできずモード崩壊/posterior collapse.

レビューをもっと見る

(外部サイト)に移動します

Recommend Items