Books

統計的テキストモデル 言語へのベイズ的アプローチ 確率と情報の科学

持橋大地

Product Details

Genre
ISBN/Catalogue Number
ISBN 13 : 9784000069762
ISBN 10 : 4000069764
Format
Books
Publisher
Release Date
July/2025
Japan

Content Description

文字・単語・文・文書からなる離散データをベイズ統計モデルでいかに学習するか。さまざまなテキストの統計的なモデル化の数理について一から説明し、ブラックボックスに頼らずとも自分の手で統計的分析を駆使できるようになることを目指す。分野を問わず自然言語処理の必要性が増加の一途をたどるなか、読者を基礎から導く好適書。

目次 : 1 テキストと言語のモデル化(言語とテキストの特徴/ テキストの階層構造 ほか)/ 2 文字の統計モデル(文字の頻度と出現確率/ 文字の同時確率 ほか)/ 3 単語の統計モデル(文字から単語へ/ 単語の統計と冪乗則 ほか)/ 4 文の統計モデル(テキストの文分割/ 文ベクトルと意味的ランダムウォーク ほか)/ 5 文書の統計モデル(ナイーブベイズ法と単語集合表現/ ユニグラム混合モデル(UM) ほか)

【著者紹介】
持橋大地 : 1973年生まれ。1993年東京大学文科三類入学、2005年奈良先端科学技術大学院大学情報科学研究科博士後期課程修了。博士(理学)。ATR音声言語コミュニケーション研究所、NTTコミュニケーション科学基礎研究所各研究員を経て、2024年より統計数理研究所 統計基盤数理研究系教授/総合研究大学院大学 統計科学コース教授および国立国語研究所 次世代言語科学研究センター教授(兼務)。専門は自然言語処理および統計的機械学習(本データはこの書籍が刊行された当時に掲載されていたものです)

(「BOOK」データベースより)

Customer Reviews

Comprehensive Evaluation

☆
☆
☆
☆
☆

0.0

★
★
★
★
★
 
0
★
★
★
★
☆
 
0
★
★
★
☆
☆
 
0
★
★
☆
☆
☆
 
0
★
☆
☆
☆
☆
 
0

Book Meter Reviews

こちらは読書メーターで書かれたレビューとなります。

powered by

  • mim42

    深層学習時代前夜まではフォロワーも少なくなかったトピック。言語のような系列データに関する教師なし学習モデリングの教科書。個人的に懐かしい話題であり期待して読み進めた。基本的に説明が些細で助かったのだが、大局的な説明がなくつらい箇所も。式展開でももう少し説明が欲しいところが散見。とはいえそれらは主に私のベイズ脳の化石化によるところも大。有用性の面では、何らかの事情で生成AIが利用不可等の特殊な事情があるケースでは即戦力となり、かつLLMエージェント連結ツールとしての道もありそう。

レビューをもっと見る

(外部サイト)に移動します

Recommend Items