Books

音源分離・音声認識 メディアテクノロジーシリーズ

大淵康成

Product Details

ISBN/Catalogue Number
ISBN 13 : 9784339013795
ISBN 10 : 433901379X
Format
Books
Publisher
Release Date
October/2024
Japan
Co-Writer, Translator, Featured Individuals/organizations
:

Content Description

【読者対象】
本書は、マイクから取り込んだ音を聞き分け、理解するシステムに興味のある幅広い読者を対象としています。音声そのものを扱う研究に従事する人だけでなく、様々なITシステムの中で音声を活用したいと思っている方にも役立つ内容となっています。

【書籍の特徴】
本書では、様々な音が混ざり合った状態から目的の音声だけを取り出す音源分離技術と、そうして得られた音声の内容を理解する音声認識技術とを扱っています。この二つは異なる技術ですが、音響信号からの特徴抽出や、大量のデータのモデル化の方法など、共通して学ぶべき内容も多く、一冊の書籍にまとめることで、さらに理解しやすくなると考えました。もちろん片方だけでも十分に役立ちますので、必要なところだけを読んでもらっても構いません。また、アルゴリズムを自分で実装するのは大変だという人でも、既存のツールなどを使いこなすための基礎知識が得られるような内容になっています。

【各章について】
1章では、本書で扱う技術の位置づけと、本書の構成を説明しています。
2章では、音声の信号処理や機械学習の基礎的な部分を概説しています。本書で扱う分野の入門的知識として過不足の無い内容になっているはずです。
3章は、音源分離に関する章です。音声認識や音声通話など様々な目的で用いることも考慮に入れ、使用目的や雑音環境、マイク配置などに応じた最適な手法を説明します。
4章は、音声認識に関する章です。基本となる確率モデルの考え方に加えて、近年の主流となっている深層学習を用いたシステムの活用方法についても解説します。
5章では、音源分離と音声認識の両者にまたがる技術を紹介します。どちらか片方の章の続きとして読んでも、あるいは両者のまとめとして読んでも構いません。

【著者からのメッセージ】
近年のAIブームに乗って、音源分離や音声認識の様々なツールやアプリケーションが公開されています。周辺分野の研究者や開発者が、これらを自分のシステムに取り込む機会も多くなっていることでしょう。しかし、扱う音声データの種類や、アプリケーションの形態などにより、AIツールの最適な使い方は変わってきます。様々な目的を持った研究者・開発者の方々が、本書を通じて得られた知識をもとに、最先端の音声処理機能を活用していただければ幸いです。

【著者紹介】
大淵康成 : 1988年東京大学理学部物理学科卒業。2015年東京工科大学教授

武田龍 : 2006年京都大学工学部情報学科卒業。2019年大阪大学准教授

高島遼一 : 2008年神戸大学工学部情報知能工学科卒業。2019年神戸大学准教授(本データはこの書籍が刊行された当時に掲載されていたものです)

(「BOOK」データベースより)

Customer Reviews

Comprehensive Evaluation

☆
☆
☆
☆
☆

0.0

★
★
★
★
★
 
0
★
★
★
★
☆
 
0
★
★
★
☆
☆
 
0
★
★
☆
☆
☆
 
0
★
☆
☆
☆
☆
 
0

Book Meter Reviews

こちらは読書メーターで書かれたレビューとなります。

powered by

  • 株式会社 コロナ社

    コロナ社HPレビュー全文へのリンク https://www.coronasha.co.jp/np/resrcs/review.html?goods_id=8350 昨今,音声を処理するようなプログラム(ライブラリ・APIなど)の多くがWeb上公開されており,入手自体は容易に行えるが,それをどのように読み解き,組み合わせていいのか分からない初心者(このレビューを執筆している私も含む)に,本書は最適ではないかと個人的には感じた.〜

レビューをもっと見る

(外部サイト)に移動します

Recommend Items