Alice Zheng

All Products

Books

機械学習のための特微量エンジニアリングその原理とpythonによる実践

Write review

Product Details

Genre

：

Architecture&Engineering

ISBN/Catalogue Number

：

ISBN 13 : 9784873118680
ISBN 10 : 4873118689

Format

：

Books

Publisher

：

オライリー・ジャパン

Release Date

：

February/2019

Release Country

：

Japan

Co-Writer, Translator, Featured Individuals/organizations

アリス・チャン, アマンダ・カサリ ,

Content Description

本書は、機械学習モデルの性能を向上させるために、データから良い特徴量を作る特徴量エンジニアリングについて解説します。前半では初学者に向けて、数値、テキスト、カテゴリ変数の基本的な取り扱い方を説明し、後半では特徴量ハッシング、ビンカウンティング、ＰＣＡによるデータの圧縮、さらに非線形特徴量とモデルスタッキング、画像特徴量抽出と深層学習による自動特徴学習などの高度なテーマを扱います。特徴量エンジニアリングの原理について直感的な理解が得られるように図や例を豊富に使い、またＰｙｔｈｏｎコードによる実行例を数多くあげて解説しており、実際の業務に適用するための具体的な知識が得られます。特徴量エンジニアリングを使いこなし、機械学習モデルの性能を最大限に引き出したいエンジニア必携の一冊です。Ｋａｇｇｌｅ　ＧｒａｎｄｍａｓｔｅｒのＫｏｈｅｉ　Ｏｚａｋｉ（＠ｓｍｌｙ）氏による「日本語版に寄せて」を収録しています。

目次 : １章　機械学習パイプライン/ ２章　数値データの取り扱い/ ３章　テキストデータの取り扱い/ ４章　特徴量スケーリングによる効果：Ｂａｇ‐ｏｆ‐ＷｏｒｄｓのＴＦ‐ＩＤＦによる重み付け/ ５章　カテゴリ変数の取り扱い/ ６章　次元削減：膨大なデータをＰＣＡで圧縮/ ７章　非線形特徴量の生成：κ‐ｍｅａｎｓを使ったスタッキング/ ８章　特徴量作成の自動化：画像特徴量の抽出と深層学習/ ９章　バック・トゥ・ザ・「フィーチャー」：学術論文レコメンドアルゴリズムの構築/ 付録Ａ　線形モデリングと線形代数の基礎

【著者紹介】
アリス・チャン : 機械学習、スパニングアルゴリズム、プラットフォーム開発の技術リーダー。現在、Ａｍａｚｏｎ　Ａｄｖｅｒｔｉｓｉｎｇにおいてサイエンス研究マネージャーをしている。それ以前は、ＧｒａｐｈＬａｂ／Ｄａｔｏ／Ｔｕｒｉでのツールキット開発とユーザー教育に携わり、Ｍｉｃｒｏｓｏｆｔ　Ｒｅｓｅａｒｃｈでは機械学習の研究者だった。ＵＣ　Ｂｅｒｋｅｌｅｙ大学で電気工学およびコンピュータサイエンスの博士号、また数学の学士号を取得している

アマンダ・カサリ : 次世代の技術を探求し、その影響を実証しているエンジニア。Ｃｏｎｃｕｒ　Ｌａｂｓの上級プロダクトマネージャーおよびデータサイエンティストであり、ＳＡＰ　ＣｏｎｃｕｒにおけるＣｏｎｃｕｒ　Ｌａｂｓ　ＡＩ　Ｒｅｓｅａｒｃｈチームの共同設立者でもある。過去１６年間にわたり、データサイエンス、機械学習、ロボティクスなど幅広いエンジニアリング分野に携わってきた。米海軍アカデミーで制御システム工学の学士号と、Ｖｅｒｍｏｎｔ大学の電気工学の修士号を取得している（本データはこの書籍が刊行された当時に掲載されていたものです）

（「BOOK」データベースより）

Customer Reviews

Comprehensive Evaluation

0.0

Write you own review

Book Meter Reviews

こちらは読書メーターで書かれたレビューとなります。

powered by

shin_ash

読了日：2019/06/01

掴み所の難しい特徴量についての本。分布に関するスケーリングと変数変換から始まって、カテゴリ変数のコード化、カウント、テキスト関連のn-gram、TF-IDF、次元圧縮、クラスタリングの応用、画像特徴量からDNNまで。最後のDNNはこれを特徴量エンジニアリングと言ってしまっていいのか？と思わなくはないが、特徴量に注目すれば中身は特徴量エンジニアリングと言えなくはない。実務においては固有技術とも密接に関わり、そもそも問題の設定とタスクの内容によるところが大きいのが、実務上の理解を難しくしているのかもしれない。

_

読了日：2019/09/30

立ち読みで十分だったか。最近は読書する気力がないので大変よろしくない。

ONE_shoT_

読了日：2019/08/01

データの前処理・特徴量エンジニアリングの方法について広く述べられた一冊。数値データの加工（二値化・離散化・対数変換・スケーリング・交互作用項）やカテゴリデータのエンコーディングはすぐに役立ちます。他にも、k-meansで非線形特徴量をつくる方法、PCAでの次元削減からテキストデータの加工（Bag-of-Words, TF-IDF）まで、参考になります。

Zooshima

カテゴリカルデータをどう扱うべきか学ぶため読了。大変参考になった。

g_h_

読了日：2020/06/27

実際にデータサイエンスを行う上で重要なフローはデータの前処理、特徴量設計であり、データサイエンティストの業務の８－9割はこれに占められている。そのためモデルそのものだけでなく特徴量設計についてのわかりやすい本が一冊欲しいと考えている人にとって、本書はまさにうってつけの一冊となるであろう。特徴量設計についての必要知識を過不足なく網羅していてこの上なく有益な一冊。データを扱う仕事についている人であれば必読書と言える。

レビューをもっと見る

(外部サイト)に移動します

Recommend Items

Sell This Item

Feedback

Missing or incorrect information?

Product information of this page .

機械学習のための特微量エンジニアリング その原理とpythonによる実践

Alice Zheng

Product Details

Content Description

Customer Reviews

Book Meter Reviews

shin_ash

_

ONE_shoT_

Zooshima

g_h_

Recommend Items

Feedback

機械学習のための特微量エンジニアリングその原理とpythonによる実践