Books

Kaggleで勝つデータ分析の技術

保坂桂佑

Product Details

ISBN/Catalogue Number
ISBN 13 : 9784297108434
ISBN 10 : 4297108437
Format
Books
Publisher
Release Date
October/2019
Japan
Co-Writer, Translator, Featured Individuals/organizations
:

Content Description

データサイエンスの認知の高まりとともに,データ分析に関するコンペティションが多数開催されるようになってきました。最も有名なコンペティションプラットフォームであるKaggleにおけるプレイヤー数は10万人を超え,多くのエンジニアが自分の腕を試すためにコンペティションに参加しています。分析コンペでは,実際のデータを扱うため,機械学習の解説書にはあまり載っていないような手法やテクニックが数多く活用されています。これらを理解し自身で使えるようにしておくことはコンペだけでなく,実務でのモデル構築において非常に役に立ちます。
そこでこれらのテクニックや事例を多くの人に知っていただくために,現時点で最新のものを整理して本書にまとめました。特徴量の作り方,バリデーション,パラメータチューニングなどについて,一般的な書籍ではあまり言及されない暗黙知やポイントについて記述しています。分析コンペにこれから参加してみたい方,あるいはもっと上を目指したい方だけでなく,実務で予測モデルの精度を上げたいという方にも参考になる情報が多いでしょう。

こんな方におすすめ
Kaggle をはじめたい方、データ分析者、データサイエンティスト

【著者紹介】
門脇大輔 : 京都大学総合人間学部卒業後、生命保険会社でアクチュアリーとして10年ほど商品開発・リスク管理などに従事した後、Kaggleや競技プログラミングで学んだ技術で仕事をするようになった。Kaggle Competitions Master(Walmart Recruiting 2:Sales in Stormy Weather優勝、Coupon Purchase Prediction3位)、日本アクチュアリー会正会員

阪田隆司 : 2012年に京都大学大学院修了後、国内電機メーカーに入社。以来、データサイエンティストおよび研究員として従事。仕事柄、データサイエンス・機械学習に興味を持ち、2014年よりKaggleを始め、2019年にKaggle Competitions Grandmasterとなる

保坂桂佑 : 東京大学大学院総合文化研究科広域科学専攻で天体シミュレーションの研究で修士号を取得後、データ分析のコンサルティング企業で、10年近く企業のデータ分析支援に携わった。その後大手Webサービス企業に入社し、データ活用の推進に携わったあと、現在はデータサイエンティストや機械学習エンジニアの育成、マネジメントに従事。Kaggle Competitions Expert

平松雄司 : 東京大学理学部物理学科卒業、同大学大学院理学研究科物理学専攻修了後、国内電機大手に就職した後、金融業界へと転身し、金融システム会社にてデリバティブクオンツ、国内大手損保グループにてリスクアクチュアリー業務に携わった。現在は、アクサ生命保険株式会社にてシニアデータサイエンティストとして社内のデータ分析の促進に従事。また、東京大学へ研究員としても出向中で、医療データの分析・研究を行っている。日本アクチュアリー会準会員。2018年にKaggle Competitions Masterとなっている(本データはこの書籍が刊行された当時に掲載されていたものです)

(「BOOK」データベースより)

Customer Reviews

Comprehensive Evaluation

☆
☆
☆
☆
☆

0.0

★
★
★
★
★
 
0
★
★
★
★
☆
 
0
★
★
★
☆
☆
 
0
★
★
☆
☆
☆
 
0
★
☆
☆
☆
☆
 
0

Book Meter Reviews

こちらは読書メーターで書かれたレビューとなります。

powered by

  • ぶう

    kaggleで勝つデータ分析とあるがコンペでなくても活用できる内容の本。機械学習に関する教科書的な本は数多く出版されているが、本書のようにテクニック集的な書籍は少数なので有り難い。kaggleで勝つというタイトルから上級者向けに書かれているマニアックな内容かと思いきや、以外と初心者にも分かるほど丁寧な説明がされており、大変理解しやすかった。機械学習の基礎は覚えてモデルは作れるようになったが、さてどうやって精度を上げていけばいいのかというレベルの人が読むとよいのではないだろうか。とりあえずxgboost。

  • しんた

    データサイエンスを学んでいるときにメンターから勧められた本。やっと読む事ができた。私のレベルではまだ難しい。会社でデータ分析の研修を受けることになったので活用していきたい。

  • Taizo

    日本語で書かれたKaggleの攻略書のパイオニア的立ち位置であり、今なおバイブルとして利用されている本書。もし、Kaggleはやらない、という人であっても、機械学習プロジェクトに参画する(可能性がある)人であれば、一読を強くオススメする。単純なアルゴリズムや教科書的な精度評価から一歩踏み込んで、ビジネス指標に直結する精度設計や、特徴量エンジニアリングなど、実務でも役立つノウハウが満載。特に5章の「モデルの評価」は知っておかないと、「開発時はいい精度だったのに運用では全く精度が出ない」となりかねないので注意

  • shin_ash

    一応、データ分析を生業にしているので、"Kaggleに挑戦しなきゃ"と軽く脅迫観念を感じる中で手に取った。そう言う意味では"kaggleはそう言うものか"と言うのが分かって、脅迫観念から解放されたのが一番の収穫かも知れない。コンペと実務は大変似ている所と、大きく異なる所とを感じながら読めたので、実務家としても大いに参考になった。実践的テクニックは感心させられるものが多く、また、我流で適当にやってた事もそれなりに妥当っぽいことがわかってよかった。ただ、細かい理論の説明は専門書の解説の方が分かりやすいだろう。

  • suzuki

    Kaggle本2冊目。職場の有識者の推薦図書。 機械学習のTableコンペで実施する各作業について、網羅的に解説しており、かつ実践的な内容である印象。 機械学習は公開講座の疑似コンペでかじった程度の現在の自分にとっては、全体像についての理解度を少し深めることができたという価値があった。 本書の真価については、今後、Kaggle等での機械学習の実践を通じて検証していきたい。

レビューをもっと見る

(外部サイト)に移動します

Recommend Items