Books

Sparkによる実践データ解析 大規模データのための機械学習事例集

Sandy Ryza

Product Details

ISBN/Catalogue Number
ISBN 13 : 9784873117508
ISBN 10 : 487311750X
Format
Books
Release Date
January/2016
Japan

Content Description

本書は、データサイエンスの4人のエキスパートがSparkでの高度な分析方法を解説するとともに、より実践的なデータサイエンスを学ぶ書籍です。ビッグデータ分析におけるSparkの位置づけを紹介し、ベストな結果を得るためのデータの準備やモデルのチューニングについて解説します。またデータクレンジングのユースケースを通じてSparkとScalaによるデータ処理の基本を学習し、Sparkを使った機械学習の基礎や応用分野における広く使われる一般的なアルゴリズムを紹介します。日本語版では付録として高柳慎一氏と牧山幸史氏による「SparkRについて」と千葉立寛氏、小野寺民也氏による「SparkのJVM、システムレベルのチューニングによる高速化」を掲載。高度なデータ解析を習得したいデータサイエンティスト必携の一冊です。

目次 : ビッグデータの分析/ ScalaとSparkによるデータ分析の紹介/ 音楽のレコメンドとAudioscrobblerデータセット/ 決定木を使った森林被覆の予測/ K平均クラスタリングを使ったネットワークトラフィックにおける異常の検出/ 潜在意味解析を使ったWikipediaの理解/ GraphXを使った共起ネットワークの分析/ ニューヨーク市のタクシーの移動データに対する地理空間及び履歴データ分析/ モンテカルロシミュレーションによる金融リスクの推定/ ゲノムデータの分析とBDGプロジェクト/ PySparkとThunderを使った神経画像データの分析/ Sparkの詳細/ MLlib Pipelines API/ SparkRについて/ SparkのJVM、OSレベルのチューニングによる高速化

【著者紹介】
サンディ・ライザ : Cloudera社のデータサイエンティストであり、Apache Sparkプロジェクトの活発なコントリビュータ。近年はClouderaでのApacheの開発をリードしており、Sparkによるさまざまな分析のユースケースにおける顧客の支援に時間を費やしている。Hadoop Project Management Committeeのメンバーでもある

ユーリ・ラサーソン : Cloudera社のデータサイエンティスト。Clouderaでは、Hadoopエコシステム中のPythonにフォーカスしている。また、ライフサイエンスやヘルスケアを中心とする広範囲の問題に対して、Hadoopを導入する支援をしている。Uriは以前、MITでバイオメディカルエンジニアリングでPh.Dの取得を目指す傍ら、次世代診断の企業であるGood Start Geneticsを共同設立した

ショーン・オーエン : Cloudera社でヨーロッパ、中東及びアフリカを担当するデータサイエンスのディレクター。2009年以来、Apacheの機械学習プロジェクトであるMahoutに対して大きく貢献しており、そのレコメンデーションフレームワークであるTasteを作成した。lambdaアーキテクチャの原理の上に構築された、Hadoop上の大規模リアルタイム学習のためのOryx(以前はMyrrixと呼ばれていた)プロジェクトを立ち上げた

ジョシュ・ウィルス : Cloudera社のデータサイエンスのシニアディレクターであり、幅広い業界に渡って、Hadoopベースのソリューションを開発するために顧客及びエンジニアと共に働いている。最適化されたMapReduce及びSparkのパイプラインをJavaで構築するためのApache Crunchプロジェクトの創始者であり、VPでもある。Clouderaに入社する以前は、Googleに勤めており、オークションのシステムの仕事をした後、Google+の分析インフラストラクチャの開発をリードしていた

石川有 : 株式会社リクルートテクノロジーズのアドバンスドテクノロジーラボに所属。株式会社ミクシィ在籍時にHadoopやHiveなどの分散処理システムに興味を持ち、分析基盤構築からアプリケーション設計、データサイエンス業務まで幅広くこなす。現在は、Apache Sparkの特に機械学習コンポーネントMLlibの開発に従事している(本データはこの書籍が刊行された当時に掲載されていたものです)

(「BOOK」データベースより)

Customer Reviews

Comprehensive Evaluation

☆
☆
☆
☆
☆

0.0

★
★
★
★
★
 
0
★
★
★
★
☆
 
0
★
★
★
☆
☆
 
0
★
★
☆
☆
☆
 
0
★
☆
☆
☆
☆
 
0

Recommend Items