Books

入門 Pyspark Pythonとjupyterで活用するspark2エコシステム

Tomasz Drabas

Product Details

ISBN/Catalogue Number
ISBN 13 : 9784873118185
ISBN 10 : 4873118182
Format
Books
Release Date
November/2017
Japan
Co-Writer, Translator, Featured Individuals/organizations
:

Content Description

PythonからSparkを利用するための機能、PySparkを使いこなすテクニックとノウハウ。はじめに高速になったSpark2.0の特徴とアーキテクチャを解説し、構造化及び非構造化データの読み取り、PySparkで利用できる基本的なデータ型、MLlibとMLパッケージによる機械学習モデルの構築を説明。GraphFramesを使ったグラフの操作、ストリーミングデータの読み取り、クラウドへのモデルのデプロイなどの方法を豊富なサンプルと一緒に学ぶ。ローカルでのSpark+Python+Jupyter環境の構築方法も紹介。

目次 : 1章 Sparkを理解する/ 2章 耐障害性分散データセット/ 3章 DataFrame/ 4章 データのモデリングの準備/ 5章 MLlib/ 6章 MLパッケージ/ 7章 GraphFrames/ 8章 TensorFrames/ 9章 Blazeによるポリグロットパーシステンス/ 10章 Structured Streaming/ 11章 Sparkアプリケーションのパッケージ化

【著者紹介】
トマズ・ドラバス : シアトル在住のMicrosoftに勤めるデータサイエンティスト。ヨーロッパ、オーストラリア、北米という3つの大陸で先端的なテクノロジー、航空、テレコミュニケーション、金融、コンサルティングといった数多くの分野に関わり、データ分析とデータサイエンスの経験を13年以上にわたって積んできた

デニー・リー : MicrosoftのAzure Cosmos DBチームのプリンシパルプログラムマネージャー。インターネットスケールのインフラストラクチャ、データプラットフォーム、オンプレミスとクラウド両方の環境の予測分析システムの開発経験を18年以上も持っている、分散システムおよびデータサイエンスの現場のエンジニアである

玉川竜司 : Sky株式会社。本業はソフト開発(本データはこの書籍が刊行された当時に掲載されていたものです)

(「BOOK」データベースより)

Customer Reviews

Comprehensive Evaluation

☆
☆
☆
☆
☆

0.0

★
★
★
★
★
 
0
★
★
★
★
☆
 
0
★
★
★
☆
☆
 
0
★
★
☆
☆
☆
 
0
★
☆
☆
☆
☆
 
0

Book Meter Reviews

こちらは読書メーターで書かれたレビューとなります。

powered by

  • ほしの

    業務でSpark 使っていて、PySpark あたり、遅延実行まわりとかすごく助かった。速くするの楽しい。そろそろScalaを覚えて、Spark のコードの海を泳ぎたい気分。

  • ますみ

    AWS Glueを少し触ることになり中身がApache Sparkだったので読みました。RDD, DataFrame, DataSetと基本的なデータ構造から入り、機械学習関係といった処理内容の話から、Blazeによるポリグロット対応、Streamingなどの提供形態のバリエーション、パッケージ化とデプロイなどの開発な話を一通り眺められます。また付録がセットアップなのでSpark自体にも入りやすいと思いました。

レビューをもっと見る

(外部サイト)に移動します

Recommend Items