Python2年生スクレイピングのしくみ 体験してわかる!会話でまなべる!

森巧尚

基本情報

ジャンル
ISBN/カタログNo
ISBN 13 : 9784798161914
ISBN 10 : 4798161918
フォーマット
出版社
発行年月
2019年10月
日本
共著・訳者・掲載人物など
:
森巧尚 ,  
追加情報
:
192p;24

内容詳細

機械学習やデータ分析になくてはならない「データ」。このようなデータは、インターネット上に膨大にありますが、Pythonを使えば効率よくデータ収集できます。こうした手法を「スクレイピング」といいます。本書はPythonを一通りまなんだ方に向けて、簡単なサンプルを作りながら、会話形式でスクレイピングのしくみをまなぶ書籍です。対象読者はPythonの基本文法は知っている方(『Python1年生』を読み終えた方)、データ収集やデータ分析の初心者。ヤギ博士&フタバちゃんと一緒に、インターネットからのファイルのダウンロード方法、HTML解析の方法、いろいろなデータの読み書き、APIの使い方といったデータ収集、便利なライブラリを利用した簡単な可視化手法を解説します。

目次 : 第1章 Pythonでデータをダウンロード(スクレイピングってなに?/ Pythonをインストールしてみよう ほか)/ 第2章 HTMLを解析しよう(HTMLを解析してみよう/ ニュースの最新記事一覧を取得してみよう ほか)/ 第3章 表データを読み書きしよう(pandasを使ってみよう/ さまざまなデータの加工 ほか)/ 第4章 オープンデータを分析してみよう(オープンデータってなに?/ 郵便局:郵便番号データ ほか)/ 第5章 Web APIでデータを収集しよう(Web APIってなに?/ OpenWeatherMapってなに? ほか)

【著者紹介】
森巧尚 : アプリの開発や、技術書や電子工作マガジンなどでの執筆活動。関西学院大学非常勤講師、関西学院高等部非常勤講師、成安造形大学非常勤講師、プログラミングスクールコプリ講師など、プログラミングに関する幅広い活動を行っている(本データはこの書籍が刊行された当時に掲載されていたものです)

(「BOOK」データベースより)

ユーザーレビュー

総合評価

☆
☆
☆
☆
☆

0.0

★
★
★
★
★
 
0
★
★
★
★
☆
 
0
★
★
★
☆
☆
 
0
★
★
☆
☆
☆
 
0
★
☆
☆
☆
☆
 
0

読書メーターレビュー

こちらは読書メーターで書かれたレビューとなります。

powered by

  • ぶう さん

    web上には膨大な情報が公開されており、その気になれば幾らでも集めることができる。特にスクレイピングができるようになれば、自分の思い通りにデータ収集が可能となり、マーケティングという領域において強力な武器となる。本書ではPythonを使用したwebスクレイピングの他にも、pandasでの表データの扱い方、matplotlibでの可視化などにも触れられており、データ収集から活用まで幅広く学ぶ事ができる。最近、私の周りでもPython学習者が増加中。機械学習、作業自動化などにも使え、コスパの良いスキルである。

  • こもも さん

    python1年生に続き、2年生のスクレイピングのしくみも手を動かしながらチャレンジしてみました。最後のヤギ先生の言葉通り、 この本で出来る様になるのは「道具の使い方」であって、世の中にあるデータをどう扱って、 どう分析するかは各々考えなきゃいけないですね。まずは手に入る材料で、もっと分析の練習をしたいと思います。

  • goose さん

    さくさく読める。自分のレベルには最適でした。

  • Kazuki さん

    スクレイピングの方法が知りたくて手に取った本。Pythonのインストールから、jsonの説明までかなり基礎の部分からも丁寧に説明してありわかりやすいと思う。イラスト多め

  • まつ さん

    Pythonでスクレイピングをやりたくて借りた。最初にマナーを書いているところがよい。グローバルで試すものなので、まずこういうことを明示してくれると助かる。得た知識は以下。 ・サーバー負荷をかけないようにプログラムする。 ・サイトのルートディレクトリにあるrobots.txtのDisallowや、HTML内のrobotsメタタグがある場合はクローリング禁止。 ・CCBYは自由に使えるデータ ・絶対パスからsplit("/")[-1]でファイル名が取得(マイナスの使い方) ・folium(地図ライブラリ)

レビューをもっと見る

(外部サイト)に移動します

建築・理工 に関連する商品情報

おすすめの商品