Product Details
ISBN 10 : 4320114639
Content Description
本書は、数値データやカテゴリデータ、文字列や日付といった様々なタイプのデータを含むファイルをクリーンにするために、公的統計の分野で長年培われてきた技術と理論を幅広くまとめ、汎用的なデータクリーニングシステムをRで構築する方法を紹介する書籍です。Rにおけるデータ表現やデータ構造に関連する技術面についても詳しく解説するとともに、個別のデータ項目に関する知識に基づくルールを用いて統計的にデータを検証し、複数の項目が絡むエラーがある場合に修正すべき最小限の項目を特定し、修正あるいは欠測の補完を行うための様々な方法論も説明しています。
目次 : 第1章 データクリーニング/ 第2章 R入門/ 第3章 データの技術的な表現/ 第4章 データ構造/ 第5章 テキストデータのクリーニング/ 第6章 データ検証/ 第7章 データレコード内のエラー局所化/ 第8章 ルール集合のメンテナンスと単純化/ 第9章 ドメイン知識のためのモデルベースの方法/ 第10章 補完と調整/ 第11章 事例:小規模なデータクリーニングシステム
【著者紹介】
Mark・vanderLoo : オランダ統計局統計的方法論部門(Department of Statistical Methods)所属
Edwin・deJonge : オランダ統計局統計的方法論部門(Department of Statistical Methods)所属
地道正行 : 大阪大学大学院基礎工学研究科博士前期課程修了。博士(学術)。現在、関西学院大学商学部教授。専門:数理統計学、探索的データ解析
〓橋雅夫 : 筑波大学大学院システム情報工学研究科博士後期課程修了。博士(工学)。現在、長野大学企業情報学部教授。専門:統計(公的統計)、データサイエンス
藤野友和 : 岡山大学大学院自然科学研究科博士後期課程修了。博士(理学)。現在、福岡女子大学国際文理学部准教授。専門:計算機統計学
安川武彦 : 筑波大学大学院ビジネス科学研究科博士課程修了。博士(経済学)
和田かず美 : 筑波大学大学院企業科学専攻システムズ・マネジメントコース満期退学。経営学修士(MBA)(本データはこの書籍が刊行された当時に掲載されていたものです)
Customer Reviews
Recommend Items
Feedback
Missing or incorrect information?
Product information of this page .
