Название: Data Cleaning Автор: Ihab F. Ilyas, Xu Chu Издательство: Association for Computing Machinery Год: 2019 Формат: PDF Страниц: 285 Размер: 14 Mb Язык: English
This book is about data cleaning, which is used to refer to all kinds of tasks and activities to detect and repair errors in the data. Rather than focus on a particular data cleaning task, we give an overview of the end-to-end data cleaning process, describing various error detection and repair methods, and attempt to anchor these proposals with multiple taxonomies and views. Specifically, we cover four of the most common and important data cleaning tasks, namely, outlier detection, data transformation, error repair (including imputing missing values), and data deduplication. Furthermore, due to the increasing popularity and applicability of machine learning techniques, we include a chapter that specifically explores how machine learning techniques are used for data cleaning, and how data cleaning is used to improve machine learning models.
Statistics for Data Science Название: Statistics for Data Science Автор: James D. Miller Издательство: Packt Publishing Год: 2017 Формат: PDF Размер: 3 Мб Язык: английский /...
Statistical Data Cleaning with Applications in R Название: Statistical Data Cleaning with Applications in R Автор: Mark van der Loo, Edwin de Jonge Издательство: Wiley ISBN: 1118897153 Год: 2018...
Practical Data Wrangling (+code) Название: Practical Data Wrangling (+code) Автор: Allan Visochek Издательство: Packt Publishing Год: 2017 Страниц: 204 Формат: PDF, EPUB Размер: 13...
Exploring Data with RapidMiner Автор: Andrew Chisholm Название: Exploring Data with RapidMiner Издательство: Packt Publishing Год: 2013 ASIN: B00GX67U0I Язык: English Формат: epub...
Clean Data Название: Clean Data Автор: Megan Squire Издательство: PacktPublishing Год: 2013 Формат: PDF, EPUB Размер: 26 Мб Язык: английский / English Is much...
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.