Название: Обработка больших данных Автор: Джейд Картер Издательство: Литрес Год: 2024 Формат: pdf, epub Размер: 11 Мб Качество: Хорошее Язык: Русский
Книга является пособием для изучения технологий больших данных, охватывая основные и продвинутые аспекты работы с данными в распределенных системах. Начав с основ, она объясняет значение БД, их эволюцию и экосистему Hadoop, включая компоненты и инструменты: HDFS, MapReduce, Hive, Pig, HBase, Sqoop и Flume. Автор раскрывает архитектуру и принципы работы Apache Hadoop, а также примеры использования MapReduce и работу с данными в HDFS, Apache Spark, описывая его основные компоненты, такие как RDD, DataFrames, Spark SQL, Spark Streaming, MLLib и GraphX, и предоставляет практические примеры установки и настройки. Раздел, посвященный Apache Kafka, рассматривает основы архитектуры, проектирование и настройка кластеров, а также интеграция с другими системами. Практические примеры и проекты предлагают возможность применить полученные знания, анализируя данные, разрабатывая потоковые приложения и интегрируя технологии Hadoop, Spark и Kafka в единую систему.
Принципы организации распределенных баз данных Название: Принципы организации распределенных баз данных Автор: Есу М. Т. , Вальдуриес П. Издательство: ДMK Год: 2021 Формат: PDF Страниц: 673...
MySQL 8 для больших данных Название: MySQL 8 для больших данных Автор: Чаллавала Ш., Лакхатария Дж., Мехта Ч., Патель К. Издательство: ДМК Пресс Год: 2018 Страниц: 227 ...
Обработка больших данных с Apache Spark Название: Обработка больших данных с Apache Spark Автор: Бутаков Н.А., Петров М.В., Насонов Д. Издательство: Университет ИТМО Год: 2019 Страниц: 52...
Practical Apache Spark: Using the Scala API Название: Practical Apache Spark: Using the Scala API Автор: Subhashini Chellappan, Dharanitharan Ganesan Издательство: Apress Год: 2019 Страниц:...