Информация о книге

978-5-97060-156-3, 978-5-94074-785-7

Главная  » Тематика определяется » Hadoop в действии

Лэм Ч., Hadoop в действии

ДМК Пресс, 2012 г., 424 стр., 978-5-97060-156-3, 978-5-94074-785-7


Описание книги

Обработка больших массивов данных с помощью традиционных СУБД может оказаться трудным делом. Apache Hadoop - это каркас для разработки приложении, предназначенных для выполнения в распределенном кластере, без применения SQL. Такие приложения прекрасно масштабируются и могут обрабатывать гигантские массивы данных. Если вам требуется произвести анализ данных, то Hadoop как раз то, что надо. Прочитав эту книгу, вы познакомитесь с предметом и научитесь писать программы в стиле MapReduce. После нескольких простых примеров автор быстро переходит к вопросу об использовании Hadoop для решения более сложных задач анализа данных. Описываются рекомендованные приемы и паттерны проектирования, полезные при программировании для MapReduce. Для чтения книги требуется знание основ языка Java. Некоторое знакомство с математической статистикой...

Скачать, но не бесплатно эту книгу можно в интернет-магазинах

  Литрес - 519 руб.

Читать онлайн


Доступен для чтения фрагмент книги

Ключевые слова

Поделиться ссылкой на книгу



Дополнительно о книге

Эта книга состоит из 12 глав, разбитых на три части. Часть 1 состоит из трех глав и представляет собой введение в каркас Hadoop. Здесь излагаются те базовые сведения, которые необходимо знать для понимания и использования каркаса. Описывается, из каких аппаратных компонентов состоит кластер Hadoop, рассказывается об установке и конфигурировании системы. Также в части 1 дается общее представление о каркасе MapReduce и приводится пример первой MapReduce-программы. Часть 2 «Hadoop в действии» состоит из пяти глав, в которых описаны практические навыки, необходимые для составления и запуска программ обработки данных в среде Hadoop. Здесь мы рассмотрим многочисленные примеры применения Hadoop к анализу набора данных о патентах, в том числе и такие нетривиальные алгоритмы, как фильтр Блума. Мы также поговорим о приемах программирования и администрирования, чрезвычайно полезных при работе с Hadoop в производственной среде. Часть 3 «Hadoop в реальной жизни», в которую входят последние четыре главы, посвящена обширной экосистеме, сложившейся вокруг Hadoop. Существуют облачные службы, которые позволяют обойтись без покупки собственного оборудования для создания кластера. Имеются также дополнительные пакеты, предлагающие высокоуровневые абстракции, надстроенные над MapReduce. Наконец, мы рассмотрим несколько примеров практического применения Hadoop к решению реальных задач бизнеса. В приложении приведен список команд HDFS.

Содержание книги

Предисловие
Благодарности
Об этой книге
Автор в сети
Об авторе
Об иллюстрации на обложке
Часть 1. Hadoop - каркас распределенного
программирования
Глава 1. Введение в Hadoop
Глава 2. Запуск Hadoop
Глава 3. Компоненты Hadoop
Часть 2. Hadoop в действии
Глава 4. Создание простых MapReduce-программ
Глава 5. Углубленное изучение MapReduce
Глава 6. Практическое программирование
Глава 7. Сборник рецептов
Глава 8. Администрирование Hadoop
Часть 3. Hadoop в реальной жизни
Глава 9. Эксплуатация Hadoop в облаке
Глава 10. Программирование с помощью Pig
Глава 11. Hive и другие
Глава 12. Примеры применения
Приложение. Команды HDFS
Предметный указатель


Об авторе


Отзывы

Доступно. Широко. Злободневно  [ 2 March 2013]
Просто замечательная книга. Избран идеальный баланс между детализацией объяснений и глубиной материала. В деталях описывается архитектура Hadoop, дается детальная инструкция по развертыванию кластера Hadoop/HDFS во всех трех случаях распределенности и показывается модель программирования на Java и скриптах. Затем задачи решаемые задачи усложняются, естественным образом иллюстрируя необходимость сцепления нескольких Hadoop задач в один поток, что естественным образом подводит к необходимости использования более высокоуровневых надстроек как Pig и Hive. Параллельно освещаются такие инструменты, сопутствующие распределенные вычисления с большим объемом данных, как фильтры Блума. Ну и завершают книгу примеры реального применения Hadoop с обоснованием выигрыша в плане производительности и денег.
Язык книги легкий, да и перевод неплохой. Заметил всего одну опечатку. Must have для всех, кто работает с BigData.
Первое впечатление негативное.  [16 November 2012]
Прочитал первые несколько десятков страниц и пока впечатление негативное.
Будьте готовы к тому, что на гугление и изучение оригинальной документации(на английском) вы потратите гораздо больше времени, чем на чтение самой книги. Автор вообще не уделил внимания проблеме настройки рабочего окружения и решению весьма вероятных технических проблем, поэтому даже для того, чтобы просто запустить первый простейший пример с подсчётом слов у вас может уйти несколько часов или больше, если у вас нет опыта работы с linux.

Последние поступления в рубрике "Тематика определяется"



Математика. Подготовка к ЕГЭ. Задачи с параметрами.10-11 классы 

В предлагаемом пособии представлен обширный материал, посвященный двум заключительным и сложным темам ЕГЭ профильного уровня: задачам с параметрами и числам и их свойствам. На многочисленных примерах с подробными решениями и обоснованиями (как и требуется на экзамене) показаны различные методы и решения задач....

План счетов бухгалтерского учета с последними изменениями 

Читателю предлагается самая последняя редакция Плана счетов бухгалтерского учета финансово-хозяйственной деятельности организаций и инструкции по его применению с учетом последних приказов Минфина РФ. План счетов - это важнейший инструмент бухгалтерского учета, настольная книга для каждого практического бухгалтера....

На ферме. Книжка с наклейками 

Игры с наклейками - занятие не только интересное, но и полезное. С этой книгой малыш познакомится с различными видами транспорта, потренируется решать простые логические задачки и находить соответствия....

Если Вы задавались вопросами "где найти книгу в интернете?", "где купить книгу?" и "в каком книжном интернет-магазине нужная книга стоит дешевле?", то наш сайт именно для Вас. На сайте книжной поисковой системы Книгопоиск Вы можете узнать наличие книги Лэм Ч., Hadoop в действии в интернет-магазинах. Также Вы можете перейти на страницу понравившегося интернет-магазина и купить книгу на сайте магазина. Учтите, что стоимость товара и его наличие в нашей поисковой системе и на сайте интернет-магазина книг может отличаться, в виду задержки обновления информации.