Информация о книге

978-5-97060-156-3, 978-5-94074-785-7

Главная  » Тематика определяется » Hadoop в действии

Лэм Ч., Hadoop в действии

ДМК Пресс, 2012 г., 424 стр., 978-5-97060-156-3, 978-5-94074-785-7


Описание книги

Обработка больших массивов данных с помощью традиционных СУБД может оказаться трудным делом. Apache Hadoop - это каркас для разработки приложении, предназначенных для выполнения в распределенном кластере, без применения SQL. Такие приложения прекрасно масштабируются и могут обрабатывать гигантские массивы данных. Если вам требуется произвести анализ данных, то Hadoop как раз то, что надо. Прочитав эту книгу, вы познакомитесь с предметом и научитесь писать программы в стиле MapReduce. После нескольких простых примеров автор быстро переходит к вопросу об использовании Hadoop для решения более сложных задач анализа данных. Описываются рекомендованные приемы и паттерны проектирования, полезные при программировании для MapReduce. Для чтения книги требуется знание основ языка Java. Некоторое знакомство с математической статистикой...

Скачать, но не бесплатно эту книгу можно в интернет-магазинах

  Литрес - 519 руб.

Читать онлайн


Доступен для чтения фрагмент книги

Ключевые слова

Поделиться ссылкой на книгу



Дополнительно о книге

Эта книга состоит из 12 глав, разбитых на три части. Часть 1 состоит из трех глав и представляет собой введение в каркас Hadoop. Здесь излагаются те базовые сведения, которые необходимо знать для понимания и использования каркаса. Описывается, из каких аппаратных компонентов состоит кластер Hadoop, рассказывается об установке и конфигурировании системы. Также в части 1 дается общее представление о каркасе MapReduce и приводится пример первой MapReduce-программы. Часть 2 «Hadoop в действии» состоит из пяти глав, в которых описаны практические навыки, необходимые для составления и запуска программ обработки данных в среде Hadoop. Здесь мы рассмотрим многочисленные примеры применения Hadoop к анализу набора данных о патентах, в том числе и такие нетривиальные алгоритмы, как фильтр Блума. Мы также поговорим о приемах программирования и администрирования, чрезвычайно полезных при работе с Hadoop в производственной среде. Часть 3 «Hadoop в реальной жизни», в которую входят последние четыре главы, посвящена обширной экосистеме, сложившейся вокруг Hadoop. Существуют облачные службы, которые позволяют обойтись без покупки собственного оборудования для создания кластера. Имеются также дополнительные пакеты, предлагающие высокоуровневые абстракции, надстроенные над MapReduce. Наконец, мы рассмотрим несколько примеров практического применения Hadoop к решению реальных задач бизнеса. В приложении приведен список команд HDFS.

Содержание книги

Предисловие
Благодарности
Об этой книге
Автор в сети
Об авторе
Об иллюстрации на обложке
Часть 1. Hadoop - каркас распределенного
программирования
Глава 1. Введение в Hadoop
Глава 2. Запуск Hadoop
Глава 3. Компоненты Hadoop
Часть 2. Hadoop в действии
Глава 4. Создание простых MapReduce-программ
Глава 5. Углубленное изучение MapReduce
Глава 6. Практическое программирование
Глава 7. Сборник рецептов
Глава 8. Администрирование Hadoop
Часть 3. Hadoop в реальной жизни
Глава 9. Эксплуатация Hadoop в облаке
Глава 10. Программирование с помощью Pig
Глава 11. Hive и другие
Глава 12. Примеры применения
Приложение. Команды HDFS
Предметный указатель


Об авторе


Отзывы

Доступно. Широко. Злободневно  [ 2 March 2013]
Просто замечательная книга. Избран идеальный баланс между детализацией объяснений и глубиной материала. В деталях описывается архитектура Hadoop, дается детальная инструкция по развертыванию кластера Hadoop/HDFS во всех трех случаях распределенности и показывается модель программирования на Java и скриптах. Затем задачи решаемые задачи усложняются, естественным образом иллюстрируя необходимость сцепления нескольких Hadoop задач в один поток, что естественным образом подводит к необходимости использования более высокоуровневых надстроек как Pig и Hive. Параллельно освещаются такие инструменты, сопутствующие распределенные вычисления с большим объемом данных, как фильтры Блума. Ну и завершают книгу примеры реального применения Hadoop с обоснованием выигрыша в плане производительности и денег.
Язык книги легкий, да и перевод неплохой. Заметил всего одну опечатку. Must have для всех, кто работает с BigData.
Первое впечатление негативное.  [16 November 2012]
Прочитал первые несколько десятков страниц и пока впечатление негативное.
Будьте готовы к тому, что на гугление и изучение оригинальной документации(на английском) вы потратите гораздо больше времени, чем на чтение самой книги. Автор вообще не уделил внимания проблеме настройки рабочего окружения и решению весьма вероятных технических проблем, поэтому даже для того, чтобы просто запустить первый простейший пример с подсчётом слов у вас может уйти несколько часов или больше, если у вас нет опыта работы с linux.

Последние поступления в рубрике "Тематика определяется"



Ритуальный оракул Магия зеркал, 53 карты + инструкция 

Представляем вам новую профессиональную колоду Любови Никифоровой (Отилы), являющуюся продолжением ранее изданной и уже популярной колоды «Ритуальный Оракул». В ней вы познакомитесь с азами работы с зеркалами, видами магических воздействий и способами их снятия....

Оракул Норн. Нити судьбы, 45 карт+инструкция 

Оракул Норн: нити судьбы - действительно уникальная колода. Предсказывать будущее или узнавать обстоятельства прошлого и настоящего помогают Боги, Богини и герои Древней Скандинавии. Они дают подробное описание грядущих событий, которое напрямую зависит не только от обстоятельств, но и от характера человека, который хочет узнать свое будущее....

Оракул Вселенской любви Ангелов, 72 карты + инструкция 

Оракул Вселенских Ангелов — это уникальная колода карт, созданная для тех, кто ищет направление и поддержку в области любви и добра от духовного мира Ангелов. Колода состоит из 72 карт, на каждой из которых изображен Ангел....

Если Вы задавались вопросами "где найти книгу в интернете?", "где купить книгу?" и "в каком книжном интернет-магазине нужная книга стоит дешевле?", то наш сайт именно для Вас. На сайте книжной поисковой системы Книгопоиск Вы можете узнать наличие книги Лэм Ч., Hadoop в действии в интернет-магазинах. Также Вы можете перейти на страницу понравившегося интернет-магазина и купить книгу на сайте магазина. Учтите, что стоимость товара и его наличие в нашей поисковой системе и на сайте интернет-магазина книг может отличаться, в виду задержки обновления информации.