题名:精通Hadoop
作者:(印) Sandeep Karanth著
出版年:2016
ISBN: 978-7-115-41105-1
分类号: TP274
中图分类: 数据处理、数据处理系统
译者: 刘 淼, 唐觊隽, 陈智威
定价: 49.00元
页数: 268 页
出版社: 人民邮电出版社
装订: 平装

本书是一本循序渐进的指导手册,重点介绍了Hadoop的高级概念和特性。内容涵盖了Hadoop 2.X版的改进,MapReduce、Pig和Hive等的优化及其高级特性,Hadoop 2.0的专属特性(如YARN和HDFS联合),以及如何使用Hadoop 2.0版本扩展Hadoop的能力。<br />如果你想拓展自己的Hadoop知识和技能,想应对具有挑战性的数据处理问题,想让Hadoop作业、Pig脚本和Hive查询运行得更快,或者想了解升级Hadoop的好处,那么本书便是你的不二选择。<br />通过阅读本书,你将能够:<br />理解从Hadoop 1.0到Hadoop 2.0的变化<br />定制和优化Hadoop 2.0中的MapReduce作业<br />探究Hadoop I/O和不同的数据格式<br />深入学习YARN和Storm,并通过YARN集成Hadoop和Storm<br />基于亚马逊Elastic MapReduce部署Hadoop<br />探究HDFS替代品,学习HDFS联合<br />掌握Hadoop安全方面的主要内容<br />使用Mahout和RHadoop进行Hadoop数据分析

Sandeep Karanth
Scibler公司联合创始人,负责数据智能产品的架构;DataPhi Labs公司联合创始人兼首席架构师,专注于构建和实施软件系统。他拥有14年以上的软件行业从业经验,既设计过企业数据应用,也开发过新一代移动应用。他曾就职于微软总部和微软印度研究院。他的Twitter账号是@karanths,GitHub账号是https://github.com/Karanth。