题名:Hadoop实战
作者:陆嘉恒著
出版年:2011
ISBN: 978-7-111-35944-9
分类号: TP274
中图分类: 数据处理、数据处理系统
定价: 69.00元
页数: 441 页
出版社: 机械工业出版社华章公司

本书是一本系统且极具实践指导意义的Hadoop工具书和参考书。内容全面,对Hadoop整个技术体系进行了全面的讲解,不仅包括HDFS和MapReduce这两大核心内容,而且还包括Hive、HBase、Mahout、Pig、ZooKeeper、Avro、Chukwa等与Hadoop相关的子项目的内容。实战性强,为各个知识点精心设计了大量经典的小案例,易于理解,可操作性强。<br />全书一共18章:第1章全面介绍了Hadoop的概念、优势、项目结构、体系结构,以及它与分布式计算的关系;第2章详细讲解了Hadoop集群的安装和配置,以及常用的日志分析技巧;第3章分析了Hadoop在Yahoo!、eBay、Facebook和百度的应用案例,以及Hadoop平台上海量数据的排序;第4-7章深入地讲解了MapReduce计算模型、MapReduce应用的开发方法、MapReduce的工作机制,同时还列出了多个MapReduce的应用案例,涉及单词计数、数据去重、排序、单表关联和多表关联等内容;第8-11章全面地阐述了Hadoop的I/O操作、HDFS的原理与基本操作,以及Hadoop的各种管理操作,如集群的维护等;第12-17章详细而系统地讲解了Hive、HBase、Mahout、Pig、ZooKeeper、Avro、Chukwa等所有与Hadoop相关的子项目的原理及使用,以及这些子项目与Hadoop的整合使用;第18章以实例的方式讲解了常用Hadoop插件的使用和Hadoop插件的开发。<br />本书既适合没有Hadoop基础的初学者系统地学习,又适合有一定Hadoop基础但是缺乏实践经验的读者实践和参考。

陆嘉恒,中国人民大学副教授,新加坡国立大学博士,美国加利福尼亚大学尔湾分校(University of California, Irvine) 博士后。专注于云计算及其相关技术的研究,对Hadoop有较深入的研究,积累了丰富的实践经验。对分布式计算和海量数据处理有深刻的认识,主持并完成了多个国家863和自然科学基金项目的研究与实施。2009年入选新世纪优秀人才,2010年入选北京科技新星。主持《云计算概论》课程获教育部-IBM精品课程称号。