题名:Hadoop核心技术
作者:翟周伟著
出版年:2015
ISBN: 978-7-111-49468-3
分类号: TP274
中图分类: 数据处理、数据处理系统
定价: 69.00
页数: 387 页
出版社: 机械工业出版社
装订: 平装

百度资深Hadoop技术专家和高级算法工程师撰写,结合百度大数据实践,直击企业痛点,多位大数据技术专家联袂推荐!<br />从使用、原理、运维和开发4个方面深度讲解Hadoop最核心的技术<br />这是一本技术深度与企业实践并重的著作,由百度顶尖的Hadoop技术工程师撰写,是百度Hadoop技术实践经验的总结。本书使用、实现原理、运维和开发4个方面对Hadoop的核心技术进行了深入的讲解:<br />(1)使用:详细讲解了HDFS存储系统、MapReduce计算框架,以及HDFS的命令系统;<br />(2)原理:结合源代码,深度分析了MapReduce、HDFS、Streaming、Pipes、Hadoop作业调度系统等重要技术和组件的架构设计、工作机制和实现原理;<br />(3)运维:结合百度的实际生产环境,详细讲解了Hadoop集群的安装、配置、测试以及管理和运维;<br />(4)开发:详细讲解了Hadoop Streaming、Pipes的使用和开发实践,以及MapReduce的编程实践和常见问题。<br />与市面上已有的Hadoop相比,本书的最大不同之处是它直切企业应用和实践Hadoop技术的痛点,深入讲解了企业最需要和最头疼的技术和问题,内容上非常聚焦。

翟周伟
就职于百度,资深Hadoop技术专家,专注于Hadoop&大数据,数据挖掘,自然语言处理领域。2009年便开始利用Hadoop构建商业级大数据系统,是国内该领域最早的一批人之一,负责设计过多个基于Hadoop的大数据平台和分析系统。2011年合著出版《Hadoop开源云计算平台》,并在自然语言处理领域申请过一项发明专利。