题名:Spark核心技术与高级应用
作者:于俊[等]著
出版年:2016
ISBN: 978-7-111-52354-3
分类号: TP274
中图分类: 数据处理、数据处理系统
定价: 69.00元
页数: 300 页
出版社: 机械工业出版社
装订: 平装

本书共分为四大部分:<br />基础篇(1~10章)介绍了Spark的用途、扩展、安装、运行模式、程序开发、编程模型、工作原理,以及SparkSQL、SparkStreaming、MLlib、GraphX、Bagel等重要的扩展;<br />实战篇(11~14)讲解了搜索结果的排序、个性化推荐系统、日志分析系统、自然语言处理、数据挖掘等方面的案例;<br />高级篇(15~18)则讲解了Spark的调度管理、存储管理、监控管理、性能优化、最佳实践以及重点算法的解读;<br />扩展篇(19~20)讲解了Sparkjob-server和Tachyon。

于俊,科大讯飞大数据专家,专注大数据Hadoop和spark平台;主要工作是大数据统计分析和机器学习算法工程实现。
向海,科大讯飞大数据专家,spark爱好者,专注于大数据领域,现从事基于spark的用户行为分析相关工作。
代其锋,百分点科技大数据架构师,专注于分布式系统架构;主要工作是负责公司底层基础平台的建设和spark技术的推广。
马海平,科大讯飞大数据高级研究员,专注于用机器学习做大数据商业变现;主要工作是数据挖掘算法研究和spam实现。