题名:Storm实时数据处理
作者:(澳)Quinton Anderson著
出版年:2014
ISBN: 978-7-111-46663-5
分类号: TP274
中图分类: 数据处理、数据处理系统
译者: 卢誉声
定价: 49.00
页数: 191 页
出版社: 机械工业出版社
装订: 平装

【编辑推荐】<br />从多个角度全面讲解Storm实时数据处理技术和最佳实践,为快速掌握并灵活应用Storm提供实用指南;<br />从实际问题出发,系统介绍Storm的基本应用、多语言特性、完整业务系统实现和产品交付的最佳实践方法;从产品持续交付角度,分析并实践集成、测试和交付的所有步骤。<br />【内容简介】<br />在大数据领域,Hadoop无疑是最炙手可热的技术。作为分布式系统架构,Hadoop具有高可靠性、高扩展性、高效性、高容错性和低成本的优点。然而随着数据体积越来越大,实时处理能力成为了许多机构需要面对的首要挑战。Hadoop是一个批处理系统,在实时计算处理方面显得十分乏力。Storm是一个类似于Hadoop的实时数据处理框架,也是一个非常有效的开源实时计算工具,通常被比作“实时的Hadoop”。<br />本书通过丰富的实例,系统讲解Storm的基础知识和实时数据处理的最佳实践方法,内容涵盖Storm本地开发环境搭建、日志流数据处理、Trident、分布式远程过程调用、Topology在不同编程语言中的实现方法、Storm与Hadoop的集成方法、实时机器学习、持续交付和如何在AWS上部署Storm。此外,本书旨在围绕Storm技术促进DevOps实践,使读者能够开发Storm解决方案,同时可靠地交付有价值的产品。<br />本书适合想学习实时处理技术或者想通过Storm实现实时处理方法的开发者阅读。<br />本书涵盖搭建基于Storm的开发环境和测试实时系统的许多实用方法与实战用例,以及如何应用交付最佳实践来将系统部署至云端。<br />通过阅读本书,你将学到如何构建包含统计面板和可视化的实时日志处理系统。通过集成Storm、Cassandra、Cascading和Hadoop,你将了解如何构建一个用于文字挖掘的完整实时大数据解决方案。你还会了解到如何在Storm集群中利用不同编程语言实现特定的功能,并最终将所有解决方案交付至云端。本书中的每一个步骤都应用了成熟的开发和操作实践,确保你能够可靠地交付产品。<br />通过阅读本书,你将能够:<br />搭建你的开发环境并测试Strom集群<br />处理数据流,包括基于规则的处理流程<br />构建分布式远程过程调用<br />交付基于多语言实现的Storm Topology,包括Java、Clojure、Ruby和C++<br />将Storm与Cassandra、Hadoop集成<br />使用Cascading实现基于批处理的单词重要度算法<br />创建并部署预测评分模型和分类模型<br />掌握持续集成和将Storm部署至云端的方法。

Quinton Anderson 软件工程师,专注实时计算系统开发。他在构建防御系统的实时通信系统,以及财务与银行服务中的企业级应用程序方面有丰富的经验。他热衷于开源,是Storm社区的活跃分子,乐于交付各种基于Storm的解决方案。
【译者简介】
卢誉声 资深软件开发工程师,现就职于思科系统(中国)研发中心云产品研发部。他曾参与多个项目协议级别定义、SDK及服务器后端和前端的设计与研发,在下一代实时云计算协作平台的研发过程中积累了丰富的敏捷实践与开发经验。此外,他还从事C/C++开发工作,对Clojure、JavaScript、Lua,以及移动开发平台等也有一定研究。