Spark快速数据处理 | 中图分类号查询 | 中国图书馆分类法 | 中图法

题名:Spark快速数据处理
作者:(美) Holden Karau著
出版年:2014
ISBN: 978-7-111-46311-5
分类号: TP274
中图分类: 数据处理、数据处理系统
译者: 余璜, 张磊
定价: 29.00
出版社: 机械工业出版社

Spark快速数据处理 — (美) Holden Karau著

序号	相关图书	著者	出版年
1	Hadoop应用开发技术详解	刘刚著	2014
2	Storm : 大数据流式计算及应用实践	丁维龙, 赵卓峰, 韩燕波编著	2015
3	数据结构与算法	赵玉兰 ... [等] 编著	2008
4	移动应用安全	(美) Himanshu Dwivedi, Chris Cl	2012
5	顾家北手把手教你雅思写作	顾家北编著	2012
6	剑桥雅思全真试题9原版解析	凉月 ... [等] 编著	2013
7	程序员的修炼 : 从优秀到卓越	(美) Jeff Atwood著	2014
8	移动机器人系统及其协调控制	程磊著	2014
9	世界经典英语演讲赏析	主编徐中川	2015
10	集体智慧编程	(美) Toby Segaran著	2015
11	剑桥雅思7官方答案全解析	启德学府海外考试研究中心编著	2010
12	多源信息融合	韩崇昭, 朱洪艳, 段战胜等著	2010
13	神经网络与机器人科研项目申请与实践	张雨浓, 李克讷主编	2012
14	雅思口语官方题库速背精选	刘薇编著	2013
15	程序员的数学	(日) 结城浩著	2012
16	基于增强学习和ART2神经网络的移动机器人路径规划研究	作者樊建	2009
17	信息物理融合系统导论	李必信, 周颖编著	2014
18	Spark MLlib机器学习 : 算法、源码及实战详解	黄美灵著	2016
19	移动机器人及室内环境三维模型重建技术	连晓峰著	2010
20	多移动机器人协同原理与技术	蔡自兴 ... [等] 著	2011

【编辑推荐】 从实用角度系统讲解Spark的数据处理工具及使用方法 手把手教你充分利用Spark提供的各种功能，快速编写高效分布式程序 【内容简介】 Spark是一个开源的通用并行分布式计算框架，由加州大学伯克利分校的AMP实验室开发，支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析，能够提升大数据处理的实时性和准确性，现已逐渐获得很多企业的支持，如阿里巴巴、百度、网易、英特尔等各大公司等。 本书系统讲解Spark的使用方法，包括如何在多种机器上安装Spark，如何配置一个Spark集群，如何在交互模式下运行第一个Spark作业，如何在Spark集群上构建一个生产级的脱机\独立作业，如何与Spark集群建立连接和使用SparkContext，如何创建和保存RDD（弹性分布式数据集），如何用Spark分布式处理数据，如何设置Shark，将Hive查询集成到你的Spark作业中来，如何测试Spark作业，以及如何提升Spark任务的性能。

【作者简介】
Holden Karau　资深软件开发工程师，现就职于Databricks公司，之前曾就职于谷歌、亚马逊、微软和Foursquare等著名公司。他对开源情有独钟，参与了许多开源项目，如Linux内核无线驱动、Android程序监控、搜索引擎等，对存储系统、推荐系统、搜索分类等都有深入研究。
【译者简介】
余璜　阿里巴巴核心系统研发工程师，OceanBase核心开发人员，对分布式系统理论和工程实践有深刻理解，专注于分布式系统设计、大规模数据处理，乐于分享，在CSDN上分享了大量技术文章。
张磊　Spark爱好者，曾参与分布式OLAP数据库系统核心开发，热衷于大数据处理、分布式计算。