大数据 : 互联网大规模数据挖掘与分布式处理 | 中图分类号查询 | 中国图书馆分类法 | 中图法

题名:大数据 : 互联网大规模数据挖掘与分布式处理
作者:(美) Anand Rajaraman, Jeffrey David Ullman著
出版年:2012
ISBN: 978-7-115-29131-8
分类号: TP274
中图分类: 数据处理、数据处理系统
译者: 王斌
定价: 59.00元
页数: 258 页
出版社: 人民邮电出版社
装订: 平装

大数据 : 互联网大规模数据挖掘与分布式处理 — (美) Anand Rajaraman, Jeffrey David Ullman著

序号	相关图书	著者	出版年
1	设计模式之禅	秦小波著	2014
2	Hadoop Hacks : 中文版	中野猛 ... [等] 著	2014
3	Hadoop技术内幕 . [1], 深入解析MapRedu	董西成著	2013
4	Spring技术内幕 : 深入解析Spring架构与设计	计文柯著	2012
5	算法与数据结构 : Java语言描述	陈媛 ... [等] 编著	2012
6	MySQL 5.5从零开始学	刘增杰, 张少军编著	2012
7	Hadoop云计算实战	周品主编	2012
8	高质量程序设计指南 : C++/C语言	林锐, 韩永泉编著	2012
9	最优化方法	陈军斌, 杨悦编著	2011
10	交通世界 [期刊]	交通部科学技术信息研究所主办	N/A
11	公路交通科技 [期刊]	交通部公路科学研究所	N/A
12	Java程序设计教程	(美) Stuart Reges, Marty Stepp著	2015
13	编程导论	(美) John V. Guttag著	2015
14	Python高手之路	(法) Julien Danjou著	2015
15	妙哉！Excel数据分析与处理就该这么学	杨阳, 孙蕊编著	2015
16	架构大数据 : 大数据技术及算法解析	赵勇编著	2015
17	社交网站的数据挖掘与分析	Matthew A. Russell著	2015
18	Linux Shell编程从入门到精通	张昊, 程国钢编著	2015
19	Git版本控制管理	(美)Jon Loeliger, Matthew McCul	2015
20	大数据 : 互联网大规模数据挖掘与分布式处理	(美) Jure Leskovec, Anand Rajar	2015

本书源自作者在斯坦福大学教授多年的“Web挖掘”课程材料，主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法，介绍了目前Web应用的许多重要话题。主要内容包括： □ 分布式文件系统以及Map-Reduce工具； □ 相似性搜索； □ 数据流处理以及针对易丢失数据等特殊情况的专用处理算法； □ 搜索引擎技术，如谷歌的PageRank； □ 频繁项集挖掘； □ 大规模高维数据集的聚类算法； □ Web应用中的关键问题：广告管理和推荐系统。 本书配套网http://infolab.stanford.edu/~ullman/mmds.html上提供英文版初稿以及一些课件和项目作业。

Anand Rajaraman　数据库和Web技术领域权威，创业投资基金Cambrian联合创始人，斯坦福大学计算机科学系助理教授。Rajaraman职业生涯非常成功：1996年创办Junglee公司，两年后该公司被亚马逊以2.5亿美元收购，Rajaraman被聘为亚马逊技术总监，推动亚马逊从一个零售商转型为零售平台；2000年与人合创Cambrian，孵化出几个后来被谷歌收购的公司；2005年创办Kosmix公司并任CEO，该公司2011年被沃尔玛集团收购。Rajaraman生于印度，在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。博客地址http://anand.typepad.com/datawocky/。
Jeffrey David Ullman　美国国家工程院院士，计算机科学家，斯坦福大学教授。Ullman早年在贝尔实验室工作，之后任教于普林斯顿大学，十年后加入斯坦福大学直至退休，一生的科研、著书和育人成果卓著。他是ACM会员，曾获SIGMOD贡献奖、Knuth奖等多项科研大奖；他是“龙书”《编译原理》、数据库领域权威指南《数据库系统实现》的合著者；麾下多名学生成为了数据库领域的专家，其中最有名的当属谷歌创始人Sergey Brin；本书第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
王斌　博士，中国科学院计算技术研究所博士生导师。中国科学院信息工程研究所客座研究员。主要研究方向为信息检索、自然语言处理和数据挖掘。《信息检索导论》译者。主持国家973、863、国家自然科学基金、国际合作基金、国家支撑计划等课题20余项，发表学术论文120余篇。现为ACM会员、中国中文信息学会理事、中文信息学会信息检索专委会委员、《中文信息学报》编委、中国计算机学会高级会员及计算机学会中文信息处理专委会委员。自2006年起在中国科学院研究生院（现改名“中国科学院大学”）讲授《现代信息检索》研究生课程，选课人数累计近千人。2001年开始指导研究生，迄今培养博士、硕士研究生30余名。