题名:数据挖掘 : 概念、模型、方法和算法
作者:(美) Mehmed Kantardzic著
出版年:2013
ISBN: 978-7-302-30714-3
分类号: TP311.1
中图分类: 程序设计
译者: 王晓海, 吴志刚
定价: 59.00元
页数: 403 页
出版社: 清华大学出版社
装订: 平装

随着数据集规模和复杂度的持续上升,分析员必须利用更高级的软件工具来执行间接的、自动的智能化数据分析。《数据挖掘:概念、模型、方法和算法(第2版)》介绍了通过分析高维数据空间中的海量原始数据来提取用于决策的新信息的尖端技术和方法。<br />本书开篇阐述数据挖掘原理,此后在示例的引导下详细讲解起源于统计学、机器学习、神经网络、模糊逻辑和演化计算等学科的具有代表性的、最前沿的挖掘方法和算法。本书还着重描述如何恰当地选择方法和数据分析软件并合理地调整参数。每章末尾附有复习题。<br />本书主要用作计算机科学、计算机工程和计算机信息系统专业的研究生数据挖掘教材,高年级本科生或具备同等教育背景的读者也完全可以理解本书的所有主题。<br />◆ 介绍支持向量机(SVM)和Kohonen映射<br />◆ 讲解DBSCAN、BIRCH和分布式DBSCAN聚类算法<br />◆ 介绍贝叶斯网络,讨论图形中的Betweeness和Centrality参数测量算法<br />◆ 分析在建立决策树时使用的CART算法和基尼指数<br />◆ 介绍Bagging & Boosting集成学习方法,并详述AdaBoost算法<br />◆ 讨论Relief以及PageRank算法<br />◆ 讨论文本挖掘的潜在语义分析(LSA),并分析如何测定文本文档之间的语义相似性<br />◆ 讲解时态、空间、Web、文本、并行和分布式数据挖掘等新主题<br />◆ 更详细地讲解数据挖掘技术商业、隐私、安全和法律方面的内容

Mehmed Kantardzic博士是美国路易维尔大学工学院计算机工程与科学系的教授,任该系的研究生院院长和数据挖掘实验室主任。Mehmed是IEEE、ISCA和SPIE的成员,曾受邀参加多个重要的学术会议;他已出版多本书籍,在许多期刊上发表过论文,其中有多篇论文获奖。