题名:统计自然语言处理
作者:宗成庆编著
出版年:2008
ISBN: 978-7-302-16598-9
分类号: TP391
中图分类: 信息处理(信息加工)
定价: 66.00元
页数: 475 页
出版社: 清华大学出版社

内容简介<br />本书全面介绍了统计自然语言处理的基本概念、理论方法和最新研究进展,内容包括形式语言与自动机及其在自然语言处理中的应用、语言模型、隐马尔可夫模型、语料库技术、汉语自动分词与词性标注、句法分析、词义消歧、统计机器翻译、语音翻译、文本分类、信息检索与问答系统、自动文摘和信息抽取、口语信息处理与人机对话系统等,既有对基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细阐述。<br />本书可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的教材或参考书,也可供从事自然语言处理、数据挖掘和人工智能等研究的相关人员参考。<br />-------<br />目录<br />第1章 绪论<br />1.1 基本概念<br />1.1.1 语言学与语音学<br />1.1.2 自然语言处理<br />1.1.3 关于“理解”的标准<br />1.2 自然语言处理研究的内容和面临的困难<br />1.2.1 自然语言处理研究的内容<br />1.2.2 自然语言处理涉及的几个层次<br />1.2.3 自然语言处理面临的困难<br />1.3 自然语言处理的基本方法及其发展<br />1.3.1 自然语言处理的基本方法<br />1.3.2 自然语言处理的发展<br />1.4 自然语言处理的研究现状<br />第2章 预备知识<br />2.1 概率论基本概念<br />2.1.1 概率<br />2.1.2 最大似然估计<br />2.1.3 条件概率<br />2.1.4 贝叶斯法则<br />2.1.5 随机变量<br />2.1.6 二项式分布<br />2.1.7 联合概率分布和条件概率分布<br />2.1.8 贝叶斯决策理论<br />2.1.9 期望和方差<br />2.2 信息论基本概念<br />2.2.1 熵<br />2.2.2 联合熵和条件熵192.2.3 互信息<br />2.2.4 相对熵<br />2.2.5 交叉熵<br />2.2.6 困惑度<br />2.2.7 噪声信道模型<br />2.3 支持向量机<br />2.3.1 线性分类<br />2.3.2 线性不可分<br />2.3.3 构造核函数<br />第3章 形式语言与自动机<br />第4章 语料库与词汇知识库<br />第5章 语言模型<br />第6章 隐马尔可夫模型<br />第7章 汉语自动分词与词性标注<br />第8章 句法分析<br />第9章 语义消歧<br />第10章 统计机器翻译<br />第11章 语音翻译<br />第12章 文本分类<br />第13章 信息检索与问答系统<br />第14章 自动文摘与信息抽取<br />第15章 口语信息处理与人机对话系统<br />附录 项目作业<br />名词术语索引<br />参考文献