题名:图像理解理论与方法
作者:高隽, 谢昭著
出版年:2009
ISBN: 978-7-03-025757-4
分类号: TP391.4
中图分类: 模式识别与装置
定价: 68.00元
页数: 542 页

“图像理解”是近年来计算机科学的热点研究领域,本书对图像理解的前沿理论与方法进行了详细论述。主要内容包括分类判别模型、生成模型、图像信息表示与特征提取、场景中的目标识别、场景中目标之间的关系、场景描述与理解、场景中的句法语义、图像理解开发环境和图像数据集等。本书紧跟上述内容的国内外发展现状和最新成果,阐述作者对图像理解理论方法的理解和认识。<br />本书可以作为计算机科学与技术、信息与通信工程、电子科学与技术等专业的研究生、高年级本科生教材,同时可作为从事图像理解、计算机视觉、机器学习等相关专业研究人员的参考书。<br />序言<br />图像理解是近年来的热点研究领域,它是一门覆盖范围很广的综合性交叉学科,涉及图像工程、计算机视觉、人工智能和认知学等诸多学科领域,在目标识别及解释和图像与视频检索等方面有着广阔的应用前景。<br />《图像理解理论与方法》的总体编写思路:给出图像理解的定义及框架,并将其与图像工程、人工智能的相关方法有机结合起来,逐步阐述图像理解的理论方法;以图像理解的研究内容为导向,详细介绍图像理解的方法,以及图像理解系统必不可少的开发环境和图像数据机。基于这一编写思路,《图像理解理论与方法》介绍了数据/知识驱动方式不同的判别模型和生成模型,以此作为整个图像理解任务的理论基础;接着从图像理解的研究内容入手,分别详述了场景中目标识别、场景中目标之间的关系、场景描述与理解和图像句法语义四个子任务,并介绍了相应的学习算法,给出了经典、实用的应用实例。具体内容分布如下:<br />第1章给出了图像理解的定义以及结构框架,介绍了图像理解的研究内容,阐述了图像理解与图像工程、计算机视觉、人工智能和认知学的联系与区别及其应用;第2章介绍无结构特征组织方式的分类判别模型,有Boosting、支持向量机以及协同神经网络;第3章介绍半结构化的生成模型,主要有无向图模型中的随机场模型和星群模型,以及有向图模型中的认知图模型、pLSA模型和LDA模型;第4章从图像的处理技术人手,介绍了图像特征表示、提取和评价三个方面内容,并给出部分应用实例加以分析,重点介绍了特征不变性描述子SIFT;第5章介绍场景中的目标识别,主要分为图像分割、目标识别以及广义目标识别三个方面,介绍了以第2、3章为理论基础的各种方法,给出仿真应用实例或经典实例;第6章介绍场景中目标之间的关系,首先简单介绍表达场景中目标之间关系的有力载体(与或图和解析图),然后介绍关联描述的视觉三层(低层、中层和高层)词汇,接着详细介绍目标之间的各种关联和结构,最后给出体现目标之间关系的经典应用实例;第7章介绍场景的描述与理解,首先介绍图像理解中场景分类的相关概念和特点;然后给出场景分类的方法(低层场景建模和高层语义建模),最后重点介绍了基于视皮层组织的场景Gist特征的场景全局感知分类,以及基于混合高斯模型的场景分类,并在高斯概率模型进行场景分类研究的基础上对场景分类的约束机制进行初步探讨;第8章介绍场景中的句法语义,首先简单介绍了句法语言,然后重点介绍了上下文有关随机句法的学习和推理过程,最后给出基于统计句法策略的实现新型语义关系的构建。