简介
本书全面系统地介绍了中文文本信息处理技术,由浅入深地讲述了中文文本理解的原理与应用。全书共5个部分: 预备知识、词法分析、语法分析、语义分析和应用与技术。预备知识部分介绍了本书所需的数学、语言学和形式语言与自动机方面的理论知识。词法分析、语法分析和语义分析是自然语言处理的基础。词法分析部分针对中文信息处理中特有的分词问题,介绍了若干分词算法以及分词歧义消除和未登录词识别算法。语法分析和语义分析两部分从语法(语义)的表示入手,介绍自然语言的结构化和形式化,给出语法分析和语义分析的常用算法,并针对该过程中的歧义问题给出可行的解决思路。应用与技术部分讲述中文信息处理的应用,尤其是在文本分类、信息检索、问答系统和自动文摘等领域的应用技术。本书涉及内容广泛,能满足不同层次读者群的需求,可以作为高等学校计算机、信息类高年级本科生的教材,也可作为自然语言处理方向研究生的教材,同时非常适合供自然语言处理应用领域的研究人员和技术人员参考。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2015-03-01
- 更新: 2023-06-07
- 书号:9787302389507
- 中图:TP391.12-43
- 学科:工学控制科学与工程工学计算机科学与技术