-
收藏
-
加书架
-
引用
简介
利用大规模语料库和计算机技术对中日同形词体系进行了系统的调查和研究, 得出具体的中日同形词词汇表,使得中日同形词的全貌得以呈现。同时提出了利用意义用法距离的概念衡量同形词中日之间的意义用法差别,给出了同形词中日间意义用法距离的具体算法,并且利用大规模平行语料库证明了这种方法的有效性。对于中日同形词的理论研究、实际情况考察,以及我国的日语教学、对日汉语教学具有积极的指导意义。本书主要对中日同形词的五方面的课题开展了研究:一、关于中日同形词概念的理论探索;二、基于大规模语料库的中日同形词调查和抽取;三、中日同形词自动抽取技术的研发;四、同形词中日之间意义用法距离的计量研究;五、中日同形词意义用法差别的结构化描述方法研究。作为本研究的重要结果,我们在本研究成果中公布了《中日两国现代语言生活中的同形词汇表》。
编辑推荐
日本是中国以外大量使用汉字的国家,现代日语中使用着丰富的汉字词汇。汉语和日语哪些汉字词汇是通用的,即有多少同形词?使用情况如何?这不仅是语言学界长期关注的学术问题,也是中日两国人民普通关心的社会问题。本书引入大数据的理念和自然语言处理技术,以中日两国的主流报纸近10年的数据为对象,开展了中日同形词的大规模调查,所处理的数据规模超过了3.5亿字。共收集中日同形词16000多条,调查整理了中日两国现代语言生活中正在使用的同形词的条目、数量以及使用频度。同时,利用中日对译语料库的统计学方法计算出常用同形词中日之间意义用法的差距。
更多出版物信息
- 版权: 北京大学出版社
- 出版: 2019-10-01
- 更新: 2023-03-22
- 书号:9787301307403
- 中图:H363;H13
- 学科:文学中国语言文学文学外国语言文学