文本作者身份识别--基于机器学习与计算语言学

作者: 祁瑞华

出版社: 清华大学出版社

出版日期: 2017-02-01

电子书 ¥31.85 定价:49.0 纸书价格¥45.70,点此比价
  • 收藏

  • 加书架

  • 引用

简介

文本作者身份识别广泛应用于文学作品、新闻稿、商品评论、垃圾邮件的作者身份鉴定以及法庭取证等领域。随着大数据时代网络文本的大量涌现,匿名文本的作者身份识别在网络取证、不良舆情监控等任务中的应用成为国内外学者关注的热点。本书探讨了文本作者身份识别的关键问题、基本方法和最新研究进展,并应用于实践得以验证。全书共7章,分为3部分:第1部分包括第1~2章,介绍文本作者身份识别的基本概念、研究内容、建模基本方法和主要应用领域;第2部分包括第3~4章,介绍现有的作者身份文体特征、作者身份识别算法、性能评价指标、主要实验平台等;第3部分包括第5~7章,介绍本书对作者身份识别研究的贡献和在中英文博客、微博语料上的实验验证。本书主要面向文本挖掘领域的研究生和相关专业的研究人员,既可以作为文本分析与处理研究的教科书,也可以作为政府相关部门产品研发人员的参考书。

编辑推荐

1.与传统文学作品的作者身份识别相比,网络文本的作者身份识别问题有着新的技术特征。网络文本以数字和符号化的形式流动,更具隐秘性,传统条件下的作者身份识别技术受到前所未有的挑战。如何使作者身份识别技术与在线信息中隐含的细微文体风格特征相匹配,从而为网上热点舆情和不良信息的监控与追踪提供分析依据,是当前理论和应用研究的前沿和热点。 2.本书结合互联网应用环境的特点,以程序化、数字化和精密化的方式,通过从词汇、语法、结构和语义多个层面分析在线信息的作者归属,为网上不良信息监控提供分析依据,为追踪不良信息源头提供有效技术手段和基础数据,也可以在司法领域为诽谤、契约纠纷等民事案件及造谣、散布危害公共安全信息等刑事案件的证据收集和判定提供技术支持。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2017-02-01
  • 作者:祁瑞华
  • 更新: 2023-06-07
  • 书号:9787302455769
  • 中图:TP274
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术

作者信息

祁瑞华

相关图书