-
收藏
-
加书架
-
引用
本书以数据标注核心技术为基础,以经典管理理论为依托,以数据标注工厂的管理方法为指导,以现实案例为示范,全面介绍了数据标注的基础知识,详细介绍了文本数据标注、图像数据标注、语音数据标注和视频数据标注的标注方法和实现细节,并重点介绍了以流水线管理理论为核心的数据标注企业管理方法,使从业者可以快速提升数据标注技术水平,最后通过示例说明如何将管理理念通过数据标注平台来实现数据标注团队的管理 。 全书共分为四个部分12章,第一部分包含第1~3章,主要介绍了数据标注的缘起和演变,介绍数据标注行业的发展趋势和行业标准,阐述了数据标注的基础知识和技术发展方向; 第二部分包含第4~7章,系统阐述了文本数据标注、图像数据标注、语音数据标注、视频数据标注,并以具体案例来进行阐述; 第三部分包含第8~11章,主要以流水线理论为基础,设计了数据标注工厂的架构,并根据数据标注创新中心的经验介绍了数据标注工厂的项目管理、客户管理、质量管理、案例管理等可执行的数据标注管理方法; 第四部分包含第12章,分享了数据标注平台,就平台的作用、架构、运行机制进行了详细的介绍。 本书适合作为高等院校计算机、软件工程、人工智能等相关应用型专业学生的教材,同时可供对数据标注有所了解和从事相关工作的标注人员、管理人员和研究人员参考。
随着人工智能技术的迅猛发展,作为占人工智能半壁江山的数据标注人员需求量陡增,目前专职数据标工程师的缺口将高达数百万人。同时随着行业巨头的进入,小作坊式的数据标团队将无法满足行业的需求。因此如何提高数据标注人员素质;如何组建和管理大规模的数据标注队伍;如何提高数据标注成果的质量和效率,将成为数据标注领域需要重点关注的问题。 本人一直以来都在从事着大数据的处理和分析相关技术的研究工作,近年来负责高校和企业的共同组建的AI大数据标注基地工作,该基地拥有数百名数据标注人员,并承接着百万级的数据标注项目,已经形成了成熟运行的数据标注工厂模式。 本书就是想把这种数据标注工厂模式日常运行中所使用的理论基础、管理方法和技术手段进行提炼总结,呈现在各位读者面前,以便于更多的行业从业者可以从中受到启发,让数据标注行业能够更加稳健的发展。
- 版权: 清华大学出版社
- 出版: 2022-12-01
- 更新: 2023-11-24
- 书号:9787302618256
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术交叉学科智能科学与技术