文本校对技术:现状、算法与应用
1. 文本校对概述
随着文化产业在国民经济发展中的地位日益凸显,文本信息的数量也在急剧增加。2019 年,中国大规模文化及相关产业企业实现营业收入 8.6624 万亿元,较 2018 年可比增长 7%。然而,文化产业的蓬勃发展也带来了文本错误难以避免的问题,传统的人工校对方法已无法满足日益增长的校对工作量和效率要求。
- 传统出版领域 :近年来,出版行业业务量迅速增长且电子化程度提高,校对环节的工作量大幅增加,传统人工校对的错误率较高。例如 2013 年“出版质量保障年”,中国图书质量抽查活动检查了 2300 种图书,其中 90 种不合格,部分图书的校对错误率高达 0.0626%;2019 年,国家新闻出版署公布“质量管理 2019”专项工作质量检查结果,确定 35 种图书校对质量不合格,涉及 29 家图书出版单位。
- 自媒体领域 :以微信自媒体为例,截至 2016 年 12 月,新兴的微信公众号平台已有 1000 万个账号。自媒体市场规模的快速增长导致互联网上文本数量激增,对文本校对的需求也不断增加。同时,由于自媒体行业的特点,任何人都可以成为文本上传者,目前自媒体运营者的写作水平参差不齐,为了紧跟新闻热点,许多自媒体文章写作周期短,作者在发布稿件前简单检查甚至不检查,导致错字、漏字、用词不当等错误频繁出现。例如一些微信公众号文章中出现“年轻产妇剩(生)下双胞胎后”“在好奇心的趋势(驱使)下”等错误,自媒体领域的文本错误频率甚至高于传统出版行业。
- 文本输入方法 :除了键盘输入,目前使用人工智能技术实
超级会员免费看
订阅专栏 解锁全文
986

被折叠的 条评论
为什么被折叠?



