
达观智能推荐
文章平均质量分 90
DatagrandRS
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
AIGC用于智能写作的技术综述-达观数据
智能写作指使用自然语言处理技术来自动生成文本内容。这种技术通过分析给定语料库,学习文本的结构和语法,然后利用这些信息来生成新的文本。智能写作可以用来快速生成高质量的文本内容,并且可以用来完成诸如文章写作、报告生成和摘要提取等任务。图1为我们介绍了智能写作的基本概念,而令人意想不到的是,这一段介绍的作者竟是AI本身!这一段AI自动生成的“自我介绍”既富有逻辑条理,又阐述了正确的知识,这便是当下最火热的AIGC技术的威力!什么是AIGC?AIGC,即AI-ge原创 2022-12-28 20:00:00 · 2798 阅读 · 1 评论 -
文字语义纠错技术探索与实践-张健
文本语义纠错的使用场景非常广泛,基本上只要涉及到写作就有文本纠错的需求。书籍面市前就有独立的校对的环节来保障出版之后不出现明显的问题。在新闻中我们也时不时看到因为文字审核没到位造成大乌龙的情况,包括上市公司在公开文书上把“临时大会”写成为“临死大会”,政府文件把“报效国家”写成了“报销国家”。有关文本纠错的辅助工具能给文字工作人员带来较大的便利,对审核方面的风险也大幅降低。除了不同的写作场景,文本纠错还会用在其他一些智能处理系统中,具体的情况包括:音频通话记录经过自动语音识别(ASR)转写成文本之后,存在一原创 2022-12-28 14:36:21 · 813 阅读 · 0 评论 -
全国中文纠错大赛达观冠军方案分享:多模型结合的等长拼写纠错
中文拼写检查任务是中文自然语言处理中非常具有代表性和挑战性的任务,其本质是找出文本段落中的错别字。这项任务在各种领域,如公文,新闻、财报中都有很好的落地应用价值。而其任务的困难程度也赋予了它非常大的研究空间。达观数据在CCL2022汉语学习者文本纠错评测比赛的赛道一中文拼写检查(Chinese Spelling Check)任务中取得了全国冠军,赛道二中文语法纠错(Chinese Grammatical Error Diagnosis)任务中获得了亚军。本文基于赛道一中文拼写检查任务的内容,对比赛过程中采用原创 2022-12-28 14:34:22 · 532 阅读 · 0 评论 -
中文语法纠错全国大赛获奖分享:基于多轮机制的中文语法纠错
由该赛道的评测指标可知,本次比赛不仅考察模型的纠错能力,还考察模型正确区分句子对错的能力;在实验分析的过程中,我们发现模型对多字词的缺失和句子不同位置的错误的纠错能力不同,并且当前的数据集未能覆盖绝大多数的错误,因此存在OOV的问题。在推理阶段,为了在输出的标签空间中搜索出一条最优的解码路径,我们利用局部路径解码方法对局部的移动编辑操作确定一条和为0的相对路径,并通过自适应阈值的方法对不同编辑操作、不同的词性和词频确定不同的修改接受阈值,由此提高模型的纠正准确率并解决模型的过度纠正等问题。原创 2022-12-28 14:32:22 · 640 阅读 · 0 评论 -
海量文本中挖掘人物关联关系核心技术介绍-桂洪冠
本文将重点就人物关联关系挖掘及其关键技术进行分析。原创 2022-12-15 09:00:00 · 900 阅读 · 0 评论 -
多模态文档LayoutLM版面智能理解技术演进-纪传俊
LayoutLM经过从1.0到3.0版本的迭代,不断优化模型,可见多模态技术对于文档理解的可行性和未来巨大的潜力原创 2022-12-07 10:44:19 · 512 阅读 · 0 评论 -
达观数据联合同济大学发布新冠肺炎知识图谱数据集及智能问答系统
详细介绍了发表于期刊《Data Intelligence》的论文成果《COKG-QA: Multi-hop Question Answering over COVID-19 Knowledge Graphs》原创 2022-12-07 08:30:00 · 511 阅读 · 0 评论 -
RPA界面元素智能自适应定位与操控技术-金克
本文详细了RPA界面元素的应用技术及其优缺点原创 2022-12-01 08:30:00 · 743 阅读 · 0 评论 -
一文详解BERT模型实现NER命名实体抽取-王文广
在自然语言处理和知识图谱中,实体抽取、NER是一个基本任务,也是产业化应用NLP 和知识图谱的关键技术之一。原创 2022-11-24 10:00:34 · 1279 阅读 · 0 评论 -
知识图谱增强下的智能推荐系统与应用-于敬
基于知识图谱的推荐系统在推荐精准度和推荐结果可解释性方面具有诸多优势原创 2022-11-17 15:20:15 · 669 阅读 · 0 评论 -
知识图谱构建下的自动问答KBQA系统实战-文辉
目前工程落地实现问答的技术路线基本分为基于知识图谱的问答(KBQA)、基于阅读理解的问答(MRC)和常见问题问答(FAQ)三种模式。原创 2022-11-10 08:30:00 · 1101 阅读 · 0 评论 -
探索人机深度融合的高可用性人工智能应用
以人机协同的方式促进算力和模型的提高,才能真正实现“人工智能”。原创 2022-10-27 08:30:00 · 576 阅读 · 0 评论 -
OCR技术发展综述与达观数据的实践经验
将IDP、知识图谱和OCR进行融合,实践应用中发挥更大的价值。原创 2022-10-13 09:00:00 · 1150 阅读 · 0 评论 -
达观智能推荐|移动互联网下半场洞察,短视频如何突破重围?
伴随着网络资费的降低、传输质量的提高以及智能手机的普及,我们已经迈入了移动互联网的时代。在这个新时代潮流之中,“短视频”已经悄然占据了传播的主流。这种时长在5分钟之内的视频,成为了继文字、图片、传统视频之后又一种重要的传播载体。在短视频中,用户不仅是消费者,也可以成为创作者,极强的参与感与互动性,使得短视频迅速风靡。短视频的兴起短视频兴起于2011年,成立没多久的快手从制作GIF的应用工具...原创 2019-12-27 15:34:11 · 1935 阅读 · 0 评论