
NLP/对话系统
文章平均质量分 52
NLP应用/问答系统
u013250861
这个作者很懒,什么都没留下…
展开
-
多轮对话-2020:DialoGPT【生成式多轮对话模型】
此外,考虑到BERT和GPT都是用了绝对位置编码,可处理的文本长度存在一个上限,而对话轮数理论上是无限的,所以这里我们采用了相对位置编码的NEZHA作为基本结构,并使用NEZHA的预训练权重作为模型的初始化权重。从训练上来看,CDial-GPT使用pytorch实现的模型,基本结构是GPT Base,使用了4张2080Ti,总batch_size为32,累积梯度64步,论文说训练了30个epoch,总步数约2100万步(笔者的两倍),因此大概相当于batch_size为2048训练了33万步。原创 2023-05-04 11:27:39 · 825 阅读 · 0 评论 -
基于FAQ的智能问答(二): 召回篇
基于FAQ的智能问答本质是一个信息检索的问题,所以可以简单划分成:召回+精排 两个步骤。召回的目标是从知识库中快速的召回一小批与query相关的候选集。所以召回模型的评价方法,主要侧重于和两个方面。本文将分享我们召回模型的逐步迭代过程,从最基础的“ES字面召回”到 “ES字面召回和向量召回”的双路召回模式。原创 2023-03-09 21:01:48 · 317 阅读 · 0 评论 -
基于FAQ的智能问答(一): Elasticsearch的调教
如果引入了IK分词器,会自动引入一个中文的词典:elasticsearch-analysis-ik/config/main.dic但是,这个词表还是有局限的。针对例子: "美甲上门服务", 以下是ik的分词结果美甲上门服务 的IK分词结果可以看到切出了一个很奇怪的词语: "甲上", 而最新的词的"美甲"是没有被正确切分的。所以检索“美甲”检索到的结果会很靠后,只有“美” 命中。同时“美甲”不能高亮显示。经查证:“甲上”确实是IK中自带的一个词IK的词典。原创 2023-03-09 21:00:19 · 365 阅读 · 0 评论 -
Rasa 3.x学习体系
以Rasa 3.x提出的全新一代Graph Computational Backend为核心,从Rasa版本迭代中的Milestones出发来完全解密“One Graph to Rule Them All”背后的技术衍化过程及根本原因,然后以GraphComponent为核心解密其架构内幕机制和运行流程,并抽丝剥茧的剖析自定义Rasa Open Source平台的接口实现、组件源码、组件注册及使用的每一个步骤,最后用一个完整的案例来做示例,并透过Rasa的核心TED Policy近2130行源码剖析及DIE原创 2022-07-08 11:23:30 · 787 阅读 · 0 评论 -
聊天机器人:DeepMind的sparrow
据DeepMind称,与早期的神经网络相比,Sparrow可以更频繁地对用户的问题给出合理的答案。此外,这款聊天机器人还包括一些功能,可以显著降低偏见和有毒答案的风险。DeepMind希望它用于构建Sparrow的方法将促进更安全的人工智能系统的开发。Alphabet旗下的DeepMind推出了人工智能驱动的聊天机器人Sparrow,被称为该行业努力开发更安全的机器学习系统的里程碑。原创 2022-12-09 11:26:00 · 363 阅读 · 0 评论 -
基于GPT-2的端到端任务型对话系统
任务型人机对话系统旨在帮助用户完成特定领域中的特定任务,例如:餐馆预订、天气查询和航班预订等,具有很高的应用价值。然而,一些问题阻碍了任务型对话系统在实际应用中进行部署:一方面,任务型对话数据的收集和标注费时费力,且不同领域之间难以迁移;另一方面,虽然开放域的无标注对话数据易于获取、数据量大,利用这些数据可以训练的基于 sequence-to-sequence 结构的端到端对话系统,但采用开放域数据训练的端到端对话系统没有任务相关的信息,容易产生不可靠和无意义的回复。研究表明,在对话数据上微调后的 GPT原创 2022-06-19 17:16:59 · 709 阅读 · 0 评论 -
全球对话技术顶赛DSTC10
在上一届 DSTC 比赛中,百度 PLATO-2 模型夺得多个任务冠军;本次比赛,百度结合了最新发布的全球首个百亿参数对话生成模型 PLATO-XL,在赛题难度加大的情况下,凭借强大的技术实力再次拿下多个冠军。加入错误干扰数据 知识型任务口语赛道难度空前任务型对话基于知识为用户提供口语化的信息查询、指令执行等智能服务。今年 DSTC 的知识型任务口语对话赛道由对话状态追踪和知识对话两项核心子任务构成,这两项任务是判断对话系统能否在多轮对话中准确理解用户意图、正确传递信息的关键。为了更接近真实场景,该赛道首次原创 2022-06-19 16:33:06 · 312 阅读 · 0 评论 -
对话系统:概述
其实对话系统很好理解,对话系统就是人机对话的一个接口,人和他对话,他能给出一定的反馈,甚至完成一定的任务。举个例子,比较常见的就是淘宝的客服,问一些问题,某些有机器人后台的就会给出一些初步的回复,虽然有些沙雕,但是总能够完成部分简单常见的问题,能一定程度满足用户需求,从而降低了人工的成本。举个例子:这种很常见的简单问题,是可以通过客服系统直接回复的,简单方便。答案很多,回复也很多样,如何给出合适回复,这就是对话系统需要解决的核心问题。而使用场景上,其实远没有大家想的那么冷门,可能大家身处互联网行业,或者是每原创 2022-06-19 14:47:06 · 1817 阅读 · 0 评论 -
对话系统-“任务型”多轮对话:任务型多轮对话数据集和采集方法
研究任务型对话系统,首先得从数据集采集说起,学术界需要公开的数据集来证明模型的效果,工业界更需要以数据集为基础来构建更鲁棒的对话系统,那么业界成熟的对话系统数据集有哪些呢,对于多轮,如何更科学的采集数据减少错误呢,本文调研了一些近来一些方案供参考。参考资料:【多轮对话】任务型多轮对话数据集和采集方法...原创 2022-06-19 09:28:50 · 572 阅读 · 0 评论 -
对话系统:意图识别模块【基于规则和关键词的方法(可读性强,但难易扩展,不利于在其他领域迁移使用)、基于分类模型(可扩展能力强)】【随意图领域的增加,要保证识别的准确率不下降】
一、概述意图识别是通过分类的办法将句子或者我们常说的query分到相应的意图种类。举一个简单的例子,我想听周杰伦的歌,这个query的意图便是属于音乐意图,我想听郭德纲的相声便是属于电台意图。做好了意图识别以后对于很多nlp的应用都有很重要的提升,比如在搜索引擎领域使用意图识别来获取与用户输入的query最相关的信息。举个例子,用户在查询"生化危机"时,我们知道"生化危机"既有游戏还有电影,歌曲等等,如果我们通过意图识别发现该用户是想玩"生化危机"的游戏时,那我们直接将游戏的查询结果返回给用户,就会节省用原创 2022-03-07 21:46:13 · 9051 阅读 · 1 评论 -
对话系统概述:问答型(直接根据用户的问题给出精准的答案,更接近一个信息检索的过程;单轮;上下文无关)、任务型(多轮对话、针对特定场景)、闲聊型(不解决问题;自然交互;多轮对话)、图谱型(基于图谱推理)
参考资料:了解人机对话—聊天、问答、多轮对话和推荐幽澜资讯:如何区分智能机器人对话系统的单轮和多轮对话?原创 2022-01-28 12:19:45 · 1501 阅读 · 0 评论 -
对话系统-“问答型”单轮对话:FAQ检索式对话系统【步骤:①用户意图判断、②文本检索召回、③文本匹配计算排序】【搜索引擎的最终形态】
一、基本概念文本匹配:计算文本之间的相似度,主要分为两大类:1)基于句子向量表示的相似度模型(适合初始召回);2)基于词级别匹配的相似度模型(适合对召回结果重排)问答系统:信息检索的一种高级形式,能够更加准确地理解用户用自然语言提出的问题,并通过检索语料库、知识图谱或问答知识库返回简洁、准确的匹配答案。相较于搜索引擎,问答系统能更好地理解用户提问的真实意图, 进一步能更有效地满足用户的信息需求。问答系统处理的对象主要是用户的问题和答案,根据问题所属的知识领域,问答系统可分为面向限定域、面向开放域和面原创 2022-02-23 13:19:48 · 2314 阅读 · 0 评论 -
任务型对话系统:概述【NLU(自然语言理解:意图识别、槽位填充)】、【DM(对话管理):DST(对话状态追踪)、DP(对话策略)】、NLG(自然语言生成 )】
早期任务型对话系统基于规则实现,实现比较简单并在简单的对话任务中取得了不错的效果,但难以适用于复杂的对话任务,规则的撰写和维护需要消耗大量的人力和物力。后来得益于SVM、概率图模型和强化学习的发展,研究人员开始利用统计模型设计任务型对话系统,并提出部分可观测的马尔科夫决策过程设计框架,可以从对话数据中自动学习对话知识,一定程度上摆脱了对规则的依赖。随着深度学习的发展,end2end模型被应用在了任务型对话系统设计中[1-5]。基于深度学习的任务型对话系统有两种路线:一种是基于Pipline,整个系统仍采原创 2022-03-03 02:50:25 · 2932 阅读 · 0 评论 -
对话系统-“任务型”多轮对话(一):自然语言理解(NLU)【意图识别+槽位填充】【加强NLU理解能力的方法:①联合训练;②引入知识图谱】
智能对话系统:自然语言理解【意图识别+槽位填充】一、意图识别/Intent Classification(分类问题)二、槽位填充/Slot Extraction(序列标注:命名实体识别)二、意图识别 & 槽位填充 联合建模训练(Joint Slot-Intent Extraction)两个任务、两个Loss,将2个Loss加起来联合训练联合训练的优化:加入Attention交互:https://www.aclweb.org/anthology/N18-2118.pdf利原创 2022-02-27 23:30:28 · 2834 阅读 · 0 评论 -
对话系统-“任务型”多轮对话(二):对话状态追踪(DST)【基于规则;基于模型】【输入:当前意图和槽值对+历史槽值对;输出:State(槽值对集合)或State Vector 】【为DP做数据准备】
在任务型的对话系统中,对话状态跟踪(DST)的目标是从对话历史中监控对话的状态。DST中的State用一组Slot-Value键值对表示;一、基于规则的DST二、基于模型的DSTAt a high level, given a dialog context and a candidate slot- value pair, our model outputs a score indicating the relevance of the candidate.In other words, t原创 2022-03-04 23:15:00 · 1200 阅读 · 0 评论 -
对话系统-“任务型”多轮对话(三):对话策略(DP/Dialogue Policy)【根据前面的对话状态决策要采取的最优动作(如:提供结果,澄清需求..)】【基于规则(工业界用的多;可控);基于模型】
对话策略模块的主要功能是根据前面的对话状态决策采取的最优动作(如:提供结果,询问特定限制条件,澄清或确认需求等)从而最有效的辅助用户完成信息或服务获取的任务。该模块基于用户输入的语义表达和当前对话状态输出下一步的系统行为和更新的对话状态。举例text=“人民币对美元的汇率是多少”。“查询(槽位1=人民币,槽位2=美元)”这样的形式将作为对话管理模块的输入,这时候状态追踪模块就要根据前几轮的信息,结合该输入判断该轮的查询状态,确定查询的槽位,以及与数据库的交互。如得到想要查询的确实是人民币对美元的汇率信息原创 2022-03-05 18:37:10 · 1416 阅读 · 0 评论 -
对话系统-“任务型”多轮对话(四):自然语言生成(NLG)
自然语言生成(NLG)在很多NLP领域或任务都有涉及,比如摘要生成、VQA(视觉问答) 、翻译、写诗词、写作文、写新闻、NBA等赛事报道、对话系统等。不同任务下的NLG也不一样,今天我们简单来聊聊对话系统中的NLG。对话系统按功能来划分的话,分为闲聊型、任务型、知识问答型和推荐型。在不同类型的聊天系统中,NLG也不尽相同。任务型对话中的NLG就是在NLU(领域分类和意图识别、槽填充)、DST、DP的基础上,根据学习到的策略来生成对话回复,一般回复包括澄清需求、引导用户、询问、确认、对话结束语等。原创 2022-03-05 19:32:44 · 1077 阅读 · 0 评论 -
智能对话系统评测标准
参考资料:对话系统评价指标NLP-对话评估指标智能对话系统评测标准原创 2022-01-27 23:44:56 · 787 阅读 · 0 评论 -
基于Watson(IBM)搭建自己的对话机器人【图形化拖拽式构建】
基于Watson的对话机器人官网:https://cloud.ibm.comhttps://developer.ibm.com原创 2022-03-03 23:15:00 · 370 阅读 · 0 评论 -
智能机器人:微软小冰介绍
原创 2022-03-03 02:11:06 · 1082 阅读 · 0 评论 -
百度开源 FAQ 问答系统—AnyQ【使用语义匹配技术 SimNet】
近年来,随着人工智能技术的发展,人机对话技术得到越来越多的关注,人机对话产品也不断涌现。其中,智能客服作为人机对话的一个典型场景表现出极大的商业潜力和很强的研究价值,各企业也争先恐后的推出自己的智能客服产品。FAQ 问答技术作为智能客服系统最核心技术之一,在智能客服系统中发挥重要作用。通过该技术,可实现在知识库中快速找到与用户问题相匹配的问答,为用户提供满意的答案,从而极大提升客服人员效率,改善客服人员服务化水平,降低企业客服成本。百度在2018年 7 月的 AI 开发者大会上开源了首个工业级基于语义计原创 2022-03-03 00:57:31 · 813 阅读 · 0 评论 -
开源对话机器人框架:Rasa概述【中小型公司使用Rasa框架,降低准入门槛。灵活性不够高】【可以本地部署】【保护数据隐私(其他框架需要将自己的数据上传到框架官方云服务器,不安全)】【可以重写一些类】
一、Rasa安装与使用1、安装pip3 install rasa-x --extra-index-url https://pypi.rasa.com/simple2、创建项目rasa initrasa x二、Rasa组件1、Rasa核心2、Rasa组件一:RasaX(可视化组件)3、Rasa组件一:Rasa Action Server(提供http接口)参考资料:开源对话机器人框架rasa简介Rasa 聊天机器人框架使用RASA中文聊天机器人项目RASA文档RASA原创 2022-02-10 23:15:00 · 2252 阅读 · 0 评论