
实战3:聊天机器人
CopperDong
纯属巧合
展开
-
机器学习保险行业问答开放数据集: 1. 语料介绍
原文目前机器学习,尤其是因为深度学习的一波小高潮,大家对使用深度学习处理文本任务,兴趣浓厚,数据是特征提取的天花板,特征提取是深度学习的天花板。在缺少语料的情况下,评价算法和研究都很难着手,在调研了众多语料之后,深知高质量的开放语料十分稀少,比如百度开放的Web QA 1.0 语料,包含的问题也就是四万余条,而分成不同的垂直领域,就根本不能用于FAQ模型的训练,这就是我做了这个语料转载 2017-11-16 11:04:11 · 3381 阅读 · 1 评论 -
ChatScript 3 Tutorial
https://github.com/bwilcox-1234/ChatScript/blob/master/WIKI/OVERVIEWS-AND-TUTORIALS/ChatScript-Tutorial.mdBuilding a simple but useful chatbot - one that can help a human plan a travel.$ mkdir RAW原创 2018-01-16 11:46:30 · 604 阅读 · 0 评论 -
ChatScript 4 Memorization
https://github.com/bwilcox-1234/ChatScript/blob/master/WIKI/ChatScript-Memorization.md4.1 User Memorization in Conversation This is easiest done by memorizing certain kinds of information and ha原创 2018-01-16 15:32:40 · 321 阅读 · 0 评论 -
如何打造一个Chatbot
聊天机器人概述聊天机器人的应用非常广泛,无人驾驶、智能音箱、问答系统、客服机器人、对话机器人、个性化推荐、搜索引擎等等产品都有所应用。 说起聊天机器人想必大家都已经很熟悉了,比如亚马逊的Alex,谷歌的谷歌助手,苹果的Siri,百度的度秘以及众多大厂小厂都投身于聊天机器人相关技术的研发。 聊天机器人的火热程度勿用多说,从各大厂商对聊天机器人的投入也可以看出聊天机器人在商业上的价值巨转载 2018-01-08 14:54:51 · 1865 阅读 · 0 评论 -
意图分类是怎么实现的
如何进行意图分析之前开始做语义理解的时候,笔者采用的是比较粗暴的方法进行匹配。随着语料的积累,语料库的规模变得越来越大,匹配的效率也随着越来越低,对语料进行意图分类的想法也就随着产生。当用户输入之后,系统首先对输入进行意图分类,然后对分类下的语料进行匹配,从而减轻计算量,提高系统的匹配效率。本文只是简单的阐述一下意图分析的典型思路和方法,并实现一个基本的意图分类器,而无意系转载 2018-01-08 14:57:21 · 6787 阅读 · 0 评论 -
AIML初探
1.简介AIML的全称是 Artificial Intelligence Modelling Language,是基于xml格式标签,用于开发的人工智能应用程序。 它的特点就是基于对话模板的匹配,因而需要大量的对话库。在实际的开发过程中需要考虑到全面的对话场景才能实现较好的对话体验。 AIML主要应用于专家系统或者领域内的问答系统,在这些领域内AIML具有相当的优势。缺点就是不易读转载 2018-01-08 14:58:23 · 1635 阅读 · 0 评论 -
人工智能标记语言AIML聊天机器人:产生、种类、应用、实例、AIML概述、知识库、公司、业界(20k字经典收藏版)
人工智能标记语言AIML聊天机器人:产生、种类、应用、实例、AIML概述、知识库、公司、业界(20k字经典收藏版)秦陇纪10译编聊天机器人(chatterbot)是一个用来模拟人类对话或聊天的程序,试图建立程序让真人认为在和另一个人聊天。在NLP/AIML技术加多样性语库支撑下,采用免费人工语言在线计算机实体ALICE人工智能标记语言(ALICE AIML)类知识库(knowl转载 2018-01-08 15:10:28 · 3850 阅读 · 0 评论 -
Be Your Own Botmaster. AliceBot
Pandorabots.comwww.alicebot.orgAIML语法原创 2018-01-08 15:17:48 · 392 阅读 · 0 评论 -
ChatScript 5 Advanced User Manual -- 1 Review
https://github.com/bwilcox-1234/ChatScript/blob/master/WIKI/ChatScript-Advanced-User-Manual.md5.1 Overview of how CS works CS is a scripting language for interactivity. Each time CS communicat原创 2018-01-17 11:39:26 · 309 阅读 · 0 评论 -
ChatScript 5 Advanced User Manual -- 2 advanced tokenization
5.2 advanced tokenization The CS natural language workflow consists of taking the user's input text, splitting it into tokens and stopping each time at a perceived sentence boundary. The原创 2018-01-17 15:36:54 · 522 阅读 · 0 评论 -
ChatScript 6 Writing a Chatbot
How to think about creating it.6.1 Uses of ChatScript ChatScript is a scripting language and engine for responding to meaning. It has been used to write chatbots which carry on an entertaini原创 2018-01-25 16:22:59 · 718 阅读 · 0 评论 -
ChatScript 5 Advanced User Manual -- 3 advanced patterns
5.5 advanced patterns Keyword Phrases : Just put them in quotes. E.g. cocept: ~remove ( "take away" remove )?: ( do you take away cheese ) Implied concept Sets : This allows the system t原创 2018-01-18 16:12:03 · 427 阅读 · 0 评论 -
对话语料库
用于训练中英文对话系统的语料库 Datasets for Training Chatbot System用于对话系统的中英文语料 本项目收集了一些从网络中找到的用于训练中文(英文)聊天机器人的对话语料公开语料搜集到的一些数据集如下,点击链接可以进入原始地址dgk_shooter_min.conv.zip 中文电影对白语料,噪音比较大,许多对白问答关系没有转载 2018-01-26 16:20:24 · 4031 阅读 · 0 评论 -
对话系统综述
在人工智能领域,模仿人类交谈能力的尝试可以追溯到人工智能的早期阶段。在1950年,艾伦·图灵(Alan Turing)提出了一种方法来测试一台机器的智能水平,这个机器被普遍称为图灵测试或模仿游戏。在图灵测试中,一台机器被要求与人交谈。机器的智能水平取决于机器如何能够欺骗人类评估者,使其相信机器是基于文本响应的人类。如果人类的评估者无法区分机器和人类的区别,那么就说机器已经通过了图灵测试,这意味着人...转载 2018-04-25 19:12:03 · 544 阅读 · 0 评论 -
从头实现一个深度学习的对话系统--1,论文简介
https://blog.youkuaiyun.com/liuchonge/article/details/78809555上篇文章我们介绍了DRL用于对话系统的应用,看完论文我们会发现,其是在一个Seq-to-Seq模型的基础上进行重新训练进而得到效果的提升,那么自然我们会想到如何使用Seq-to-Seq模型构造基础的对话系统呢,接下来我会使用几篇文章来一步步介绍使用Seq-to-Seq构造对话系统过程中所...转载 2018-05-27 16:15:53 · 361 阅读 · 0 评论 -
对话论文总结
这是NIPS2017的文章。【有开源代码,memory网络的代码,可以借鉴这篇文章】 对话系统主要分成两类:基于任务的对话系统,闲聊式的对话系统。End2end(+attention+memory)的方式,使得对话系统不需要规则,并且性能超过基于规则的方式。但是还没有文章就个性化的对话系统,展开工作。将个性化的信息+对话系统,用多任务的方式训练。 数据库:基于bAbI dialog datase...转载 2018-07-08 21:43:19 · 832 阅读 · 0 评论 -
ChatScript 2 : Basic User Manual
https://github.com/bwilcox-1234/ChatScript/blob/master/WIKI/ChatScript-Basic-User-Manual.mdOverview ChatScript is a system for manipulating natural language, not just for building a chatbot.原创 2018-01-15 16:42:57 · 502 阅读 · 0 评论 -
ChatScript 1 What is ChatScript?
https://github.com/bwilcox-1234/ChatScript/blob/master/WIKI/OVERVIEWS-AND-TUTORIALS/What-is-ChatScript.mdOverview NLP:AI的子领域,关注词,涉及范围从声音输入到谈话输出。 Video Game: ChatScript:如何将上面两个产业相结合?原创 2018-01-15 10:47:26 · 470 阅读 · 0 评论 -
ChatScript 5 Advanced User Manual -- 6 Esoterica and Fine Detail
5.12 Esoterica and Fine Detail Being first to converse : If you prefix your login name with *, you get to speak first and this continues any prior conversation you may have had. Prefix label原创 2018-01-22 15:44:52 · 349 阅读 · 0 评论 -
机器学习保险行业问答开放数据集: 2. 使用案例
原文在上一篇文章中,介绍了数据集的设计,该语料可以用于研究和学习,从规模和质量上,是目前中文问答语料中,保险行业垂直领域最优秀的语料,关于该语料制作过程可以通过语料主页了解,本篇的主要内容是使用该语料实现一个简单的问答模型,并且给出准确度和损失函数作为数据集的Baseline。DeepQA-1为了展示如何使用该语料训练模型和评测算法,我做了一个示例项目 - Deep转载 2017-11-16 11:08:42 · 669 阅读 · 0 评论 -
如何利用深度学习技术训练聊天机器人语言模型?
原文导语:模型能聊的内容也取决于选取的语料。如果已经具备了原始聊天数据,可以用SQL通过关键字查询一些对话,也就是从大库里选取出一个小库来训练。雷锋网按:本文作者王海良,呤呤英语开发总监,北京JavaScript/Node.js开发者社区的运营者,曾就职IBM创新中心。本文为系列文章第三篇,由雷锋网(公众号:雷锋网)独家首发。前两篇文章作者分别介绍了聊天机器人目前的发展状况及基转载 2017-11-16 11:21:46 · 1281 阅读 · 0 评论 -
QA问答系统中的深度学习技术实现
原文应用场景智能问答机器人火得不行,开始研究深度学习在NLP领域的应用已经有一段时间,最近在用深度学习模型直接进行QA系统的问答匹配。主流的还是CNN和LSTM,在网上没有找到特别合适的可用的代码,自己先写了一个CNN的(theano),效果还行,跟论文中的结论是吻合的。目前已经应用到了我们的产品上。原理参看《Applying Deep Learning转载 2017-11-16 11:35:34 · 6076 阅读 · 3 评论 -
聊天机器人(Chatbot)开发:自然语言处理(NLP)技术栈
我相信在大多数情况下,聊天机器人的开发者构建自己的自然语言解析器,而不是使用第三方云端API,是有意义的选择。 这样做有很好的战略性和技术性方面的依据,我将向你展示自己实现NLP有多么简单。 这篇文章包含3个部分:为什么要自己做最简单的实现也很有效你可以真正用起来的东西那么要实现一个典型的机器人,你需要什么样的NLP技术栈? 假设您正在构建一项服务来帮助人们找到餐馆。 你的用户可能转载 2017-12-15 09:14:30 · 1248 阅读 · 0 评论 -
聊天机器人(chatbot)终极指南:自然语言处理(NLP)和深度机器学习(Deep Machine Learning)
为了这份爱在过去的几个月中,我一直在收集自然语言处理(NLP)以及如何将NLP和深度学习(Deep Learning)应用到聊天机器人(Chatbots)方面的最好的资料。时不时地我会发现一个出色的资源,因此我很快就开始把这些资源编制成列表。 不久,我就发现自己开始与bot开发人员和bot社区的其他人共享这份清单以及一些非常有用的文章了。在这个过程中,我的名单变成了一个转载 2017-12-15 09:17:00 · 22654 阅读 · 7 评论 -
十个Chatbot框架介绍
Chatbot列表1. Artificial Intelligence Markup Language 网址:http://www.alicebot.org/ 机构/作者:Dr. Richard S. Wallace 流行程度:283,000 简介:这是一个自定义的AI语言,是XML语言的扩展,支持语言规约,开源了解析器,支持主流的所有编程转载 2017-12-07 19:54:27 · 1511 阅读 · 0 评论 -
从零开始写聊天机器人
目录目录简介搭建聊天机器人的嘴巴之对话功能websocket简介Tornado实现websocket服务端Tornado实现websocket客户端搭建聊天机器人的大脑之知识库与思考功能AIML文件简介PyAIML如何支持中文PyAIML解析如何支持中文PyAIML查找时如何支持中文通过自定义标签扩展AIML文件AIML如何扩展以支持转载 2017-12-07 20:39:04 · 779 阅读 · 0 评论 -
Chatbot 架构
Chatbot 的开发者越来越多了,一些创业公司都开始开发自己的聊天机器人产品,包括提供平台类的,提供API 的,提供分析工具的等等。很多的博客,杂志和视频都充满着工业界对聊天机器人的宠爱,开发者们也聚集在一起讨论如何开发,以及参加各种会议。我也开发过一段时间的聊天机器人,在这篇文章中,我将简单的介绍一些 chatbot 架构。有什么类型的机器人?聊转载 2017-12-07 22:04:58 · 1826 阅读 · 0 评论 -
用TensorFlow开发问答系统
一个问答系统是被设计用来回答用自然语言提出的问题的系统。一些问答系统从诸如文本和图片这样的“源”里获得信息来回答特定的问题。这些依赖“源”的系统可以基本被分为两类:开放话题的,它需要回答的可能是任何问题,不限于特定的领域;特定话题的,它回答的问题是有特定限制的,因为它们是与一些预先定义的“源”相关,比如有给定上下文或是特定领域(如医学等)。这篇博文会带领你完成一个使用TensorFlow来转载 2018-01-03 18:38:26 · 1349 阅读 · 0 评论 -
如何成为一名对话系统工程师
对话系统(对话机器人)本质上是通过机器学习和人工智能等技术让机器理解人的语言。它包含了诸多学科方法的融合使用,是人工智能领域的一个技术集中演练营。图1给出了对话系统开发中涉及到的主要技术。对话系统技能进阶之路图1给出的诸多对话系统相关技术,从哪些渠道可以了解到呢?下面逐步给出说明。图1 对话系统技能树数学矩阵计算主要研转载 2018-01-03 18:47:38 · 564 阅读 · 0 评论 -
ChatScript 5 Advanced User Manual -- 4 Advanced Output
5.4 Advanced output Committed Output : the output stream, a magical place thatqueues up each word you write in a rule output. So, output does two things. It queues up tokens to send to th原创 2018-01-22 10:47:43 · 376 阅读 · 0 评论 -
ChatScript 5 Advanced User Manual -- 5 Advanced Variables
5.6 Advanced Variables Local Variables : $xxx and $$xxx are all global in scope. $_xxx are local variables. Indirection Variables : Bot variables : Assigning match vari原创 2018-01-22 12:01:15 · 320 阅读 · 0 评论 -
两种开源聊天机器人的性能测试(一)——ChatterBot
因为最近在学习自然语言处理的相关知识,QQ小冰这个东西最近又很热,所以就试着玩了下两个开源聊天机器人,在这里分享一点小经验,希望对有共同兴趣的人能起到那么一点作用。 我主要测试了两个聊天机器人,一个是ChatterBot,另外一个是基于tensorflow的chatbot。我们首先看一下ChatterBot。 ChatterBot是Python自带的基于机器学习转载 2017-11-16 10:59:53 · 2484 阅读 · 0 评论 -
两种开源聊天机器人的性能测试(二)——基于tensorflow的chatbot
这次测试的操作系统依然是Ubuntu14.04(64位)。 开源项目链接:https://github.com/dennybritz/chatbot-retrieval/ 它实现一个检索式的机器人。采用检索式架构,有预定好的语料答复库。检索式模型的输入是上下文潜在的答复。模型输出对这些答复的打分,选择最高分的答案作为回复。 下面进入正题转载 2017-11-16 10:58:15 · 3610 阅读 · 2 评论 -
对话系统ChatScript入门(Linux版本)——制作简单的中文对话系统
ChatScript是最近在搜对话系统资料的时候搜到的,貌似现在用得人并不多,能搜到的使用经验很少,不像AIML那样被大家熟知。浅浅的了解了ChatScript(后面简称CS)之后,发现这个对话框架做得挺好的,于是决定用一用它。CS对话框架的底层程序是由c语言实现的,而对话内容、对话逻辑的控制则通过脚本来完成。这样的话,开发新的bot时,可以只编写对话脚本,而不需要改动底层的代码。转载 2018-01-14 12:14:32 · 811 阅读 · 1 评论 -
用Rasa NLU构建自己的中文NLU系统
代码在 https://github.com/crownpku/rasa_nlu_chi自然语言理解(NLU)系统是问答系统、聊天机器人等更高级应用的基石。基本的NLU工具,包括实体识别和意图识别两个任务。已有的NLU工具,大多是以服务的方式,通过调用远程http的restful API来对目标语句进行解析完成上述两个任务。这样的工具有Google的API.ai, Microsoft的Lu...转载 2018-01-03 18:31:45 · 14836 阅读 · 4 评论