基于词向量匹配的对话系统 工程实践

这个台湾作者GitHub的代码和开发日志(如 https://zake7749.github.io/2016/08/28/word2vec-with-gensim/  )将聊天系统所需的知识储备以及整个系统框架都描述得特别清楚,他的思路核心是:将用户输入的句子断成若干个词,通过词向量匹配预先设定的主题词,模板以及对话等,在通过若干条设定的对话策略,得到最佳答复。
下载到的代码里其实有三个可以运行的主代码:
     985935-20171018174034115-701009836.png
 1. free chat的demo
    这个demo可算是我碰到的最黄的机器人了,因为语料取自台湾ptt.cc网站的八卦板块
    所以啊,一个优良的语料集是非常重要的,大家不要乱选语料集教坏小孩
        985935-20171018174034412-292072553.png
    思路:
          985935-20171018174034724-1638391024.png
 

 2. 基于规则匹配的demo
    这一demo的思路如下:
          985935-20171018174034990-242920731.png
        注:由于作者在整个系统中用的都是繁体字,所以如果用户输入和词向量模型最好统一为繁体,才好实现结果
        作者设定的主题有闹钟(时间),娱乐,住宿,医药,购物,每个主题下有若干个子主题 :
               985935-20171018174035162-2038743390.png 985935-20171018174035302-1474933283.png
          结果:
             985935-20171018174035599-82643653.png       985935-20171018174035802-184856855.png
    3. 规则+free chat
        这个相当于free chat和规则组合合成的chatbot
        1)首先用户输入,到free chat 的模块,若返回的结果分数高于阈值,则直接回答该结果,否则,到到(2)
        2)规则匹配,匹配上了,则转到task model
        3)task model有以下,每个包含一个py文件,内设置该task下的回复规则,如若是住宿,则会到网上酒店的各种信息
                    985935-20171018174036006-973105104.png
                 985935-20171018174036162-1499375202.png
 

 

 

 
 

 





转载于:https://www.cnblogs.com/combfish/p/7687926.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值