
NLP
文章平均质量分 82
tiweeny
这个作者很懒,什么都没留下…
展开
-
Seq2Seq模型讲解
概述Seq2Seq是一个Encoder-Deocder结构的模型,输入是一个序列,输出也是一个序列。Encoder将一个可变长度的输入序列变为固定长度的向量,Decoder将这个固定长度的向量解码成可变长度的输出序列。使用x={x1,x2,...,xn}x={x1,x2,...,xn}x=\{x_1,x_2,...,x_n\}表示输入语句,y={y1,y2,...,yn}y={y1,y...原创 2018-08-08 17:36:08 · 23063 阅读 · 4 评论 -
阿里小蜜技术整理
概述阿里小蜜是电子商务领域的智能私人助理,基于阿里海量消费和商家数据,结合线上、线下的生活场景需求,以智能+人工的模式提供智能导购、服务、助理的拟人交互业务体验。在跨终端、多场景领域支持多轮交互、多模交互(文本、语音和图像)和问题推荐预测;支持多模型(文本模型、客户模型、语音识别和图像识别)识别客户意图;支持多领域识别和路由分流;阿里小蜜整体体系图如下:阿里小蜜平台结构...原创 2018-08-07 10:00:50 · 13124 阅读 · 1 评论 -
序列标注:BiLSTM-CRF模型
概述对于序列标注问题,目前BiLSTM-CRF模型是目前使用比较流行的方法。本文以Neural Architectures for Named Entity Recognition为例,讲解BiLSTM-CRF模型在命名实体识别任务上的应用,着重于CRF层的分析。数据描述假设数据集有两种实体类型:人物(Person)和机构(Organization)。同时假设采用BIO标注体系...原创 2018-08-06 01:39:58 · 24453 阅读 · 1 评论 -
任务型多轮对话系统概述
主要模块任务型机器人核心模块主要包括三个模块:自然语言理解模块(NLU)对话管理模块自然语言生成模块(NLG) 自然语言理解模块该模块一般包含以下三个模块:领域识别:即识别该语句是不是属于这个任务场景,一般有多个机器人集成时,如闲聊机器人,问答机器人等,领域识别应当在进入任务型机器人之前做判断与分发意图识别:即识别用户意图,细分该任务型场景下的子场景、语...原创 2018-08-06 01:25:15 · 15320 阅读 · 0 评论 -
概率图模型:HMM和CRF
概述结构化学习(Structured Learning)概率图模型属于结构化学习的一种,把F(x,y)F(x,y)F(x,y)换成了概率。结构化学习中有三个问题:概率图模型(Graphical Model)隐马尔科夫模型(Hidden Markov Model)简介【定义】HMM(Hidden Markov Model)是一个概率模...原创 2018-08-06 01:21:40 · 3426 阅读 · 1 评论 -
Match-LSTM和Pointer Net
Match-LSTM简介Match-LSTM是由(Wang & Jiang,2016)发表在NAACL的论文提出,用于解决NLI(Natural Language Inference,文本蕴含)问题。premise:前提,代表上下文hypothesis:假设,代表一个陈述性的结论 文本蕴含问题:给定一个premise(前提),根据这个premise去判断相应的hy...原创 2018-08-06 01:13:01 · 2466 阅读 · 2 评论 -
对话系统评价指标
概述对话系统的指标分为两大类:客观评价指标和主观评价指标其中客观评价指标分为词重叠评价指标和词向量评价指标。【词重叠评价指标】根据生成语句与参考答案语句之间的词重叠率来进行评价【词向量评价指标】通过了解每一个词的意思来判断回复的相关性,词向量是实现这种评价方法的基础。给每个词分配一个词向量所有词的词向量矩阵通过拼接成为表示一个句子的句向量,得到生成语句和参考答案语句...原创 2018-08-08 23:30:35 · 6848 阅读 · 0 评论