- 博客(36)
- 资源 (31)
- 问答 (1)
- 收藏
- 关注
原创 Causal Language Modeling和Conditional Generation有什么区别
在这种建模方法中,模型可以是一个encoder-decoder结构,如序列到序列(seq2seq)模型,也可以是基于自回归的方法,如T5模型。在这种建模方法中,模型试图预测给定上下文中的下一个单词,该上下文通常包括在当前单词之前的所有单词。在这种建模方法中,模型根据给定的输入(可能是文本、图片等)生成符合条件的输出。总之,因果语言建模主要关注于生成连贯、自然的文本,而条件生成关注于生成满足特定条件或任务要求的文本。因果语言建模的一个经典应用是GPT(如GPT-2和GPT-3),它主要用于生成连贯的文本。
2023-03-21 16:42:28
5456
原创 自然语言生成的评价方法
语言生成评价的角度语法:评价生成文本的通顺度,是否符合语法,是否存在用语错误、重复等。信息量:现代的语言生成模型很容易生成没有信息量的通用文本,因此,需要评价生成内容是否包含充分信息,通常包括信息量、多样性、信息特异度、独特性等。输入-输出的关系:包括相关性、忠实度(即生成内容的事实、关键信息必须与输入给定的一致)、连贯性等。自洽性:生成内容除与给定输入要一致、连贯外、其自身内部应该具有很好的自洽性,包括符合常识、逻辑、不包含语义冲突,具有较好的一致性。总体评价:从总体上评价生成内容的质
2021-11-24 18:14:19
2016
原创 Latex部分特殊符号记录
\infty∞点乘:a \cdot b叉乘:a \times b除以:a \div b属于: /in不属于:/notin小于等于号直接输入 \le,或,\leq大于等于号直接输入 \ge 或\geq分式: \frac{}{} 小于号用 \textless 大于号用 \textgreater加减号 \pm定义符号,等号上有箭头 \triangleq加amssymb宏包\quad表示 间距1m宽度\qquad 表示2m的宽度 ...
2021-06-26 21:23:35
4525
原创 UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa5‘ in position 46: illegal multibyte sequ
如果遇到类似”UnicodeEncodeError: 'gbk' codec can't encode character '\xa5' in position 46: illegal multibyte sequence“这样的问题,读取文件时已经用了encoding=“utf8”,还是报错,而且报错的位置含有print(),那可能是因为print()函数自身有限制,不能完全打印所有的unicode字符,所以只要规定一下print的打印的默认编码就行了:import ioimport sys.
2021-03-30 13:33:24
3294
1
原创 EmoElicitor: An Open Domain Response Generation Model with User Emotional Reaction Awareness论文翻译
EmoElicitor:一种具有用户情感反应感知的开放域回复生成模型摘要产生情感回复对于建立类似人类的对话系统至关重要。然而,现有的研究只关注于通过控制对话系统的情感来产生回复,而忽略了对话系统的最终关注点用户的感受。本文提出了一种新的变分模型EmoElicitor,用于产生能够激发用户特定情感的适当回复。我们将系统回复后的下一轮话语纳入后验网络以丰富上下文,并利用预先训练的语言模型将单个潜在变量分解为多个连续变量来指导生成回复。在真实世界的数据集上进行的大量实验表明,EmoElicitor不仅在多
2020-09-23 20:39:59
634
原创 导入basemap遇到SystemError: execution of module _geoslib raised unreported exception
参考链接:https://my.oschina.net/u/4410452/blog/3371861/print刚开始直接安装pip install basemap不行,后来直接手动下载扩展包,在https://www.lfd.uci.edu/~gohlke/pythonlibs/搜索basemap,选择适合自己的版本。再到下载的文件路径下直接安装pip install xxx.whl但是运行后还是报错,报了_geoslib相关的错误,搜索了错误后找到了参考链接的解决方法:pip instal.
2020-08-29 11:28:07
1473
2
原创 CDL: Curriculum Dual Learning for Emotion-Controllable Response Generation论文翻译
摘要情感可控的回复生成是一项兼具吸引力和价值性的任务,旨在使开放域的对话更具同理心和吸引力。现有的方法主要是通过在标准交叉熵损失中加入正则化项来增强情感表达,从而影响训练过程。然而,由于缺乏对内容一致性的进一步考虑,加剧了回复生成任务中常见的安全回复问题。此外,以往的模型还简单地忽略了有助于建模查询和回复之间关系的查询情感,从而进一步损害了一致性。为了缓解这些问题,我们提出了一种名为“课程式对偶学习”(CDL)的新框架,该框架将情感可控的回复生成扩展为对偶任务,以交替生成情感回复和情感查询。CDL利用聚
2020-08-11 21:52:11
1038
原创 Generating Responses with a Specific Emotion in Dialog论文翻译
摘要对话系统具有在对话期间表达特定情感的能力是值得期待得,这对系统的可用性和用户满意度的提高具有直接的、量化的影响。在仔细调查了现实生活中的对话数据后,我们发现用语言表达情感至少有两种方式。一种是通过使用强烈的情感词来显性地描述情感状态,另一种是通过以不同的方式含组合中性词来隐性地增加情感体验的强度。我们提出了一个情感对话系统(EmoDS),它可以为输入生成连贯且有有意义的回复,同时在一个统一的框架内显式或隐式地表达期望的情感。实验结果表明,EmoDS在BLEU、多样性和情感表达质量三个方面的表现均优于
2020-07-07 22:00:34
1359
2
原创 MOJITALK: Generating Emotional Responses at Scale论文阅读
摘要生成带有情感语言是构建具有共情能力的自然语言处理主体的关键一步。然而,这一研究路线面临的一个主要挑战是缺乏大规模的带标签的训练数据,之前的研究仅限于少量的人类标注情感标签。此外,明确控制生成文本的情感和情绪也是困难的。在这篇文章中,我们采取了一种更激进的方法:我们借用了Twitter数据的想法,这些数据自然地被贴上了表情符号的标签。我们收集了大量的Twitter对话语料库,其中包括回应...
2020-04-27 00:10:02
1195
原创 Emotional Chatting Machine: Emotional Conversation Generation with Internal and External Memory翻译+笔记
情感化聊天机:结合内外记忆的情感对话生成摘要情感的感知和表达是对话系统或会话代理成功的关键因素。然而,到目前为止,这一问题还没有在大规模对话生成中得到研究。本文中,我们提出的情感聊天机(ECM)不仅在内容上(相关性和语法性),而且在情感方面(情感一致性)也能产生合适的回复。据我们所知,这是第一个考虑到大规模对话生成中涉及情感因素的工作。ECM使用三种新机制来解决这一问题:(1)通过嵌入情感...
2020-03-15 20:08:01
2751
原创 计算机专业求职书籍摘取
数据对齐是指在处理结构体的成员时,成员在内存中的起始地址编码必须是成员类型所占字节数的整数倍。结构体sizeof的计算结果必须是结构体占用空间最多的成员所占空间的整数倍。在数据对齐时,要以结构体中最深层的基本数据类型为准。当数组中的元素是自定义类型时,delete在释放空间时只会调用数组中首个元素的析构函数,而delete[]在释放空间时会调用数组中所有元素的析...
2019-11-14 22:20:52
169
原创 更换pip源(普通方法没成功可以试试)
之前安装网上博客的方法在用户目录下创建php文件夹,再创建php.in。没管用,用了另一个语句pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/发现php.in被创建了,但是路径却是C:\Users\你的用户名\AppData\Roaming\pip所以推测可知,使用创建文件夹的方法应该是...
2019-11-13 23:05:43
782
原创 Tensorflow安装异常,下载速度很慢
反正就是安装的时候速度很慢,几kb,然后好不容易下来一大半还报错在别的博客上看到的,用下面这条命令pip install -i https://pypi.douban.com/simple tensorflow==1.5.0换了个源特别快,版本限定是因为有些时候电脑的cpu不兼容...
2019-08-26 22:15:00
4843
1
原创 python爬虫爬取Boss直聘网招聘信息
学校给我们大三同学找了一个培训组织,做了10天的实训,我学习的是python,最后是以一个爬虫程序为结业作业,就着这个实训,顺便发一个博客记录一下。考虑到我们即将就业,所以准备爬一个招聘网站,最终决定是Boss直聘。爬虫具体的步骤为:1.分析url 2.获取网页内容 3.存储到本地1.分析url这是一个页面的网址:https://www.zhipin.com/c10...
2019-07-24 16:00:14
3752
4
转载 猫眼电影爬取(非原创)
import requestsimport refrom multiprocessing import Poolfrom requests.exceptions import RequestExceptionimport jsonheaders = {'User-Agent':'Mozilla/5.0'}def get_one_page(url): try: ...
2019-07-16 23:21:48
166
原创 关于聚类的学习
%聚类的方法:层次聚类、基于划分的聚类、基于密度的聚类(1)层次聚类:适用于小样本数据。可以形成相似度层次图谱,便于直观地确定类之间的划分。该方法一边探索样本特征,一边进行聚类,得到业务可解释性强的分类,但是难以处理大量样本。(2)基于划分的聚类(k- means):适用于大样本数据。其将观测分为预先指定的、不重叠的类,但是不能提供类相似度信息。该算法需要事先决定聚类个数,这是使用该算法的...
2019-04-28 23:07:35
1406
原创 wampserver橙色,80端口被IIS(PID4)占用
不知道啥时候起,我服务器上的本地变成了一个我觉得想广告业的东西,点开看说是IIS之类的,但是这样我的80端口就被占用了。用netstat查看端口,是PID为4的进程占用了80端口,但是吧,这个进程杀不死,结束不了。在网上搜了很多文章,有什么卸载IIS,关闭IIS,好像都不行。最后看到了一篇文章,竟然神奇的解决了,虽然我不知道两者的关联是什么,但是记录一下,下次被又忘了。。。方法:...
2019-03-26 13:14:39
637
原创 acm总结(一)
;const double pi = acos(-1.0);long long在Linux下的输入输出格式符为%lld,但windows平台中有时为%I64d;scanf函数返回的是成功输入的变量个数;比较大的数组应尽量声明在main函数外,这样才可以开的尽可能大;void *memcpy(void *dest,const void *src,size_t n),从源src所指的内...
2019-03-23 18:23:35
251
原创 利用python借助数据库实现动态获取远程服务器上的图片
就为了实现动态获取远程服务器上的图片,走了不少弯路,比如用paramiko,结果得远程服务器安装SSH,但是我服务器版本不适宜,反正遇到了不少坑,看了很多博客,集众人之所长,啧啧,最终成功实现,感谢感谢!# --*-- coding:utf-8 --*--import apschedulerimport timefrom apscheduler.schedulers.blocking i...
2019-03-07 21:51:32
1069
原创 python实现远程连接数据库定时获取数据
# --*-- coding:utf-8 --*--import apschedulerimport timefrom apscheduler.schedulers.blocking import BlockingSchedulerimport pandas as pdimport pymysqlimport subprocessimport osdef connect_mys...
2019-03-04 18:10:22
1951
原创 分考场 蓝桥杯
#include <iostream>using namespace std;const int MAXV = 1000;const int INF = 1000000000;int n, G[MAXV][MAXV], res = INF, cun[MAXV][MAXV], cnt[MAXV] = {0};bool vis[MAXV] = {false};void DF...
2018-11-20 23:12:21
420
原创 Numpy数值计算
NumPy数组在数值运算方面的效率优于Python提供的listT: 返回自身的转置H:返回自身的共轭转置I: 返回自身的逆矩阵A: 返回自身数据的二维数组的一个视图np.all 表示 and, np.any 表示 orshape 返回tuple,表示数组的尺寸,对于n行m列的矩阵,形状为(n,m)dtype 数组中元素的类型ndim 数组的维数sava函...
2018-09-20 23:18:31
420
原创 java考试复习整理
java程序由编译器进行编译,产生一种中间代码,称为java字节码。java的特征:简单性、面向对象、分布式特征。半编译、半解释、强壮性、安全性、体系结构中立、可移植性、高性能、多线程、动态。final可修饰类、属性和方法。接口是一种抽象类,接口中只能出现静态常量或抽象方法的定义。java只在运行时动态装载必须的类。类有两种基本成分,变量和方法与定义,构造方法不是类的方法类的成员变量可以是基本类型...
2018-07-09 15:42:40
1670
原创 基于HTML5的APP开发学习(三)
JavaScript三种主要数据类型、两种复合类型和两种特殊数据类型字符串、数值、布尔对象、数组null、undefined可以使用任意表达式作比较表达式。任何值为0、null、未定义或空字符串的表达式被解释为false,其他为true。null表示一个对象被定义、但不占用内存,表示对象不包含任何值。可通过给一个对象赋null值来清除对象的内容从而释放内存typeof(null)为object。对...
2018-06-23 19:47:51
388
原创 MATLAB学习(二)
二维曲线绘制函数plotplot(X,Y)plot(X,Y,LineSpec)plot(X1,Y1,...Xn,Yn)plot(X1,Y1,LineSpec1,...,Xn,Yn,LineSpecn)plot(Y)plot(Y,LineSpec)plot(____,Name,Value)添加标题使用titile函数title(str)title(str,Name,Value)str表示有待在标题中...
2018-06-22 22:33:05
365
原创 matlab学习(一)
clear,用于删除工作区所有变量(包括全局变量),可跟具体变量名clc,用于清楚命令窗口中执行过的所有命令及显示的相关结果diary 后面跟文件路径,可以保存好执行命令的历史记录,如果该命令后面没有明确指定完整路径名,则被保存在当前工作文件夹中。diary off结束保存工作。格式化样式format, 默认显示格式,小数点后显示4位format long, 显示长格式,小数点后面显示15位fo...
2018-06-21 16:56:58
271
原创 基于HTML5的APP开发学习(二)
属性选择器中还可以包含=、~、^、$、|、*等符号,=表示相等,~表示空格分隔的包含,|表示以连字符分隔的开始,^表示开始,$表示结尾,*表示任意。伪元荤 a:hover必须位于a:link和a:visited之后,这样才能生效;a:active必须位于a:hover之后,这样才能生效。:before 用于在某个元素之前插入一些内容:after 用于在某个元素之后插入一些内容:root 匹配文...
2018-06-21 11:58:57
299
原创 基于HTML5的APP开发学习(一)
HTML5提供了一些全局属性,即每个标签上都可以使用的属性,亦即使属于非标准的标签也会有这些属性。常见的全局属性如下:accesskey:给当前元素创建一个键盘快捷键,字符用空格分隔。class:当前元素使用的样式类,若有多个用途空格分隔。contentditable:使当前元素可编辑。contextmenu:值为<menu>的id属性,定义元素的上下文菜单。data-*:向元素添加自...
2018-06-20 22:37:04
4190
原创 初识TensorFlow(一)
学习《深度学习——入门与实践》TensorFlow的基本架构是数据流图。使用TensorFlow进行运算首先要构造一个图,图包含了一系列表示运算单元的操作节点和一些在操作节点之间流动的张量。TensorFlow中采用张量的数据结构来表示所有数据,图中节点之间的传递的都是张量。一个张量有固定的类型、秩和形状。常量和变量都属于张量。关于运算的定义都在TensorFlow根目录下的python/ops目...
2018-06-13 20:28:35
174
原创 算术表达式求值
一、需求分析1.为实现算符优先算法,使用两个工作栈,一个称作OPTR,用以寄存运算符,另一个称作OPND,用以寄存操作数或运算结果。2.本程序以字符数组读入表达式,规定的运算符已经储存,用以判断是进入OPTR还是OPND,因此,不得输入非法字符。3.表达式输入前OPTR栈中已有#,输入结束后需要输入#告诉程序输入已结束。4.多项式a和b相减, 建立多项式a-b。5. 不同运算符
2018-06-12 22:52:01
1436
原创 深度学习——池化
学习《深度学习——入门与实践》一书代码实现卷积神经网络池化步骤的实现,对之前处理好的雪佛兰科迈罗图像2进行最大池化书上没有加convert(‘RGB’),导致了报错。查阅了别人的博客,得知“在数字图像处理中,针对不同的图像格式有其特定的处理算法。所以,在做图像处理之前,我们需要考虑清楚自己要基于哪种格式的图像进行算法设计及其实现。本文基于这个需求,使用python中的图像处理库PIL来实现不同图像...
2018-06-08 17:39:51
865
4
原创 深度学习——卷积
学习《深度学习——入门与实践》一书,代码实现卷积的目的在于将某些特征从图像中提取出来,正如视觉系统辨识具有方向性地物体边缘一样。由于过滤后的新矩阵包含了原矩阵的特征,故又被称为特征图,而卷积核由于具有过滤特定特征的作用,又被称为滤波器。不同的卷积核可以过滤出不同的特征。图像边缘的像素点通过该卷积核将得到加强,而非边缘的像素点通过卷积核将被过滤掉,这也是卷积核被称为滤波器的原因。#-*- codin...
2018-06-08 17:39:21
363
原创 wampserver安装腾讯云ssl证书配置https
小编为了能让小程序用上自己的后台,开始各种找证书,几番周折之下,选择了腾讯云的ssl证书,好像是免费一年,也能够解燃眉之急了。 前面的步骤腾讯云的文档都有很详细的说明,在此就不多说了,到了安装证书这个步骤,按照文档做却出现了问题,于是各种网上找方案啊,试了好久都不行,无奈放弃了。偶然间,又想去配置它了,这次竟然成了,欣喜之下,想向广大同胞分享我的经历,避免有可怜的娃像我一样再走弯路。...
2018-04-13 21:42:01
1955
原创 一元稀疏多项式简单计算器
题目:设计一个一元稀疏多项式简单计算器一、需求分析1.首先需要判断是加运算还是减运算,然后输入并建立多项式,输入时各项顺序不限,程序可自动排序。2.输出多项式, 本程序将采用类数学表达式的输出形式,例如项x7的输出形式为x^7.且系数值为1的非零次项的输出形式中略去系数1,如项1x8的输出形式为 x8, 项-1x3的输出形式为-x3,序列按指数降序排列。3.多项式a和b相加,建立多项式a+b。4....
2018-01-14 12:06:19
5139
4
shape_predictor_68_face_landmarks.dat
2019-12-02
dlib库的whl文件.zip
2019-12-02
聚类技术---复杂网络社团检测
2019-06-30
分类技术---二分网络上的链路预测(数据挖掘上机)
2019-06-30
DBMS的设计与实现
2019-05-23
软考初级程序员09年到17年真题+第四版教程+大纲变化
2018-10-10
根据输入值显示多种颜色小方块
2018-06-25
内部排序算法比较
2018-01-14
python启动http服务器出现unicodeDecodeError怎么解决
2018-01-20
TA创建的收藏夹 TA关注的收藏夹
TA关注的人