
python
文章平均质量分 72
MeteorMan99
一万年太久,只争朝夕
与君共勉之!
展开
-
论文中注意力机制可视化图的制作
推荐使用seaborn提供的热力图来制作。以下是个人经验:最近在使用注意力机制实现文本分类,我们需要观察每一个样本中,模型的重心放在哪里了,就是观察到权重最大的token。这时我们需要使用热力图进行可视化。我这里用到:seabornseaborn.heatmapseaborn.heatmap(data, vmin=None, vmax=None, cmap=None, cent...原创 2019-07-25 11:52:36 · 21638 阅读 · 3 评论 -
基于Seq2Seq的问答系统/聊天机器人
前几篇博客介绍了基于检索聊天机器人的实现、seq2seq的模型和代码,本篇博客将从头实现一个基于seq2seq的聊天机器人。这样,在强化学习和记忆模型出现之前的对话系统中的模型就差不多介绍完了。后续将着重介绍强化学习和记忆模型在对话系统中的应用。基于检索的聊天机器人的实现seq2seq模型详解tensorflow中的seq2seq的代码详解闲聊机器人在网上有很多有趣的小例子:c...原创 2018-12-03 14:03:41 · 7292 阅读 · 12 评论 -
python 使用ElementTree解析xml文件
以country.xml为例,内容如下:<?xml version="1.0"?><data> <country name="Liechtenstein"> <rank updated="yes">2</rank> <year>2008原创 2018-11-07 15:10:36 · 1937 阅读 · 0 评论 -
如何查找NLP相关论文
如何检索自然语言处理领域相关论文前言针对自身的情况,发现个人查找论文的能力,看论文的能力有些薄弱。特此进行如果检索合适的论文写一个博客。 本文主要是摘自刘知远 老师的新浪博客和南京理工大学文本挖掘研究组博客综述要快速地熟悉一个领域,更加深刻地了解这该领域的发展,就必须查阅这个领域的相关论文。本文主要讲述自然语言处理领域(NLP)相关论文的检索。与其他领域一样,自然语言处理领域...转载 2018-10-15 18:36:59 · 4809 阅读 · 1 评论 -
tensorflow GPU设置
tensorflow ConfigPrototf.ConfigProto一般用在创建session的时候。用来对session进行参数配置with tf.Session(config = tf.ConfigProto(...),...)#tf.ConfigProto()的参数log_device_placement=True : 是否打印设备分配日志allow_soft_pla...原创 2018-10-01 13:55:48 · 331 阅读 · 0 评论 -
github上传文件涉及到的操作
一、解除GitHub上传文件大小限制上传项目到GitHub上,当某个文件大小超过100M时,就会上传失败,因为默认的限制了上传文件大小不能超过100M。如果需要上传超过100M的文件,就需要我们自己去修改配置。输入命令:git config http.postBuffer 524288000执行完以上语句后输入git config -l可以看到配置项的最下面多出了一行我们刚刚配置的内容...原创 2018-09-17 13:22:18 · 438 阅读 · 0 评论 -
使用matplotlib在同一个窗口绘制多个图形
代码如下:import numpy as npimport matplotlib.pyplot as plt#创建自变量数组x= np.linspace(0,2*np.pi,500)#创建函数值数组y1 = np.sin(x)y2 = np.cos(x)y3 = np.sin(x*x)#创建图形plt.figure(1)'''意思是在一个2行2列共4个子图的图中,定...原创 2018-09-09 14:30:51 · 16822 阅读 · 1 评论 -
使用tensorflow-gpu时设置GPU
使用GPU跑tensorflow程序,默认加载所有的GPU,但计算过程中只会用其中一块。也就是你看着所有GPU都被占用了,以为是在GPU并行计算,但实际上只有其中一块在运行;另外的所有显卡都闲着,但其显存都被占用了,所以别人也用不了。不过这种情况通过在程序之前加三行代码就可以解决:import osos.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"...原创 2018-09-02 14:31:34 · 5821 阅读 · 0 评论 -
Tensorflow:基于LSTM生成藏头诗
模型生成首先我们要训练好模型。这里采用的是2层的LSTM框架,每层有128个隐藏层节点,batch_size设为64。训练数据来源于全唐诗。特别注意到的一点是这里每训练完一次就对训练数据做shuffle。 源代码如下:#!/usr/bin/python3#-*- coding: UTF-8 -*-import collections import numpy as np im...原创 2018-12-06 16:23:29 · 1080 阅读 · 1 评论 -
Windows下安装基于python的接口哈工大语言技术平台pyltp
系统:Windows(64bit)python版本:python3.6.4pyltp版本:0.2.1初入实习生涯,偶然接触到了哈工大的ltp这个平台,不得不说,一深入了解感觉怎个厉害了得,之前大多是基于Stanford coreNLP进行NLP的基础技术实线以及依据jieba、中科院系统分词,但并没有一个专门针对中文的整套系统,看到ltp,哈哈哈,确认过眼神,你是我遇到的对的人^_^...原创 2019-01-23 14:06:29 · 504 阅读 · 0 评论 -
从国内镜像地址安装python库
(1)使用python内置的pip安装库:国内镜像地址:https://pypi.tuna.tsinghua.edu.cn/simple例如:安装 tensorflow可以使用如下命令pip install tensorflow -i https://pypi.tuna.tsinghua.edu.cn/simple这样的话,安装速度飞起(2)基于anaconda安装库运行...原创 2019-02-16 16:55:06 · 6104 阅读 · 3 评论 -
Windows安装Pytorch
这里只提示一点,pip可以安装Python2的Pytorch1.0的cpu版本,如果要安装gpu版本,请升级到Python3:方式1:使用pip获取whl文件安装Python2.7 cpu版本:pip install https://download.pytorch.org/whl/cpu/torch-1.0.0-cp27-cp27mu-linux_x86_64.whl pip i...原创 2019-06-11 09:16:07 · 1917 阅读 · 0 评论 -
PyCharm 常用设置(主题、样式、字体、字号)
PyCharm 常用设置(主题、样式、字体、字号)点击菜单 File => Settings,打开 PyCharm 设置对话框点击 Appearance & Behavior => Appearance,设置 IDE 主题 (Theme),推荐 Darcula(如果 PyCharm 安装完成后,第一次启动时错过了设置,可以在这里做)...翻译 2019-06-10 13:49:55 · 51390 阅读 · 9 评论 -
训练一个自然语言处理模型,并基于服务进行部署通信
好久没有更博啦,对于博客还挺想念的,O(∩_∩)O 最近在公司做算法收获也是很大,怀念码代码记录技术实现的路程点滴。感情上、工作上都遭遇了不少事情,幸运的是自己最终坚持了下来,并且未来可期! 人呐,渐渐地上了年纪,总会念叨几句【捂脸】。话不多说,进入正题!一、整体架构 在公司做NLP相关项目,一直对于项目上线运行有疑惑,上线后模型是怎么被调用然后做预测...原创 2019-06-02 00:23:48 · 787 阅读 · 0 评论 -
python中安装ahocorasick库
转载至:https://blog.youkuaiyun.com/qq_35637447/article/details/86062697看了好几篇解决这类问题的方法,大部分是在http://www.lfd.uci.edu/~gohlke/pythonlibs/找到所需要下载的模块文件对应版本进行下载,但是并没有pyahocorasick。然后,我就想还是根据报错提示的链接地址,老老实实下Visual ...转载 2019-04-15 17:27:24 · 23316 阅读 · 21 评论 -
使用pip安装库:Error: [Errno 13] Permission denied: 'g:\\python\\python36\\Lib\\site-packages\\numpy\\
使用pip 更新某个库,出错信息如下所示:Error: [Errno 13] Permission denied: 'g:\\python\\python36\\Lib\\site-packages\\numpy\\这时候需要去关闭所有的python进程,包括pycharm以及任务管理器中的进程...原创 2019-03-22 19:05:29 · 4059 阅读 · 0 评论 -
Keras中设置GPU使用
指定GPU并设置为按需增长:"""GPU设置为按需增长"""import osimport tensorflow as tfimport keras.backend.tensorflow_backend as KTF# 指定第一块GPU可用os.environ["CUDA_VISIBLE_DEVICES"] = "0"config = tf.ConfigProto()confi...原创 2019-03-26 10:22:07 · 14455 阅读 · 1 评论 -
python---在已有数据的文件中的第一行插入指定数据
定义如下函数即可(以csv文件为例):"""在csv文件中第一行添加索引字段"""def write_raw_index(file): filename = file with open(filename, 'r+', encoding='utf-8') as f: content = f.read() f.seek(0, 0) ...原创 2019-03-19 11:04:57 · 13615 阅读 · 3 评论 -
Python---控制台打印进度条
进度条代码如下:import sysimport timedef progress(percent,width=50): '''进度打印功能''' if percent >= 100: percent=100 show_str=('[%%-%ds]' %width) %(int(width * percent/100)*"#") #字符...原创 2018-08-30 14:18:35 · 2360 阅读 · 0 评论 -
GitHub中README.md文件的编辑和使用
参考链接:https://blog.youkuaiyun.com/ljc_563812704/article/details/53464039原创 2018-08-29 20:24:31 · 1482 阅读 · 0 评论 -
CNN用于句子分类时的超参数调试经验
根据“A Sensitivity Analysis of (and Practitioners’ Guide to) Convolutional Neural Networks for Sentence Classification”这篇paper得到的经验。这篇paper的主要工作是对“Convolutional Naural Networks for Sentence Classificati...原创 2018-08-31 15:07:47 · 761 阅读 · 0 评论 -
Numpy库中的random模块
random模块用于生成随机数,下面看看模块中一些常用函数的用法:numpy.random.rand(d0, d1, ..., dn):生成一个[0,1)之间的随机浮点数或N维浮点数组。[python] view plain copy#numpy.random.rand(d0, d1, ..., dn) import numpy as np #无参 np.random.rand()#生成生成...原创 2018-05-13 19:33:30 · 2974 阅读 · 0 评论 -
Windows下在anaconda环境中安装自然语言处理工具---Spacy
我的环境为:python3.6.2,win64有两种安装方法:Solution1: pip安装直接在conda命令行界面输入 pip install spacy一直报错:Microsoft Office C++ 14.0 is required。So,按照error提示安装了VS,结果发现运行pip install spacy仍然包同样的bug!然后仔细查看安装的日志log,发现其中有几个库不匹配...原创 2018-05-06 21:34:30 · 6772 阅读 · 2 评论 -
吴恩达机器学习、深度学习课程地址及笔记
机器学习课程地址:https://www.coursera.org/course/ml笔记地址:http://www.ai-start.com/ml2014/深度学习课程地址:https://mooc.study.163.com/university/deeplearning_ai#/c笔记地址:http://www.ai-start.com/dl2017/...原创 2018-05-10 11:44:50 · 4065 阅读 · 0 评论 -
ValueError: Masked arrays must be 1-D
问题说明使用numpy画散点图出现以上问题。(《机器学习-算法原理与编程实践》第7页)原代码如下:import numpy as npimport matplotlib.pyplot as pltdataSet=np.random.rand(2,10)dataSet=np.mat(dataSet)#1print(dataSet)plt.scatter(dataSet[0],dataS...原创 2018-04-22 19:32:23 · 2433 阅读 · 1 评论 -
计算python程序运行时间
方法1import datetimestarttime = datetime.datetime.now()#long runningendtime = datetime.datetime.now()print (endtime - starttime).seconds方法 2start = time.time()run_fun()end = time.time()print end-start方法...原创 2018-04-18 15:20:55 · 283 阅读 · 0 评论 -
相关系数矩阵可视化(生成热力图)
对其中的参数进行解释plt.subplots(figsize=(9, 9))设置画面大小,会使得整个画面等比例放大的sns.heapmap()这个当然是用来生成热力图的啦df是DataFrame, pandas的这个类还是很常用的啦~df.corr()就是得到这个dataframe的相关系数矩阵把这个矩阵直接丢给sns.heapmap中做参数就好啦sns.heapmap中annot=True,意思...原创 2018-04-16 19:09:26 · 17438 阅读 · 1 评论 -
Pycharm创建py文件时自定义头部模板
# -*- coding: utf-8 -*-"""------------------------------------------------- File Name: ${NAME} Description : Author : ${USER} date: ${DATE}--------------------------...原创 2018-03-02 13:33:59 · 1088 阅读 · 0 评论 -
python画图系列之颜色、线条个性化定制
参考网址:http://stackoverflow.com/questions/22408237/named-colors-in-matplotlibhttp://stackoverflow.com/questions/8409095/matplotlib-set-markers-for-individual-points-on-a-line 代码:plt.subplots(1, 1)x= ra...原创 2018-05-15 23:01:21 · 3553 阅读 · 0 评论 -
python画图系列之个性化显示x轴区段文字
今天在写一个研究生创新项目申报书时涉及到一个python画图问题,对于在x轴各个区段显示自定义的字符串有些疑问,特此记录。界面如下所示:代码如下所示:import matplotlib.pyplot as pltfrom pylab import * #支持中文mpl.rcParams['font.sans-serif'] = [...原创 2018-05-15 23:11:34 · 19356 阅读 · 3 评论 -
Python绘图问题:Matplotlib中指定图片大小和像素
主要作用为指定图片像素:matplotlib.rcParams[‘figure.figsize’]#图片像素 matplotlib.rcParams[‘savefig.dpi’]#分辨率 plt.savefig(‘plot123_2.png’, dpi=200)#指定分辨率 plt.rcParams['figure.figsize'] = (8.0, 4.0) # 设置fig...原创 2018-06-13 14:23:59 · 211198 阅读 · 4 评论 -
Matplotlib:点、实虚线条、柱状图阴影填充
style1.绘制x=12.不同线宽enumerate(Widths) 3.线型(实线,虚线,点划线) linestyle set_dashes 4.自动设置线颜色 5.点的显示形式 marker markersize markeredgecolor markerfacecolor 6.柱状图及其填充 axes.bar axes.bar( .5+i, 1, hat...原创 2018-08-16 16:36:49 · 76779 阅读 · 2 评论 -
画黑白带阴影线的柱状图(论文专用)
Matplotlib代码:import numpy as np import matplotlib.pyplot as plt from pylab import * mpl.rcParams['font.sans-serif']=['SimHei'] def read(): name_list = ['计算机'.decode("utf-8"),'法律'.deco...原创 2018-08-16 14:49:51 · 5930 阅读 · 0 评论 -
matplotlib画图系列之设置坐标轴(精度、范围,标签,中文字符显示)
在使用matplotlib模块时画坐标图时,往往需要对坐标轴设置很多参数,这些参数包括横纵坐标轴范围、坐标轴刻度大小、坐标轴名称等 在matplotlib中包含了很多函数,用来对这些参数进行设置。plt.xlim、plt.ylim 设置横纵坐标轴范围 plt.xlabel、plt.ylabel 设置坐标轴名称 plt.xticks、plt.yticks设置坐标轴刻度以上plt表示ma...原创 2018-08-13 17:10:44 · 186579 阅读 · 12 评论 -
matplotlib画图系列之设置栅格,axes脊柱(坐标轴),背景颜色
1.设置栅格(1)使用pyplot api命令打开栅格:plt.grid(true)设置栅格格式:plt.grid(color='r', linestyle='--', linewidth=1,alpha=0.3) (2)使用axes类面向对象命令#同时设置两坐标轴上的栅格线ax.grid(color='r', linestyle='--', linewidth=1,a...原创 2018-08-13 17:00:10 · 8266 阅读 · 0 评论 -
多分类问题中的精确率与召回率
在信息检索中,精确率通常用于评价结果的质量,而召回率用来评价结果的完整性。实际上,精确度(precision)是二元分类问题中一个常用的指标。 精确度就是标记为“正”,而确实是”正“的样本占所有标记为“正”的样本的比例。 TPTP+FPTPTP+FP 和精确率一起出现的还有另一个指标召回率(recall), TPTP+FNTPTP+FN 在所有预测为正的样本中,确实为...原创 2018-08-08 14:40:04 · 19389 阅读 · 1 评论 -
N-gram模型核心词典构建
for i range (len(input)-n+1):这个for循环的长度是len-n+1,举个例子:我爱自然语言处理,当n=2时,len=8;我爱/爱自/自然/然语/语言/言处/处理,总共8-2+1=7个划分结果,“ ”.join(input[i:i+n]这个是将input的每隔n个进行分割,用空格分割,这是精髓这句...转载 2018-08-14 13:28:51 · 917 阅读 · 0 评论 -
Win10下用Anaconda安装TensorFlow-CPU
https://blog.youkuaiyun.com/u010858605/article/details/64128466/转载 2018-06-17 23:56:01 · 234 阅读 · 0 评论 -
MSCOCO数据集资源
登录ms-co-co数据集官网,一直不能进入,翻墙之后开看到下载链接。有了下载链接下载还是很快的,在我这儿晚上下载,速度能达到7M/s,所以也不上传到网盘了,有需要的人等夜深人静的时候下载效果更佳哦。我把2017的数据集下载链接贴上来,linux下wget非常快,不知道为什么迅雷不能下载,顺便说一下wget断点续传 wget -c httpcoco数据集下载链接各个链接的意思看链接里面的描述基本上...原创 2018-06-14 13:42:20 · 1426 阅读 · 0 评论 -
numpy中的matrix矩阵处理
numpy模块中的矩阵对象为numpy.matrix,包括矩阵数据的处理,矩阵的计算,以及基本的统计功能,转置,可逆性等等,包括对复数的处理,均在matrix对象中。 class numpy.matrix(data,dtype,copy):返回一个矩阵,其中data为ndarray对象或者字符形式;dtype:为data的type;copy:为bool类型。>>> a = np....原创 2018-03-09 17:28:40 · 5237 阅读 · 0 评论