
python
lxg0807
这个作者很懒,什么都没留下…
展开
-
池化操作 tensorflow tf.nn.max_pool
池化操作待补充tf.nn.max_pool(value, ksize, strides, padding, data_format='NHWC', name=None)value表示输入数据形式。data_format表示输入数据的格式,需要跟输入数据的格式保持一致。有”NHWC“和”NCHW“两种。默认是”NHWC“即[batch, in_height,in_wide,in_channels]ks原创 2017-04-21 10:08:48 · 3974 阅读 · 0 评论 -
卷积操作 tensorflow tf.nn.conv2d
tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, data_format=None, name=None)data_format:可选参数,表示输入数据的格式,有两种分别为:“NHWC”和“NCHW”,默认格式为”NHWC““NHWC”输入数据的格式为为[batch, in_height, in_width, i原创 2017-04-21 09:35:52 · 4521 阅读 · 1 评论 -
ValueError: setting an array element with a sequence. tensorflow numpy
这种错误是numpy数组的维度不匹配导致的。 np.array([1,2,3,[4,5,6]])ValueError: setting an array element with a sequence.原创 2016-12-26 09:43:36 · 23679 阅读 · 0 评论 -
conda 创建虚拟环境 Anconda虚拟环境
1、创建虚拟python环境:通过构建虚拟环境,可避免与其他人的软件版本冲突。conda create -n name python=2.x.x例如创建名字为xgli的虚拟环境,python的版本为2.7.3,则命令为:conda create -n xgli python=2.7.3特别注意:在创建虚拟环境前,使用下面命令,查看是否会有重名的虚拟环境:conda env list2、激活虚拟环境s原创 2017-03-28 14:15:35 · 5051 阅读 · 0 评论 -
python 字典setdefault操作
#dict.setdefault(key, default=None)d = {'a':1,'b':2}b = d.setdefault('a',3)#b = 1b = d.setdefault('c',3)#b = 3d.setdefault('d',4)#d={'a':1,'b':2,'c':3,'d':4}从上述操作可以看出,setdefault的操作是取字典中的内容,如果key原创 2017-05-07 17:01:11 · 971 阅读 · 0 评论 -
tensorflow tf.concat操作
在某个试验中,设置了步长为2,3的两个卷积网络,在得到最终结果的时候需要对这两个网络的结果进行拼接,就需要tf.concat函数了。 官方例子:t1 = [[1, 2, 3], [4, 5, 6]]t2 = [[7, 8, 9], [10, 11, 12]](1)tf.concat([t1, t2], 0) ==> [[1, 2, 3], [4, 5, 6], [7, 8, 9], [10,原创 2017-03-12 22:11:34 · 4021 阅读 · 0 评论 -
文本分类(三):文本转为词袋模型
在第二篇中,提到了如何爬取网易的新闻文章,如果感觉比较麻烦,可以直接使用网上现有的资源。 比如:搜狗新闻数据,清华新闻数据。个人感觉搜狗新闻数据比较杂乱,清华的新闻数据应该是经过了初步的清洗。附上清华新闻的下载地址:地址 分享一下停用词表 ,可以用来去掉对文本影响不大的词语。原创 2016-10-10 11:52:48 · 7788 阅读 · 0 评论 -
python 字典排序
python 字典(dict)的特点就是无序的,按照键(key)来提取相应值(value),如果我们需要字典按值排序的话,那可以用下面的方法来进行:1 下面的是按照value的值从大到小的顺序来排序。dic = {‘a’:31, ‘bc’:5, ‘c’:3, ‘asd’:4, ‘aa’:74, ‘d’:0} dict= sorted(dic.iteritems(), key=lambda d:d[原创 2017-08-14 11:11:58 · 844 阅读 · 0 评论 -
文本分类(六):使用fastText对文本进行分类--小插曲
需要注意的问题: 1、linux mac 平台 2、标签中的下划线是两个!两个!两个!环境说明:python2.7、linux 自己打自己脸,目前官方的包只能在linux,mac环境下使用。误导大家了,对不起。 测试facebook开源的基于深度学习的对文本分类的fastText模型 fasttext python包的安装:pip install fasttext第一步获取分...原创 2016-10-28 21:44:27 · 51898 阅读 · 72 评论 -
文本分类(一):整体流程
有了新闻分类的语料库,接下来我们就可以进行文本分类了。 首先说一下大概的流程: 1.进行分词 2.去停用词 3.取名词 4.特征提取 5.特征加权 6.构造分类器正式开始1 进行分词现在网上有很多开源的分词工具可以供我们选择, 选择结巴分词进行分词。虽然中科院的分词工具号称是最好的中文分词工具,但是它并木有进行开源。 首先进行jieba的安装,结巴的githu原创 2015-12-06 16:37:28 · 9420 阅读 · 0 评论 -
Graph_tool的简单安装 ubuntu15.10
直接奔主题deb http://downloads.skewed.de/apt/wily wily universedeb-src http://downloads.skewed.de/apt/wily wily universe里面的wily为ubuntu的代号。具体可参考如下:14.04 Trusty Tahr 14.10 Utopic Unicorn 15.04 Vivid原创 2016-04-23 12:20:47 · 4106 阅读 · 5 评论 -
python实现字典树
由小米面试引发的字典树,面试过程中,才知道有字典树这个玩意。字典树简单实现#coding=utf-8 class Trie: root = {} END = '/' def add(self, word): #从根节点遍历单词,char by char,如果不存在则新增,最后加上一个单词结束标志 node = self.root for c in wo转载 2017-05-02 16:13:06 · 2295 阅读 · 0 评论 -
python里面的set、list、tuple区别和使用方法
python中set,list,tuple。虽然很多人都已经写过了,但每个人都有每个人的理解。list可能在三种中list,列表是用的最多的了吧。下面简要说一下它的基本用法#1. 生成空的列表l = []#2. 生成带有默认值的列表l = [0]*20 #一维l = [[0]*20]*10 #二维.......#3.新增元素l.append(a) #a是什么形式的在l中就是什么形式,相当原创 2017-03-31 20:12:05 · 4027 阅读 · 0 评论 -
python numpy.tile函数
由于思维定势,刚刚接触这个函数导致了理解错误.tile函数的作用是将矩阵进行扩展.分为两种情况:A[2][2] = [[1,2],[1,2]]为一个2维数组1.如果矩阵的维数小于所需扩充的维数,则:tile(A,(2,1,2)) = A[1*2][2*1][2*2]=[[[1,2,1,2],[1,2,1,2]],[[1,2,1,2],[1,2,1,2]]]tile(A,(1原创 2015-10-16 22:57:32 · 971 阅读 · 0 评论 -
中文字符乱码问题简单解决 python
使用python2处理中文文本的时候,由于编码的问题,会出现乱码。 原因就是,python内部使用unicode进行字符的处理,但我们输入进去的字符编码可能是各式各样的。 因此需提前对输入文本进行decode操作。但是decode需要指定解码的类型比如,gbk,gb2312等,需要对文本进行判断。python中有内置模块可以查看chardetimport chardettext = open(f原创 2016-05-05 15:42:45 · 2403 阅读 · 0 评论 -
python 多维数组的初始化生成
突然某一天,想写一个python的多维数组,发现不会了。 正确的写法。multilArray = [[ 0 for col in range(0,2)] for row in range(0,3)]原创 2016-04-21 22:27:43 · 2341 阅读 · 0 评论 -
文本分类(五):使用LDA进行文本的降维---提特征
每个文本可以看作是又不同的主题构成了,各个主题原创 2016-10-10 15:36:28 · 10617 阅读 · 1 评论 -
文本分类(四):使用CHI进行文本的降维---提特征
先占一个位置,改天完善原创 2016-10-10 15:44:33 · 2630 阅读 · 1 评论 -
python numpy.tile函数
由于思维定势,刚刚接触这个函数导致了理解错误. tile函数的作用是将矩阵进行扩展. 数组的扩展一定要从低维考虑。分为两种情况:A[2][2] = [[1,2],[1,2]]为一个2维数组1.如果矩阵的维数小于所需扩充的维数,则:tile(A,(2,1,2))其中A可以首先扩展到相同的维度,A的原来形状为2x2的二维数组,由于需要扩展的维度为三维,因此可首先将A变为形状为1x2x2的三维数组。t原创 2016-11-03 15:11:49 · 1061 阅读 · 0 评论 -
文本分类(二):scrapy爬取网易新闻
在数据挖掘课程中,老师布置了文本分类的作业。文本分类的第一项应该就是获取文本了吧。在木有弄懂scrapy的情况下写的,纯应用,或许后续会补上scrapy的原理。首先说一下我的环境:ubuntu14.10scrapy安装指南(肯定官网的最权威了):[传送门](http://scrapy-chs.readthedocs.org/zh_CN/0.24/intro/install.html#intro原创 2015-12-04 20:39:12 · 8784 阅读 · 0 评论 -
分本分类(六):使用LDA+SVM进行文本分类
经过分本分类(五)利用LDA成功的将文本的特征维数降低了,可以拿这些特征使用SVM分类器进行分类,查看一下效果。占位置。。。。原创 2016-11-23 21:33:26 · 9754 阅读 · 5 评论 -
文本分类系列-简单的使用cnn对新闻进行分类
为了学习cnn,本文将构建一个简单的cnn模型,对新闻文本进行分类。原创 2017-02-23 11:15:31 · 4121 阅读 · 1 评论 -
tensorflow tf.nn.embedding_lookup(embeddings, train_inputs)解释
embedding_lookup从表面意思看就是一个查找单词对应词向量的表, embeddings参数:词跟词向量的对应表 train_inputs参数:需要转换的文本(int类型) 类似下面的操作:embeddings = np.random.random([1024, 64]) # 64-dimensional embeddingstrain_inputs = np.array([0,原创 2017-02-22 11:00:27 · 1907 阅读 · 0 评论 -
TensorFlow的reshape操作 tf.reshape
初学tensorflow,如果写的不对的,请更正,谢谢!tf.reshape(tensor, shape, name=None) 函数的作用是将tensor变换为参数shape的形式。 其中shape为一个列表形式,特殊的一点是列表中可以存在-1。-1代表的含义是不用我们自己指定这一维的大小,函数会自动计算,但列表中只能存在一个-1。(当然如果存在多个-1,就是一个存在多解的方程了)好了我想说的原创 2016-11-03 15:26:29 · 104839 阅读 · 8 评论