python
昕晴
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
TypeError: ‘instancemethod‘ object has no attribute ‘__getitem__‘解决方案
num_units = queries.get_shape().as_list[-1] 报错TypeError: 'instancemethod' object has no attribute '__getitem__'结果为少了一个()修改为 num_units = queries.get_shape().as_list()[-1]原创 2020-12-17 19:49:00 · 1465 阅读 · 1 评论 -
jieba分词中cut和lcut的区别
jieba.cut生成的是一个生成器,generator,也就是可以通过for循环来取里面的每一个词。word_list= [word for word in jieba.cut(text)]jieba.lcut 直接生成的就是一个listPrefix dict has been built succesfully.Full Model 我/来/北京/上学['我', '来',...原创 2019-02-25 17:17:40 · 49352 阅读 · 2 评论 -
pytorch 版 textcnn详解
首先,先放链接,https://github.com/Shawn1993/cnn-text-classification-pytorch 感谢这位老哥的代码。自己也有写了一份,但是自己写的和这位老哥写的相比实在是黯然失色。首先这是 数据预处理的代码,我觉得这个代码的主要灵魂是使用了torchtext,torchtext在我上一篇代码中有介绍,这个代码中还有各种装饰器的使用,使代码更加优...转载 2019-02-26 21:31:27 · 2075 阅读 · 1 评论 -
每日算法题之 斐波那契数列
大家都知道斐波那契数列,现在要求输入一个整数n,请你输出斐波那契数列的第n项(从0开始,第0项为0)。n<=39# -*- coding:utf-8 -*-class Solution(): def Fibonacci(self, n): # write code here a = [] a.append( 0...原创 2019-03-25 10:11:52 · 521 阅读 · 0 评论 -
append 赋值问题
今天突发奇想。。 给list.append()赋值,后发现返回值为none理解为: b = a.append(3)因为a.append(3) 是一个none type ,返回值为None,所以 对b赋值,就为None...原创 2019-03-18 15:07:19 · 1715 阅读 · 2 评论 -
报错 ValueError: too many values to unpack (expected 2)
enc_output,enc_slf_attn = self.slf_attn(user_embedding,item_input,item_input,mask = slf_attn_mask)实际上只有一个返回值,但是我却写了两个返回值,所以报错。改正为enc_output = self.slf_attn(user_embedding,item_input,item_in...原创 2019-03-25 15:54:53 · 80127 阅读 · 6 评论 -
每天一算法题 之 《剑指offer》 -- 二维数组中的查找
题目描述在一个二维数组中(每个一维数组的长度相同),每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。首先:遇到查找题,我们是想先遍历所有的值,来确定target是否在array 中,问题就转换成了二维列表的遍历。我使用了简单粗暴的两层for 循环来进行遍历,利用列表句柄的...原创 2019-03-18 22:11:13 · 146 阅读 · 0 评论 -
datetime 转换 时间格式 处理数据常用
str 转换为datetime很多时候,用户输入的日期和时间是字符串,要处理日期和时间,首先必须把str转换为datetime。转换方法是通过datetime.strptime()实现,需要一个日期和时间的格式化字符串:from datetime import datetimecday = datetime.strptime('2015-6-1 18:19:59', '%Y-%m-%...原创 2019-04-11 20:48:01 · 4445 阅读 · 0 评论 -
Python | Pandas Series.nunique() 用法
Pandas nunique() 用于获取唯一值的统计次数。df = pd.DataFrame({'A': [1, 2, 3,5], 'B': [1, 1, 1,2]})df.nunique()A 4 #A列有四个不同的值B 2 #B列有两个不同的值原创 2019-04-12 10:07:34 · 4088 阅读 · 0 评论 -
推荐系统 有关recall,precision.实验总结
recall为用户u推荐N个物品(记为R(u)),令用户在测试集上喜欢的物品的集合为T(u),然后计算召回率。召回率描述还有多少比例的用户-物品评分记录包含在最终的推荐列表中。所以T(u)是测试集的总长度。GRU4REC中,计算TOP 20的召回率时,每个session的target只有一个,所以T(u)的长度是1,意思为当取推荐的前20个数值时,(也就是softmax的结果取前20个概...原创 2019-04-14 11:53:02 · 8180 阅读 · 1 评论 -
python3报错:UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 0: ordinal not in ran
貌似0xe6的错误和其他的错误是不一样的但是anyway都是编码出错了 hypotheses_1 = [line.strip().split() for idx, line in enumerate(open(model_1_rewrite_test_file, 'r').readlines())]加入encoding时错误消失 hypotheses_1 = [line.str...原创 2019-06-22 19:46:42 · 4538 阅读 · 1 评论 -
pandas groupby 使用记录
在处理数据,做特征的时候,pandas 中groupby是我们常用的一个函数。此贴为一个总结帖。会不断贴上使用中所遇到的pandas新的使用方法。遍历groupby的分组grouped = df.groupby('buyer_admin_id')for i,g in grouped: print(i) # i就是 buyer_admin_id print(g) #g就是每个分组的da...原创 2019-09-06 15:49:59 · 310 阅读 · 0 评论 -
python dict.get 用法
dict.get(key, default=None)#举例word2idx.get(word,1) for word in sentence# 意思是 如果word 没在词典中,返回默认值 1 #可以在将句子转换成index 使用...原创 2019-09-17 09:40:15 · 4792 阅读 · 0 评论 -
特征处理
1、无量纲处理标准化变化后各维特征的均值为0 ,方差为1.计算公式为特征值减去均值,除以标准差。import numpy as npfrom sklearn import preprocessingx = np.array([[1.,-1.2.], [2.,0.,0.], [0.,1.,-1.]])x_scaled = prepr...原创 2019-02-28 22:40:22 · 337 阅读 · 0 评论 -
Python3 torchtext的安装(Windows and Linux)
尝试了很多次 其他博客的安装。。都以失败告终(我大概是一个安装包克星)尝试过的方法有源码安装 pip直接安装 conda直接安装最后成功的方法还是要借助anacondaconda install -c derickl torchtext顺便说一句,torchtext对python2 很友好,直接pip install torchtext...原创 2019-02-28 22:37:08 · 10898 阅读 · 14 评论 -
multiply 和matmul的区别
multiply 是对应元素位置相乘matmul是矩阵乘法 1.tf.multiply()两个矩阵中对应元素各自相乘格式: tf.multiply(x, y, name=None) 参数: x: 一个类型为:half, float32, float64, uint8, int8, uint16, int16, int32, int64, complex64, comple...转载 2019-02-21 17:16:07 · 2413 阅读 · 0 评论 -
y[:,:1]与y[:,:-1]
import torchimport torch.nn as nnimport torchfrom torch.autograd import *input = torch.randn(4,4)print(input)#m = nn.LayerNorm(input.size()[1:])#m = nn.LayerNorm(input.size()[1:], elementwi...原创 2019-02-21 17:20:00 · 4104 阅读 · 1 评论 -
codecs
open 这个 打开文件的方法只能读str字符串,而不管字符串是什么编码方式。使用codecs.open可以避免因为编码问题而造成的问提。 fw = codecs.open('test1.txt','a','utf-8')...原创 2019-02-21 17:29:54 · 326 阅读 · 1 评论 -
dropout
正则化之dropout(随机失活)详细介绍2018年07月14日 13:43:51修炼之路阅读数:258版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.youkuaiyun.com/sinat_29957455/article/details/81023154本篇文章的主要内容来自于deeplearning.ai一、什么是dropoutdropout(随机失...转载 2019-02-21 17:30:48 · 586 阅读 · 0 评论 -
copy.deepcopy 和 copy.copy
定义:python中对象的赋值其实就是对象的引用,当创建一个对象,把它赋值给另一个变量的时候,python并没有拷贝这个对象,只是拷贝了这个对象的引用而已。 浅拷贝: 拷贝了最外围的对象本身,内部的元素都只是拷贝了一个引用而已。也就是,把对象赋值一遍,但是该对象中引用的其他对象我不复制。深拷贝:外围和内部元素都进行了拷贝对象本身,而不是引用。也就是,把对象复制一遍,并且该对象中引用...原创 2019-02-21 17:32:53 · 323 阅读 · 1 评论 -
np.lib.pad可直接用于pad 成同长度序列
X = np.zeros([len(x_list), hp.maxlen], np.int32) Y = np.zeros([len(y_list), hp.maxlen], np.int32) for i, (x, y) in enumerate(zip(x_list, y_list)): X[i] = np.lib.pad(x, [0, hp.maxl...原创 2019-02-21 17:33:56 · 777 阅读 · 0 评论 -
pandas.DataFrame.sort_values¶
df = pd.DataFrame({... 'col1' : ['A', 'A', 'B', np.nan, 'D', 'C'],... 'col2' : [2, 1, 9, 8, 7, 4],... 'col3': [0, 1, 9, 4, 2, 3],... })>>> df col1 col2 col30 A 2 ...原创 2019-02-21 17:35:19 · 244 阅读 · 1 评论 -
drop
参数labels :选择索引或者列去drop axis : 0 表示索引,1表示列,默认为0index, columns : 单值或者列表Alternative to specifying axis (labels, axis=1 is equivalent to columns=labels).New in version 0.21.0.level : int o...转载 2019-02-21 17:36:14 · 213 阅读 · 0 评论 -
duplicated
python 中pandas 只不模块中的duplicated方法返回一个布尔型的series,显示各行是否有重复行,没有重复行显示为FALSE,有重复行显示为TRUE;再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。如果duplicated方法和drop_duplicates方法中没有设置参数,则这两个方法默认会判断全部咧,如果...原创 2019-02-21 17:37:49 · 7898 阅读 · 0 评论 -
textRCNN中的一个图 ()
转载 2019-02-22 19:23:25 · 644 阅读 · 0 评论 -
pytorch转成longtensor方法
b = torch.rand(3,3)#得到的是floattensor值,b = b.long()#得到的是longtensor值原创 2019-02-23 18:07:32 · 42373 阅读 · 4 评论 -
情感分析中文本数据预处理
读数据 直接获取文件内容 # 获取文件内容 一个文件中有很多行信息,每一行是一个序列def getData(file): f = open(file,'r') raw_data = f.readlines() return raw_data # Read the file and split into lines 以换行符来分开和readlines...原创 2019-02-23 22:44:01 · 14981 阅读 · 15 评论 -
linux下创建虚拟环境
试了网上很多的例子,每次都在报错决定Mark一下自己安装的记录首先在自己的目录文件夹下 输入pip install virtualenv因为我想安装python2版本的 ,所以在这里指定版本virtualenv -p /usr/bin/python2.7 venv之后成功后cd venvsource bin/activate即可 ...原创 2019-02-28 20:37:19 · 1513 阅读 · 0 评论
分享