- 博客(6)
- 收藏
- 关注
原创 python[-1], [:-1], [::-1]速记
老是忘记的小小知识点,记录分享一下:-)1.[-1]是取倒数第一个2.[:-1]是第1个到倒数第2个(同理,[1:-1]是从第2个到倒数第2个(指标从0开始,[0]是第一个))3.[::-1]是从倒数第一个开始,倒序列出来4.[1::-1]是从第2个(指标为1)开始倒序列出如下图所示:...
2020-11-04 04:16:34
377
原创 如何判断dataframe全都不为空值
场景:当数据集全都不为空值时,由于数据集较大,编程界面不能显示所有空值判断结果,我们希望程序可以直接帮我们判断出来。可以用如下语句:输出结果如下:
2020-10-22 04:19:24
1476
原创 表格对齐函数pandas.datafram.align的参数“join”说明
场景:做数据分析的时候,我们经常需要对数据预处理后的训练集和测试集两个表格进行对齐。这时候我们可以用上pandas DataFram.align这个函数 。函数作用是返回列/行对齐后的两个表。但其文档https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.align.html没有对参数"join"作进一步说明。以下用例子来说明该参数的作用:先建两个表:(1) 设置join = "inner"...
2020-10-14 10:35:34
698
1
原创 sklearn.LabelEncoder解决未见过值问题(eg.“y contains previously unseen labels: nan“)
主要思路:把原数据集(比如train data set)里面没有但是在新数据集(比如test data set)遇到的新值放到一个类里面,再将类回传给LabelEncoder.
2020-10-09 22:17:55
5183
2
原创 label encoding和one hot encoding简单对比
对类别变量进行处理的方法 概念 缺点 备注 label encoding 随机赋予类别变量数值 赋值难以解释,不适用与类别变量有高低之分的场景(如本科生、硕士研究生、博士生)以及对数值大小敏感的模型(如逻辑回归、SVM等) 当变量是无序变量的时候,label encoding比one-hot encoding 好 one-hot encoding 将类别变量展开成特征列名,用0/1表示样本是否具备该特征 当类别特别多时,特征空间会变得很大 ...
2020-10-09 09:52:50
872
转载 Python中列表,字典,元组,集合的区别
一、二、(一)列表list,用中括号“[ ]”表示1.任意对象的有序集合列表是一组任意类型的值,按照一定顺序组合而成的2.通过偏移读取组成列表的值叫做元素(Elements)。每一个元素被标识一个索引,第一个索引是0,序列的功能都能实现3.可变长度,异构以及任意嵌套列表中的元素可以是任意类型,甚至是列表类型,也就是说列表可以嵌套4.可变的序列支持索引、切片、合并、删除等等操作...
2019-03-16 11:14:21
338
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人