
numpy
elibneh
这个作者很懒,什么都没留下…
展开
-
特征处理:least frequent value 代码实现
训练集df_train, 测试集df_test离散型特征集cat_features = [a, b, c, d, e, f, g]策略:"unseen labels": df_test里的未见的离散型特征的value值请取代成 df_train里相同特征里的最不常见的值 least frequent value代码实现:import pandas as pdimport numpy as npdf_train = pd.DataFrame([['a', 'b', 'a', 'a',原创 2020-07-18 15:30:07 · 183 阅读 · 0 评论 -
python pandas VS numpy
两个包都有类似的数据分析工具,但是就细节上有时候也有差别。所以在切换时候需要注意。两个包的函数methods在np.nan的处理上有区别。如果是np的methods,比如我们要计算标准差,如果array里面有nan缺失值,那么返回的是nan。但是如果我们是对于dataFrame求标准差,如果有nan,返回的是去掉nan之后序列中其他数字的标准差。std函数本身也有一个差异:np.std里面有一个参...原创 2018-03-14 10:38:54 · 584 阅读 · 0 评论 -
python技巧:变量值互换;四舍五入;设置成np.nan
python一些简单,但是很强大的函数:import numpy as np#变量的值的互换,如a,b两个向量的值互换,不能用a = b, b=a完成,需要中间变量#但是python里面用tuple也很容易的实现a = 3b = 4(a,b) = (b,a)print(b)print(a)a,b = b,aprint(a)print(b)#四舍五入round(3.45...原创 2018-04-11 15:01:16 · 1322 阅读 · 0 评论 -
python排序、得出序号各类方法大全 numpy pandas
整理了一下一行数据的排序和得出序号的各类方法,包括正序和倒序。当然还有pandas包的sort_value和sort_index两个method没有包含在这里。如果是多维的数据,需要将axis=0或者1包含进去。import numpy as npimport pandas as pd# ================================================...原创 2019-01-09 11:28:25 · 19199 阅读 · 1 评论