
个人笔记
应威韬(Vin)
这个作者很懒,什么都没留下…
展开
-
one hot编码;python_pandas中的get_dummies使用
一句话概括:one hot编码是将类别变量转换为机器学习算法易于利用的一种形式的过程。通过例子可能更容易理解这个概念。假设我们有一个迷你数据集:公司名类别值价格VW120000Acura210011Honda350000Honda310000其中,类别值是分配给数据集中条目的数值编号。比如,如果我们在数据集中新加入一个公司,那么我们会给这家公司一个新类别值4。当独特的条目增加时,类别值将成比例增加...转载 2018-06-04 11:10:10 · 3281 阅读 · 0 评论 -
Pandas中resample方法详解
Pandas中的resample,重新采样,是对原样本重新处理的一个方法,是一个对常规时间序列数据重新采样和频率转换的便捷的方法。方法的格式是:DataFrame.resample(rule, how=None, axis=0, fill_method=None, closed=None, label=None, convention='start',kind=None, loffset=None...转载 2018-06-04 11:35:11 · 1457 阅读 · 0 评论 -
【python】python—命名规范
文件名全小写,可使用下划线包应该是简短的、小写的名字。如果下划线可以改善可读性可以加入。如mypackage。模块与包的规范同。如mymodule。类总是使用首字母大写单词串。如MyClass。内部类可以使用额外的前导下划线。 函数&方法函数名应该为小写,可以用下划线风格单词以增加可读性。如:myfunction,my_example_function。*注意*:混合大小写仅被允许用于这...转载 2018-06-04 15:29:09 · 248 阅读 · 0 评论