- 博客(4)
- 收藏
- 关注
原创 【数据清洗】总结
写在前面(201908):数据质量问题往往会影响到工作效果,我们学习现代工具后,很容易就建立起一个初步的模型。但是真正的工作是如何优化它,而关键节点就包括数据的清洗和模型的调优。就好比想要做一道好菜,就需要好的原材料和好的制作手法。而不同的数据处理方法,也跟模型的需要息息相关。因此理解模型对数据的要求也是对做好一道菜的必要知识点。这里先参考相关材料,记录下常规的数据清洗方法,并持续更新。内容...
2019-08-24 00:35:10
4623
原创 决策树-py
my_data=[[‘slashdot’,‘USA’,‘yes’,18,‘None’],[‘google’,‘France’,‘yes’,23,‘Premium’],[‘digg’,‘USA’,‘yes’,24,‘Basic’],[‘kiwitobes’,‘France’,‘yes’,23,‘Basic’],[‘google’,‘UK’,‘no’,21,‘Premium’],[’(dir...
2019-08-12 23:35:28
265
原创 SAS编程 社交网络关系分群方法
分享一个社交网络关系分群的方法,如下:数据集在最后%macro rungroupi(id=);%let length1 = 1;%let length2 = 2;proc sql noprint; create table tmp_rlist as select * from T_list_result where cser = &&clist&id.;qu...
2019-06-30 14:13:50
745
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人