
数据科学
文章平均质量分 69
liskol
这个作者很懒,什么都没留下…
展开
-
数据科学/机器学习项目流程 -- 特征工程
目录1 特征工程定义2 特征工程流程步骤2.1 数据获取2.2 特征理解2.3 特征改进数据清洗数据编码2.4 特征构造2.5 特征选择2.6 特征转换2.7 特征学习数据项目中数据遵循“Garbage In, Garbage Out”, 数据和特征决定模型的上限,算法只是趋于这个上限。用不好的数据进行分析会产生不好或无用的结论。项目过程中70%的时间花在特征工程上。1 特征工程定义特征工程(Feature Engineering)是将原始数据转化成.原创 2021-11-23 16:21:34 · 1917 阅读 · 0 评论 -
机器学习项目流程
1. 确定评估标准,如Accuracy, Precision, Recall, running time等。评估标准将用于评估training set, test set 和 validation set。2. 数据预处理(特征工程),数据清洗,数据补全,维度变换,提取有用特征,等。3. 分割Train/test/validation(hold out) set, 对多个分布的数据,每个分布均提取train/test/validation set,保证train/test/validation se原创 2021-11-18 20:31:21 · 1145 阅读 · 0 评论 -
Machine Learning算法总结
原创 2021-11-18 14:56:09 · 712 阅读 · 0 评论