
学习总结
文章平均质量分 85
ML_R
厚德,博学,笃行,创新,信义仁爱,思学志远
展开
-
GitHub社区和git工具命令使用
文章目录GitHub社区和git工具配置用户名和邮箱本地打开GitBash,执行常用命令对仓库文件进行操作链接到GitHub,同步更新GitHub社区和git工具GitHub类似一个代码管理和交流的平台,git是管理代码版本的重要工具。git的存在意义是对于开发项目过程中需要多人协作完成,类似于当下的协作办公,可以一起编辑(需要授权),一起完成一个大的项目的各个模块最终汇总,完成了分布式存储和操作代码的功能。git是一个管理系统,也是一个小型的软件,在本地下载安装打开,界面为命令栏窗口。在窗口内输入相原创 2021-08-14 17:06:49 · 150 阅读 · 0 评论 -
2.特征工程:如何剔除“无效”特征
回顾上节内容特征工程就是数据加工,数据加工的本质从统计的角度看是还原真实,找到真实分布率。从机器学习角度看是在此基础上是之更加符合模型。需要先对对数据错误值(在不可改变数据源的情况下,基于现实近似于异常值(又包括了空缺值)),*但注意:异常值不一定是错误值,空缺值不一定是异常值。*需要理解,但在实际使用过程中考虑较少。至于原因由于已经在上节叙述了所以在此不做赘述。剔除特征背后的逻辑——相关性分析相对无效特征的剔除,用什么方法解决?在这之前需要先对原理进行考虑。剔除无效特征,是针对于模型预测结果来原创 2021-08-14 12:53:11 · 3535 阅读 · 0 评论