
数据分析
文章平均质量分 96
做一只猫
这只猫很懒,什么都没留下
展开
-
Scikit-learn (sklearn)速通 -【莫凡Python学习笔记】
定义模块方式 KNeighborsClassifier(), 用 fit 来训练 training data,这一步就完成了训练的所有步骤, 后面的 knn 就已经是训练好的模型,可以直接用来 predict 测试集的数据, 对比用模型预测的值与真实的值,可以看到大概模拟出了数据,但是有误差,是不会完全预测正确的。例如 20 个属性只变成 2 个,注意,这不是挑出 2 个,而是压缩成为 2 个,它们集合了 20 个属性的所有特征,相当于把重要的信息提取的更好,不重要的信息就不要了。原创 2024-01-27 20:33:09 · 1524 阅读 · 0 评论 -
【数据分析】matplotlib、numpy、pandas速通
由于csv便于展示,读取和写入,所以很多地方也是用csv的格式存储和传输中小型的数据,为了方便教学,我们会经常操作csv格式的文件,但是操作数据库中的数据也是很容易的实现的。可视化工具中的github,相比于matplotlib更为简单,图形更漂亮,同时兼容natplotlib和pandas,使用简单,照着文档写即可。视图的操作,一种切片,会创建新的对象a,但是a的数据完全由b保管,他们两个的数据变化是一致的。列索引,表名不同列,纵向索引,叫columns,1轴,axis=1。原创 2024-01-23 21:40:50 · 1434 阅读 · 0 评论