- 博客(5)
- 收藏
- 关注
原创 K-means算法思路与代码实现
K-means 算法0. 有监督/无监督学习有监督学习:训练集有明确答案,监督学习就是寻找问题(又称输入、特征、自变量)与答案(又称输出、目标、因变量)之间关系的学习方式。监督学习模型分为分类和回归两类。分类模型:目标变量是离散的分类型变量;回归模型:目标变量是连续性数值型变量。无监督学习:只有数据,无明确答案,即训练集没有标签。常见的无监督学习算法有聚类(clustering),由...
2019-11-12 16:07:36
828
原创 Intellij IDEA远程向虚拟机hadoop集群提交作业(好多坑)
最近在学习数据分析,用到了hadoop和spark。之前在虚拟机配置好了hadoop集群,今天想尝试一下在win10环境下,利用 IDEA 远程向虚拟机上的hadoop集群提交作业(以WordCount为例)一: 环境以及准备工作:win10 + IntelliJ IDEA 2017.1.6 + hadoop 2.8.0注意:hadoop在虚拟机和本地都要安装,安装步骤二者几乎一样,就...
2019-10-14 00:21:44
1878
2
原创 虚拟机磁盘瘦身(虚拟机内删除文件后,所占物理空间不变小)
之前由于课程需要,在虚拟机里重新编译了一个版本的内核,大小有十几个G吧。由于自己当时买电脑贪便宜(qiong)选的是256G的固态,所以硬盘本来就不太够,虚拟机所在的磁盘最近越来越小,已经变红色了,所以考虑把之前编译的4.12.3版本的linux内核删掉,释放出这宝贵的十几个G空间。但是当我兴冲冲的 rm -rf 后发现并没什么卵用,所占物理磁盘空间并没有减小,居然还增大了!!!上网一阵倒...
2019-07-25 14:03:06
18050
10
原创 python使用xlwings处理excel遇到的问题
前段时间在学python可视化,因为要操作excel,所以就了解了几个常用的python处理excel数据的库,开始我用的是 xlrd/xlwt,但是后来发现这个库好像功能不是很强大,然后又改用 xlwings,这个库功能比较完备,据说性能也更好一点。
2019-06-01 19:43:42
14658
4
原创 pyecharts安装成功但是导包出现 cannot import name 'Bar' 错误信息
刚才想学一下python可视化,了解到有一个pyecharts库很好用然后我就在pycharm里面找到pyecharts,最新版本是1.1.0吧好像然后安装,没问题。但是在导包的时候出现了问题 ===> cannot import name ‘Bar’看了很多篇博客,有的给的解决办法是:from pyecharts.charts import Bar但是我试了,Bar确实倒进去...
2019-05-19 15:31:24
13934
16
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人