- 博客(4)
- 收藏
- 关注
原创 关于廖雪峰老师git教程的学习心得
1、Git是什么?(What)Git是目前世界上最先进的分布式版本控制系统。2、怎么理解版本控制系统?一个文件或者项目,每一次改动都被记录下来,人们需要回溯改动可以快速定位。git是这么一个软件能够自动帮助我们记录每次文件的改动,还可以让同事协作编辑,这样就不用自己管理一堆类似的文件,也不需要把文件传来传去。如果想查看某次改动,只需要在软件里喵一眼就可以了。之后更详细更新这篇博客的内容,具体参考g...
2018-06-03 17:16:37
188
转载 machine learning on spark - 第一节:基础数据结构
本节内容1.本地向量和矩阵2.带类标签的特征向量(Labeled point)3.分布式矩阵1. 本地向量和矩阵本地向量(Local Vector)存储在单台机器上,索引采用0开始的整型表示,值采用Double类型的值表示。Spark MLlib中支持两种类型的矩阵,分别是密度向量(Dense Vector)和稀疏矩阵(Spasre Vector),密度向量会存储所有的值包括零值,而稀疏向量存储的...
2018-06-03 14:48:01
440
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人