自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 用hive语句走过的坑

1.在sqlServer中有isnull 函数,但是hive不支持,只能用case when 字段 is null then 0 else 字段 end as 字段 2.hive  join 表时 join 的表不能是带括号的,如果必须jion这种条件生成的表,需要根据条件生成临时表 错误写法: spark.sql(""""select a.*,b.* from a join (selec...

2019-01-25 16:01:57 1598

原创 机器学习平台数据归一化总结

最近开发数据 归一化的需求,归一化的方法是对将需要处理的列转化为Vector,然后将df放到方法里面去执行,得到新的df 如果保留原始类,这个df只需要重新拆分,就可以 如果不保留原始列,这个df拆分后,还要进行新的判断,将处理后的列值替代原来的值   1._*  用法: 1)变长参数 如将vector 追加至原始df的时候 已经处理的列   val vec=features2Vec...

2019-01-07 15:04:16 265

原创 机器学习实战----kNN近邻算法问题记录

1.import kNN。报错:only 2 non-keyword arguments accepted 原因:group =array([1.0,1.1],[1.0,1.0],[0,0],[0,0.1]) 粗心少写了两个中括号 正确写法: group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]]) 2.AttributeError: 'dict' ...

2018-10-10 18:35:31 298

原创 Scala学习笔记(三)

第四章 元组和映射 (快学scala) 4.1构造映射 A.不可变映射 val scores=Map("Alice"->10,"Bob"->3,"Cindy"->8) B.可变映射 val score=scala.collection.mutable.Map("Alice"->10,"Bob"->3,"Cindy"->8) C.空的映射,选定映射实现并给定映射参数 val score

2018-01-08 14:05:23 325

原创 Scala学习笔记

1.高级for循环和for推导式 a.变量 for(i b.for循环的循环体以yield开始 ,for循环推导式 for(i for{i1 to 3 from=4-i j3 } 2.编写一个函数countdown(n:Int),输出n到0的数字 def countdown(n:Int) :Unit={ for(i countdown(10) 思路:首先满足递减,其次要

2018-01-08 09:37:21 953

原创 linux操作

1.查找定时任务的命令  crontab -l  2.编辑定时任务的内容 crontab -e 3.删除所有的定时任务 crontab -r  4.python生成的文件指定存储路径 def wfile(path,cur): sql = 'select * from parts_num ' cur.execute(sql) rows = cur.fetchall();

2018-01-04 13:11:26 217

原创 Scala学习笔记

第二章 控制结构和函数(快学scala) 1.条件表达式 1)scala中 if/else表达式有值 例:  var x=1 if (x>0) 1 else -1 2)scala中有混合类型的表达式 if (x>0) "positive" else -1 上述表达式的类型是公共超类型 ,Any 3)esle部分缺失(每个表达式都应该有某种值) if (x>0) 1

2017-12-22 13:15:39 342

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除