自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

转载 PySpark机器学习 ML

5 Introducing the ML Package 在前面,我们使用了Spark中严格基于RDD的MLlib包。 在这里,我们将基于DataFrame使用MLlib包。 另外,根据Spark文档,现在主要的Spark机器学习API是spark.ml包中基于DataFrame的一套模型。 5.1 ML包的介绍 从顶层上看,ML包主要包含三大抽象类:转换器、预测器和工作流。 5.1.1 转换器(...

2019-05-27 15:29:07 801

转载 PySpark机器学习 MLlib

4 Introducing MLlib MLlib 即Machine Learning Library。 4.1 载入数据并转换数据 数据集下载:births_train.csv.gz.。 创建数据集的schema: import pyspark.sql.types as typ labels = [ (‘INFANT_ALIVE_AT_REPORT’, typ.StringType()), (‘...

2019-05-27 15:26:05 824

原创 杀掉ORACLE会话的步骤

1.查看被锁的对象 SELECT b.object_name, machine, c.sid, c.serial#, b.status, d.pid, d.spid, d.addr FROM gvlockedobjecta,dbaobjectsb,gvlocked_object a, dba_objects b, gvlockedo​bjecta,dbao​bjectsb,gvsession c,...

2019-05-27 15:06:06 1546

原创 解决引入ggplot报错的问题

解决引入ggplot报错的问题 ggplot有时候会抱错找不到pandas.tslib,这个估计是pandas的版本更新后将tslib这个包移除了,才导致ggplot找不到,而ggplot中需要到tslib.Timestamp,我们可以将这些地方对Timestamp的引用路径改成pandas.Timestamp即可。可以使用pycharm编辑代码,然后按住ctrl键去到引入该类的地方。 ...

2019-02-12 15:37:06 1566

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除