
数据分析挖掘
文章平均质量分 53
kwu_ganymede
Spark高级工程师
展开
-
Windows服务器下设置R脚本自动运行
[Author]: kwu Windows服务器下设置R脚本自动运行原创 2015-10-13 11:27:17 · 1924 阅读 · 0 评论 -
python基础练习(五)—— 数据清洗补全处理
python基础练习(五)—— 数据清洗补全处理原创 2016-05-02 23:20:16 · 7796 阅读 · 2 评论 -
安装Python交互式数据处理工具——IPython
安装Python交互式数据处理工具——IPythonIPython是Python科学计算标准工具集的组成部分,它将其他所有的东西联系到了一起。它为交互式和探索式计算提供了一个强健而高效的环境。它是一个增强的Python shell,目的是提高编写、测试、调试Python代码的速度。它主要用于交互式数据处理和利用matplotlib对数据进行可视化处理。原创 2016-05-28 13:38:56 · 1034 阅读 · 0 评论 -
Java\Scala\Python三种语言求解经典编程实例(一)——求水仙花数
Java\Scala\Python三种语言求解经典编程实例(一)——求水仙花数原创 2016-05-28 16:22:52 · 4159 阅读 · 0 评论 -
python基础练习(六)—— 绘图与可视化
python基础练习(六)—— 绘图与可视化原创 2016-05-16 00:11:38 · 2306 阅读 · 1 评论 -
Spark-MLlib机器学习相关的数据类型
Spark-MLlib机器学习相关的数据类型原创 2016-04-21 00:29:18 · 921 阅读 · 0 评论 -
python基础练习(四)—— 读取文件内容
python基础练习(四)—— 读取文件内容原创 2016-04-24 18:29:35 · 1447 阅读 · 0 评论 -
Java\Scala\Python三种语言求解经典编程实例(四)—— 求10000以内的自守数
Java\Scala\Python三种语言求解经典编程实例(四)—— 求10000以内的自守数原创 2016-06-07 23:21:29 · 2704 阅读 · 0 评论 -
Linux下创建并执行python脚本
Linux下创建并执行python脚本原创 2016-03-27 00:09:38 · 28337 阅读 · 0 评论 -
CentOS基于yum源安装R
CentOS基于yum源安装R原创 2016-06-16 19:04:19 · 878 阅读 · 0 评论 -
Spark-MLlib实例——逻辑回归
Spark-MLlib实例——逻辑回归,应用于二元分类的情况,这里以垃圾邮件分类为例,即是否为垃圾邮件两种情况。原创 2016-04-17 23:58:36 · 5062 阅读 · 0 评论 -
python基础练习(三)—— numpy的矩阵基本操作
python基础练习(三)—— numpy的矩阵基本操作原创 2016-04-17 11:42:43 · 1831 阅读 · 0 评论 -
python基础练习(二)—— 数据分析包numpy数组操作
python基础练习(二)—— 数据分析包numpy数组操作原创 2016-04-10 14:06:54 · 4803 阅读 · 1 评论 -
原生python与numpy数组向量相加效率对比
原生python与numpy数组向量相加效率对比原创 2016-04-09 22:44:07 · 6378 阅读 · 0 评论 -
基于Spark的机器学习经验
基于Spark的机器学习经验转载 2016-02-19 16:29:25 · 1369 阅读 · 3 评论 -
【解决】kettle启动时出现的Java Runtime Environment异常
【解决】kettle启动时出现的Java Runtime Environment异常,启动出现如下异常原创 2015-10-13 13:45:50 · 4760 阅读 · 1 评论 -
CentOS6安装与运行R脚本
R语言是常用的数据分析工具,本文介绍CentOS6安装与运行R脚本:原创 2015-10-13 13:30:10 · 1166 阅读 · 0 评论 -
python字符串与数字的转化
python字符串与数字的转化转载 2016-03-31 17:13:48 · 4752 阅读 · 0 评论 -
python基础练习(一)——自定义函数,数学运算,命令行输入
python基础练习(一)——自定义函数,数学运算,命令行输入原创 2016-03-31 18:11:11 · 7278 阅读 · 0 评论 -
基于spark1.4.1的sparkR的实例操作
基于spark1.4.1的sparkR的实例操作,sparkR的操作基本语法与R一致,其中添加了rJava、rhdfs、SparkR的依赖库的支持。原创 2015-10-13 13:42:01 · 1038 阅读 · 0 评论 -
基于CDH5.4的Spark1.4.1下SparkR的部署
基本CDH5.4的Spark1.4.1下SparkR的部署,R与Spark的结合为数据分析提供高效的解决方案,Hadoop的中hdfs为数据分析提供分布式存储。本文介绍集成安装的步骤:原创 2015-10-13 13:32:24 · 1155 阅读 · 0 评论 -
sparkR集群启动脚本的封装
sparkR默认是以单机方式运行的。实现sparkR的集群启动,需要指定master地址,占用内存、CPU,及UI端口等,这对分析人员来说是比较麻烦的。如何实现对其启动的封装,方便分析人员来使用:原创 2015-10-13 13:40:44 · 874 阅读 · 0 评论 -
Java\Scala\Python三种语言求解经典编程实例(三)—— 不重复的3位数
Java\Scala\Python三种语言求解经典编程实例(三)—— 不重复的3位数原创 2016-06-07 22:40:06 · 1053 阅读 · 0 评论