邝邝的数据分析之路-优快云博客

原创 R语言常见报错及解决方法

在使用R的时候，偶尔也会遇到一些糟心的报错，本文把运行过程中遇到的一些报错和解决方案进行总结归纳。1、无法连接RPostgreSQL包连接到PG库报错内容：显示连接超时解决方案：先删除RODBC和RJDBC这两个包，然后重启R即可，因为这两个包与RPostgreSQL包有冲突2、无法安装包报错内容：在R中安装几个package，可是每

2017-11-29 18:24:05 14752

转载 Spark+Spark streaming+kafka简介和总结

接上文《Hadoop生态系统》，对Spark的相关内容进行总结。1、Hadoop和Spark的关系Spark是为了跟Hadoop配合而开发出来的，不是为了取代Hadoop，专门用于大数据量下的迭代式计算。Spark运算比Hadoop的MapReduce框架快的原因是因为Hadoop在一次MapReduce运算之后，会将数据的运算结果从内存写入到磁盘中，第二次MapReduce运

2017-11-27 17:03:34 6134 3

转载 Hadoop生态系统

在从事数据分析过程中，经常接触一些大数据平台的概念，但由于不是计算机专业背景，刚开始看这些专业名词的时候还是比较迷糊。最近看了一些关于hadoop生态系统的材料，本文是对这些文章材料的总结，希望可以形成对于该领域的知识体系。1、系统架构图hadoop 1.0：hadoop 2.0：2、HDFS，分布式文件系统HDFS是hadoop体系

2017-11-26 19:29:26 593

原创树模型系列之六：基于R语言的xgboost+LR实现方法及案例

本文主要介绍如何利用Xgboost+LR构建分类模型，基于真实案例用R语言来实现该算法。一、算法原理Xgboost可以用来构造新特征变量，而LR则可以把原始特征和新特征集合起来构造模型，并计算各特征的显著性和权重系数。二、利用R构造Xgboost模型原始数据，数据框格式，8个自变量，1个因变量，训练集共200万+数据，测试集90万+数据。

2017-11-24 16:24:16 14827 4

原创树模型系列之二：集成算法bagging和boosting的区别

最近在研究树模型的时候，发现目前这类模型应用范围比较广，优化算法也层出不穷，因此希望通过几篇系列文章，能够加深对树模型的认识。bagging和boosting的区别

2017-11-24 14:19:34 1758 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 R语言常见报错及解决方法

转载 Spark+Spark streaming+kafka简介和总结

转载 Hadoop生态系统

原创 树模型系列之六：基于R语言的xgboost+LR实现方法及案例

原创 树模型系列之二：集成算法bagging和boosting的区别

空空如也

空空如也

原创树模型系列之六：基于R语言的xgboost+LR实现方法及案例

原创树模型系列之二：集成算法bagging和boosting的区别