
大数据,R语言,数据分析,数据挖掘
yepeng2007fei
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Mysql数据库创建表——标准模板
Mysql数据库创建表——标准模板,这个模板是公司制定的规范,特分享出来。CREATE TABLE user ( `id` bigint(11) NOT NULL AUTO_INCREMENT, `user_id` bigint(11) NOT NULL COMMENT ‘用户id’ `username` varchar(45) NOT NULL COMMENT '真实姓名', `email` varchar(30) NOT NULL COMMENT ‘用户邮箱’, `nicknam...原创 2021-02-04 10:28:34 · 2972 阅读 · 1 评论 -
R语言 设置ylab每个汉字竖向排列
只看标题可能不知道啥意思,所以先上图了。从图中可以看到ylab中汉字的排列方式是从上到下的,要实现这样的效果有两个关键步骤:一是ylab不是常规的“月工作量”,而是'月\n工\n作\n量',每个汉字中间要进行换行。二是要对ylab进行旋转。下面给出代码:library(ggplot2)#数据df <- data.frame( gp = factor(rep(letters[1:3], ea...原创 2018-07-04 15:25:00 · 7197 阅读 · 0 评论 -
R语音ggplot2绘制好看的分组散点图
我们以iris数据集为例,该数据集包括花萼的长度和宽度,花瓣的长度和宽度,以及物种,如下图:本文我们要绘制不同物种下花萼的长度和宽度的分布情况,以及二者之间的相关性关系。1. 首先载入ggplot2包,library(ggplot2)2. 然后进行ggplot(data = NULL, mapping = aes(), ..., environment = parent.frame())绘制,在绘...原创 2018-06-14 18:55:53 · 44951 阅读 · 3 评论 -
判断数据是否服从某一分布(二)——简单易用fitdistrplus包(转发)
文章转发自https://www.cnblogs.com/ywliao/p/6297162.html一、对数据的分布进行初步判断 1.1 原理 对于不同的分布,有特定的偏度(skewness)和峰度(kurtosis),正态分布、均匀分布、逻辑斯谛分布、指数分布的偏度和峰度都是特定的值,在偏度-峰度图中是特定的点,而伽马分布和对数正态分布在偏度-峰度图中是一条直线,贝塔分布在偏...转载 2018-05-07 09:54:49 · 3956 阅读 · 0 评论 -
R语音 rvest爬取中国天气网所有城市未来七天天气数据并写入oracle数据库
本文使用R语音 rvest爬取中国天气网所有城市未来七天天气数据并写入oracle数据库,其中包括了如何使用R语言连接oracle数据库,以及爬取时候的简单策略,最后对爬取到的数据组装成数据框并写入数据库,可以作为R语音初中级爱好者们很好的参考例子,当然这是我很久前写的代码,很多地方没有进行优化,比如使用了for循环,其实应该封装到函数中使用sapply来处理循环以提高效率。感兴趣的朋友想与我交流原创 2018-01-04 21:48:54 · 1013 阅读 · 0 评论 -
批量读取文本文件并生成自己的肖像词云
最近经常有朋友在群里问批量文本分析方面的问题,这里我给出了批量读取文本文件并生成自己的肖像词云的一个简单例子。library(rJava)library(Rwordseg)library(RColorBrewer)library(wordcloud)library(wordcloud2)#路径dir #路径下文件名names dirname #文件数原创 2017-08-29 14:29:35 · 1507 阅读 · 2 评论 -
R语言 使用sparklyr包连接spark,遇到的问题及解决
R语言 使用sparklyr包连接spark,遇到的问题及解决点击链接加入群【R语言&大数据分析】:https://jq.qq.com/?_wv=1027&k=4CBEBJl,或加QQ群号:456726635。有任何问题可以加群跟我联系。原创 2017-07-20 11:26:26 · 2925 阅读 · 0 评论 -
R语言 使用RODBC连接oracle数据库
使用R语言有多种包可以连接oracle数据库,我今天在这里讲一下使用使用RODBC连接oracle数据库。1. 如果你的本地是windows系统的话,你需要安装oracle客户端。2. 然后需要在ODBC管理者界面配置你要进行连接的数据库数据及使用的驱动等信息。如下图所示:3. 然后在Rstudio中可以运行连接数据库的代码如下:library(RODBC)##下面原创 2017-07-13 09:36:09 · 3745 阅读 · 0 评论 -
talend与大数据分析QQ群
本群创建于2016/5/27: Talend的相关技术,Hadoop(CDH等生态版本)与Talend结合进行data integration以及ETL等相关技术的开发,R语言进行数据分析、数据挖掘与可视化。原创 2017-06-30 17:12:30 · 694 阅读 · 0 评论 -
一起大数据
本群创建于2016/5/27: Talend的相关技术,Hadoop(CDH等生态版本)与Talend结合进行data integration以及ETL等相关技术的开发,R语言进行数据分析、数据挖掘与可视化。点击链接加入群【Talend&大数据分析】:https://jq.qq.com/?_wv=1027&k=49vRiAm原创 2017-06-02 15:41:09 · 431 阅读 · 1 评论