
R
文章平均质量分 88
大数据技术派
待我代码写成,便娶你为妻。
展开
-
R语言ggplot2|玩转Manhattan图-你有被要求这么画吗?
Manhattan图算是GWAS分析的标配图了,可参考Bio|manhattan图进行绘制。由于Manhattan点太多,后期AI/PS修改的话难度有点大,如果可以“个性化”绘制的话那...转载 2019-12-15 10:44:52 · 12453 阅读 · 6 评论 -
R语言简单实现决策树算法
常用的分支准则方法有三种:信息增益、信息增益率、基尼系数。其实,这里问题就来了,决策树是可以不加限制的生长到有可能到很深的吗?当然是不行的,这就是这一节需要介绍的主要内容之一决策树的修剪,当然还会对决策树算法规律稍微总结一下,并用几个小例子说明R语言的具体实现。01决策树的修剪单单根据决策树算法完成树的建立后,各个叶节点代表不同的种类,部分叶节点可能只包含少数样本,有可能还是一些异常数据,没有足够...原创 2019-11-12 08:34:00 · 3743 阅读 · 0 评论 -
R语言(绘图入门)
原文链接:https://wklchris.github.io/R-plotting-basic.htmlR 的绘图功能一直为业内所津津乐道。用了 Python 的 ma...转载 2019-03-11 20:22:48 · 10843 阅读 · 1 评论 -
R语言包分类:工具类
一个合适的数据工具,能够帮助用户进行高效分析,简化项目流程.本篇文章整理了一些常见的R工具.常用工具pkgsearch:在CRAN中查找R包cleaner: 快速、简单的数据预处理...转载 2020-07-11 11:09:20 · 922 阅读 · 0 评论 -
R语言资源整理——史上最全
R语言可以说是数据科学领域的头号种子了,而且相比于其他语言R更容易上手,对编程经验的要求也不高。只需要几行R代码,就可以完成Excel几个小时的工作。同样,几行的R代码,...原创 2019-10-11 07:30:00 · 1489 阅读 · 0 评论 -
R语言排名第8 | 2020 年 7 月编程语言排行榜
TIOBE 2020 年 7 月份的编程语言排行榜已经公布,官方的标题是:R 语言的排名达到了历史最高位。R 语言一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。也有人...转载 2020-07-09 08:40:00 · 1697 阅读 · 0 评论 -
R语言文本分词之——Rwordseg包
Rwordseg是一个R环境下的中文分词工具,使用 rJava 调用 Java 分词工具 Ansj,所以需要安装并且配置java环境(也就是jdk)。Ansj 也是一个...原创 2017-12-29 12:17:59 · 1048 阅读 · 0 评论 -
R语言安装一些包的一些常见问题及经验之谈的解决办法
R语言解释器自带有一些系统包,对于大多数人来说够用了,但是这些基础包通常不能满足我们的需要,这时候就需要从互联网下载一些第三方或者官方包以满足我们的需要。不光是R语言,包...原创 2019-03-29 22:08:32 · 20339 阅读 · 0 评论 -
R语言(ggplot2绘图)
原文链接:https://wklchris.github.io/R-ggplot2.htmlggplot2 的语法与 R 原生的语法并不统一,但是熟悉起来也并不复杂。它主...转载 2019-03-12 21:08:55 · 7810 阅读 · 0 评论 -
R语言文本分词之——结巴分词
"结巴"中文分词的R语言版本,支持最大概率法,隐式马尔科夫模型,索引模型,混合模型,共四种分词模式,同时有词性标注,关键词提取,文本Simhash相似度比较等功能。项目使...转载 2017-12-31 20:15:49 · 3044 阅读 · 1 评论 -
R语言(数据结构)——学习一门语言的根基
原文链接:https://wklchris.github.io/R-data-structure.html本节介绍 R 的数据类型,包括 data.frame 相关的重要...转载 2019-03-16 19:54:03 · 521 阅读 · 0 评论 -
R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)...
作者:穆晨来源:https://www.cnblogs.com/muchen/p/5310732.html阅读目录数据分布图简介绘制基本直方图基于分组的直方图绘制密度曲线绘制基本...转载 2019-12-31 13:05:57 · 13633 阅读 · 0 评论 -
R语言(常用函数与数据管理)
原文链接:https://wklchris.github.io/R-manage-data.html本节内容可应用在数据读取之后。包括基本的运算(包括统计函数)、数据重整...转载 2019-03-13 20:02:37 · 1887 阅读 · 0 评论 -
阿里云大学免费R语言学习视频
刚才在阿里云大学看大数据视频时看到的免费R语言学习视频!这里分享给大家!https://edu.aliyun.com/course/27?spm=5176.1073149...转载 2018-01-11 00:08:40 · 603 阅读 · 0 评论 -
学习R语言有没有前途
最开始我只是想把自己在浏览 GitHub 过程中,发现的有意思、高质量、容易上手的项目收集起来,这样便于以后查找和学习。后来打算把这些有意思、有价值的开源项目分享给大家。...转载 2018-11-25 22:39:26 · 1160 阅读 · 0 评论 -
R语言(数据读写操作)
原文链接:https://wklchris.github.io/R-read-data.html本节介绍一些实用的数据处理函数(如行、列合并),以及如何从各种数据源读、写...转载 2019-03-18 21:45:39 · 4287 阅读 · 0 评论 -
小结:jieba分词的Python与R语言基础用法介绍
人们说话不是一个词一个词崩出来的,文章也就由句子组成。要想让机器识别美文,体会中华名族汉语的博大精深,不是不可能。但是,首先需要将其转化成其可以识别的模式——词语。分词是...转载 2018-04-12 22:07:39 · 799 阅读 · 0 评论 -
R语言爬虫爬取招聘网招聘信息
R语言爬取招聘网上的招聘信息,虽然R做爬虫确实没python专业,但是有一个包rvest我觉得还不错,我尝试爬取58同城招聘网上的数据。rvest包,用到的函数有:rea...原创 2018-09-02 11:23:03 · 1281 阅读 · 0 评论 -
R语言必看(入门常识及风格指导)
原文链接:https://wklchris.github.io/R-learning-basic.html#%E9%A3%8E%E6%A0%BC%E6%8C%87%E5%...转载 2019-03-22 20:43:14 · 2052 阅读 · 0 评论 -
R语言读取xlsx文件
关于R语言读取Excel文件,比较麻烦,我从来都反对直接读取xlsx文件,因为爬虫数据时,一般保存的格式都是csv文件,或者直接保存到数据库里面,没有谁会保存到Excel...原创 2017-10-28 13:29:50 · 12742 阅读 · 1 评论 -
R语言读取csv文件
csv文件一般是用的最多的数据文件格式,这一节主要介绍怎么读取csv文件。这个文件这里在D盘根目录下面有一个csv文件,可以下面对其进行一些操作。读取文件> dat...原创 2017-10-22 20:39:24 · 5047 阅读 · 0 评论 -
决策树之剪枝算法手动计算+R语言简单实现——(二)
目录决策树的修剪决策树规则提取决策树算法小结R语言小例子在上一篇我们介绍了,决策树的数据准备与决策树的生长,也用一个小例子手动计算了决策树的生长分支过程。常用的分支准则方法有三种:信息增益、信息增益率、基尼系数。其实,这里问题就来了,决策树是可以不加限制的生长到有可能到很深的吗?当然是不行的,这就是这一节需要介绍的主要内容之一决策树的修剪,当然还会对决策树算法规律稍微总结一下,...原创 2019-01-19 11:42:40 · 5741 阅读 · 0 评论 -
K-means算法通俗原理及Python与R语言的分别实现
K均值聚类方法是一种划分聚类方法,它是将数据分成互不相交的K类。K均值法先指定聚类数,目标是使每个数据到数据点所属聚类中心的总距离变异平方和最小,规定聚类中心时则是以该类数据点的平均值作为聚类中心。K均值法原理与步骤对于有N个数据的数据集,我们想把它们聚成K类,开始需要指定K个聚类中心,假设第i类有ni个样本数据,计算每个数据点分别到聚类中心的距离平方和,距离这里直接用的欧式距离,还有什么...原创 2019-01-19 10:47:51 · 713 阅读 · 0 评论 -
jieba分词的Python与R语言基础用法介绍
人们说话不是一个词一个词崩出来的,文章也就由句子组成。要想让机器识别美文,体会中华名族汉语的博大精深,不是不可能。但是,首先需要将其转化成其可以识别的模式——词语。分词是自然语言处理(NLP)中最底层、最基本的模块,分词精度的好坏将直接影响文本分析的结果。这里介绍著名的分词方法:结巴分词以及基本分词方法在Python和R语言中的用法。Python中的结巴分词 Python中文分词的三种...原创 2019-01-19 10:32:08 · 2313 阅读 · 0 评论 -
R语言爬虫之rvest包——基础详细介绍+示例
分享一个大神的人工智能教程。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到人工智能的队伍中来!点击浏览教程都说Python爬虫功能强大,其实遇到动态加载或者登陆网站Python还是很困难,对于大部分的一些普通爬虫,R语言还是很方便。这里介绍R语言rvest包爬虫,主要用到函数:read_html()、html_nodes()、html_text()和html_attrs()。安...原创 2019-01-19 10:28:46 · 16983 阅读 · 11 评论 -
基于30多万条招聘信息的热门城市、地域 、薪资、人才要求的R语言数据可视化分析
又是一年毕业季,什么工作好找、工资高、哪些地域有优势等就是很多人关注的话题了。这里用一份2017年初,含有32万条数据(行)、19个详细招聘信息(列)的数据进行招聘信息的知识发现、挖掘。数据部分截图如下: 需要完成的工作 1、数据预处理; 2、每个行业的招聘次数、平均工资分析; 3、学历要求与平均工资分析; 4、不同工作经验的招聘次数、平均工资分析; 5、不同职位的发展前景分...原创 2018-08-05 11:08:47 · 2125 阅读 · 5 评论