- 博客(73)
- 资源 (7)
- 收藏
- 关注
原创 python和R的方法对比 - 相同功能的命令差异
python和R的命令对比比较执行相同或近似功能下,python和R的命令对比数字操作pythonR功能说明备注输入输出输入输出功能1+231+2[1] 3加法1-2-11-2[1] -1减法2*242*2[1] 4乘法17/82.12517/8[1] 2.125非整除除法(python3中的用法)17//8217%/%8[1] 2整除除法(python3中的用法)21%41(
2020-06-03 11:47:14
400
原创 python:scikit-learn(1),基本概念
《scikit-learn机器学习 第2版》第1章 机器学习基础机器学习:通过经验学习知道未来决策机器学习分为监督学习和无监督学习监督学习:分类类别已知机器学习的输入称为解释变量,输出称为响应变量组成监督学习经验的实例集合称为训练集,衡量程序性能的实例集合称为测试集常见的监督机器学习有分类和回归分类的响应变量为离散值,回归的响应变量为连续值降维:发现对响应变量变化影响最大的特征过...
2020-03-31 15:44:50
405
原创 R:ggplot2(16),第8章 精雕细琢(1)
《ggplot2:数据分析与图形艺术》第8章 精雕细琢8.1 主题主题系统控制者图形中的非数据元素外观,它不会影响几何对象和标度等数据元素。主题的控制包括标题、坐标轴标签、图例标签等文字调整,以及网格线、背景、轴须等颜色搭配。8.1.1 内置主题图形默认等theme_gray()使用淡灰色背景白色网格线,theme_bw()为传统等白色背景和深灰色网格线。两个主题都由危机的参数base...
2019-04-20 16:10:33
1035
原创 虚拟机使用(1)
1,VMware Workstation的安装在百度中搜索VMware Workstation,之后找到Download VMware Workstation Pro点击进入页面进入页面后找到这里,然后点击进行下载。下载完成后进行安装,如果安装需要秘钥,则在百度中查找秘钥字符并且输入,在“帮助”处点击“关于”,许可证信息显示永不过期,则表示秘钥成功。2,创建linux虚拟机参考h...
2019-04-10 23:22:03
477
原创 R:ggplot2(15),第6章 标度、坐标轴和图例(3)
《ggplot2:数据分析与图形艺术》第6章 标度、坐标轴和图例6.4 标度详解6.4.4 手动离散型标度离散型标度scale_linetype(),scale_size_discrete()和scale_shape()没有选项,这些标度是按一定的顺序将因子的水平映射到一系列取值中。手动型标度创建新的标度:scale_shape_manual(),scale_linetype_manu...
2019-03-27 22:47:33
1562
原创 R:ggplot2(14),第6章 标度、坐标轴和图例(2)
《ggplot2:数据分析与图形艺术》第6章 标度、坐标轴和图例6.4 标度详解6.4.3 颜色标度映射颜色的方法很多,对于连续型值有三种基于渐变的方法,对于离散型值有两种方法。hcl色彩空间由三部分构成,分别是色相(hue)、彩度(chroma)、明度(luminance)。色相(hue)是一个0和360之间的(角度)值,它将一种色彩赋以“颜色”属性:如蓝、红、橙等等。明度(lu...
2019-03-20 21:34:32
2014
原创 R:ggplot2(13),第6章 标度、坐标轴和图例(1)
《ggplot2:数据分析与图形艺术》第6章 标度、坐标轴和图例6.3 用法每一种图形属性都拥有一个默认都标度,此标度将在我们每次使用这个图形属性时被自动添加到图形中。见表6.1。标度都种类依赖于变量都类型:标度可为连续型(变量为数值时)或离散型(变量为因子、逻辑值、字符时)。要修改默认的标度用到set_default_scale()。表6.1 按图形属性和变量类型排列的各种标度。默认标度...
2019-03-14 22:51:56
3403
1
原创 R:ggplot2(12),第5章 工具箱(4)
《ggplot2:数据分析与图形艺术》第5章 工具箱5.10 添加图形注释添加图形注释有两种基本的方式:逐个添加或批量添加。逐个添加的方式适合少量的、图形属性多样化的注解。我们只要为所有想要的图形属性设置好对应的值就可以了。如果我们需要添加多个具有类似属性的注解,将它们放到数据框中并一次添加完成也许更有效。下面的例子中,我们分别用以上两种方式,向经济数据中加入了有关美国总统的信息。&g...
2019-03-12 22:51:33
405
原创 R:ggplot2(11),第5章 工具箱(3)
《ggplot2:数据分析与图形艺术》第5章 工具箱5.8 揭示不确定性数据中存在不确定性的信息,有四类几何对象可揭示数据中不确定性的信息。具体使用哪个取决于x的值是离散型还是连续型的,以及我们是否要展示区间内的中间值,或是仅仅展示区间,见下表。变量X类型仅展示区间同时展示区间和中间值连续型geom_ribbongeom_smooth(stat=“identit...
2019-03-10 18:48:22
766
原创 R:ggplot2(10),第5章 工具箱(2)
《ggplot2:数据分析与图形艺术》第5章 工具箱5.7 绘制地图绘制中国地图:参考该博客内容:https://www.cnblogs.com/lizhilei-123/p/6734378.html> install.packages('maps')> install.packages('mapdata')&am
2018-11-20 07:20:06
428
原创 R:ggplot2(9),第5章 工具箱(1)
《ggplot2:数据分析与图形艺术》第5章 工具箱5.4 展示数据分布用更好的图形组合展示最佳的数据反映效果,直方图设定组距binwidth可显示更多数据变化的细节;不同组别数据可通过直方图进行分面,不同颜色填充,频率分布的线图来区分不同组别。> depth_dist <- ggplot(diamonds, aes(depth)) + xlim(5
2018-11-14 22:33:45
1142
原创 R:ggplot2(8),第4章 ggplot2构造图像的基本思想及总结练习(4)
讲一下各个小节都主要写了哪些内容,然后总结一下基本的思想原理。根据stat_XXX或geom_XXX的方法绘制几个有代表的图形,前面写过的也可以照搬过来,书上的那几个图也尝试着画一下,另外,4.5.3小节的图,4.5.4小节的图,4.8节的三种形式的条图,这些经常用到的图都作为例子讲出来。4.8节的线图尝试画一下,练习要讲的内容是:训练几个经典的图形:1,一个加点,加误差棒的线图2,条...
2018-11-05 21:35:21
769
原创 R:ggplot2(7),第4章 用图形构建图像(3)
《ggplot2:数据分析与图形艺术》第4章 用图形构建图像4.6 几何对象几何图形对象,简称为geom,它执行着图层的实际渲染,控制着生成的图像类型。表4.2列出了ggplot2里面所有可用的几何对象。表4.2 ggplot2中的几何对象名称描述abline线,由斜率和截距决定area面积图(area plot)bar条形图,以x轴为底的矩形...
2018-10-28 15:35:13
1378
原创 R:ggplot2(6),第4章 用图形构建图像(2)
《ggplot2:数据分析与图形艺术》第4章 用图形构建图像4.5 图形属性映射4.5.3 分组几何对象可以大致的氛围个体几何对象和群组几何对象两类,个体几何对象对数据框的每一条数据绘制一个可以区别其他个体的图形对象。群组几何对象用来表示多条观测。默认的,离散型变量的交互作用被设为分组的默认值,如果没能正确分组或者没有俩三星变量,就需要自定义分组结构。即将group映射到一个在不同的组有...
2018-10-27 11:27:53
604
原创 R:ggplot2(4),第4章 用图形构建图像(1)
《ggplot2:数据分析与图形艺术》第4章 用图形构建图像4.1 简介qplot()的局限性在于它只能使用一个数据集和一组图形属性映射,解决这个问题的办法就是使用图层。每个图层可以有自己的数据集和图形属性映射,附加的数据元素可通过图层添加到图形中。...
2018-10-22 22:29:26
640
原创 R:ggplot2(2),第2章 从qplot开始入门(2)
《ggplot2:数据分析与图形艺术》第2章 从qplot开始入门2.5 几何对象2.5.2 箱线图和扰动点图如果一个数据集中包含了一个分类变量和一个或多个连续变量,那么可以表示连续变量会如何随着分类变量水平的变化而变化。所以箱线图和扰动点图提供了各自的方法来达到这个目的。> library(ggplot2)&a
2018-10-13 10:53:55
1128
原创 R:ggplot2(1),第2章 从qplot开始入门(1)
《ggplot2:数据分析与图形艺术》第1章 简介数据的几何对象包括点、线、条形等,图形属性包括颜色、形状、大小等,可实现统计变换,设定坐标系及分面交互式图形软件包GGobi可通过rggobi软件包与R进行连接。R中图形软件包的列表,http://cran.r-project.org/web/views/Graphics.html。> install.packag
2018-10-10 23:08:50
4580
原创 R(14):第三章:3.3R语言中的绘图命令
《统计建模与R软件》薛毅第3章 数据描述性分析3.3 R语言中的绘图命令在作图函数中,有两类作图函数,一类是高水平作图函数,另一类是低水平作图函数;高水平作图函数指所有的绘图函数均可产生图形,可以有坐标轴,以及图和坐标轴的说明文字等;低水平作图函数是自身无法生成图形,只能在高水平作图函数产生的图形基础上,增加新的图形。3.3.1 高水平作图函数高水平作图函数有:plot, pairs, ...
2018-09-18 22:28:25
3071
原创 R(13):第三章:3.2数据的分布
《统计建模与R软件》薛毅第3章 数据描述性分析3.2 数据的分布3.2.2 直方图、经验分布图与QQ图1. 直方图直方图(histogram),将数据取值的范围分成若干区间(一般是等间隔的),在等间隔的情况下,每个区间长度称为组距。 R语言中,用函数hist()画出样本的直方图: hist(x, breaks=”Sturges”, freq=NULL, pr...
2018-09-15 16:18:35
1711
原创 R(11):第二章:2.10 第二章总结
《统计建模与R软件》薛毅第2章 R软件的使用总结2.1 R软件简介2.1.1 R软件的下载与安装Mac电脑上的R软件的安装: R的下载地址:https://cran.r-project.org/ 进入之后点击:Download R for (Mac) OS X 选择Lastest release中的R-3.5.1.pkg,下载后直接安装即可。2.2 数字...
2018-09-10 21:58:45
981
原创 R(12):第三章:3.1描述统计量
《统计建模与R软件》薛毅第3章 数据描述性分析统计分析分为统计描述和统计推断两个部分,统计描述是通过绘制统计图、编制统计表、计算统计量等方法来表述数据的分布特征。3.1 描述统计量要研究数据的数字特征,即分析数据的集中位置、分散程度和数据分布等。3.1.1 位置的度量用来描述定量资料的集中趋势的统计量常用的有均值、众数、中位数、百分数等。1. 均值在R语言中,可...
2018-09-06 22:01:01
2168
原创 R(10):第二章:2.9编写自己的函数
《统计建模与R软件》薛毅第2章 R软件的使用2.9 编写自己的函数函数定义的格式如下: > name <- function(arg_1, arg_2, ...) expression expression是R语言中的表达式(通常是一组表达式),arg_1, arg_2, … 表示函数的参数;表达式中,放在程序最后的信息是函数的返回值,返回值可以是向量、数组(矩...
2018-09-04 21:59:24
893
原创 R(09):第二章:2.8控制流
《统计建模与R软件》薛毅第2章 R软件的使用2.8 控制流2.8.1 分支语句分支语句包括if / else语句,switch语句。1. if / else 语句if / else 语句的格式为: if(cond) statement_1 if(cond) statement_1 else statement_2 第一句的意义是:如果条件cond成立...
2018-09-01 22:01:24
386
原创 R(08):第二章:2.7读、写数据文件
《统计建模与R软件》薛毅第2章 R软件的使用2.7 读、写数据文件2.7.1 读纯文本文件读纯文本文件由两个函数,一个是read.table()函数,另一个是scan()函数。1. read.table()函数该函数是读表格形式的文件,如果读到的纯文本文件是对应行列的,该文件的第一行为变量名,第一列为记录序号;则可利用read.table()函数读取数据,用法如下: R_...
2018-08-30 21:58:21
1625
原创 R(07):第二章:2.6列表与数据框
《统计建模与R软件》薛毅第2章 R软件的使用2.6 列表与数据框2.6.1 列表1. 列表的构造列表是一种特别的对象集合,它的元素也由序号(下标)区分,但是各元素的类型可以是任意对象,不同元素不必是同一类型,元素本身允许是其他复杂数据类型,比如,列表的一个元素也允许是列表,例子: > Lst &amp
2018-08-29 23:15:03
1080
原创 R(06):第二章:2.5多维数组和矩阵(2)
《统计建模与R软件》薛毅第2章 R软件的使用2.5 多维数组和矩阵总结:2.5.3 数组的四则运算可以对数组之间进行四则运算(+, -, *, /),这时进行的是数组对应元素的四则运算,参加运算的数组一般应该是相同形状的(即dim属性完全相同),例如: D <- 2*C+A/B; D 数组的加、减法运算和数乘运算满足原矩阵运算的性质,数组即数乘数加减,都是数组及数...
2018-08-28 08:50:21
1508
原创 R(05):第二章:2.5多维数组和矩阵(1)
《统计建模与R软件》薛毅第2章 R软件的使用2.5 多维数组和矩阵总结2.5.1 生成数组或矩阵数组(array)可以看成是带多个下标的类型相同的元素的集合,常用的是数值型的数组如矩阵,最常见的是二维数组。 数组有一个特征属性叫做维数向量(dim属性),维数向量是一个元素取正整数值的向量,其长度是数组的维数,比如维数向量有两个元素时数组为二维数组(矩阵)。维数向量...
2018-08-25 21:46:56
684
原创 R(04):第二章:2.4因子
《统计建模与R软件》薛毅第2章 R软件的使用2.4 因子统计中的变量有几种重要类别:区间变量、名义变量和有序变量。区间变量取连续的数值,可进行求和、平均值等运算。名义变量和有序变量取离散值,可以用数值代表,可以是字符型值,其具体数值没有加减乘除的意义,不能用来计算,而只能用来分类或计数。名义变量如性别、省份、职业。有序变量如班级、名次。2.4.1 factor()函数离...
2018-08-25 17:13:29
371
原创 R(03):第二章:2.3 对象和它的模式与属性(1)
《统计建模与R软件》薛毅第2章 R软件的使用2.3 对象和它的模式与属性描述:R是一种基于对象的语言,R的对象包含了若干个元素作为其数据,另外,还可以有一些特殊数据称为属性(attribute),并规定了一些特定的操作(如打印、绘图)。比如,一个向量是一个对象、一个图形也是一个对象。R对象分为单纯(atomic)对象和复合(recursive)对象两种,单纯对象的所有元素都是同一种基本...
2018-08-23 21:52:56
389
原创 R(02):第二章:2.2数字、字符与向量(2)
《统计建模与R软件》薛毅第2章 R软件的使用2.2 数字、字符与向量2.2.2 产生有规律的序列1. 等差数列a:b表示从a开始,逐项加1(或减1),知道b为止,如x<- 1:30表示向量x=(1, 2, …, 30),x<- 30:1表示向量x=(30, 39, …, 1)。当
2018-08-22 22:22:46
572
原创 R(01):第二章:2.2数字、字符与向量(1)
《统计建模与R软件》薛毅第2章 R软件的使用2.1 R软件简介2.1.1 R软件的下载与安装Mac电脑上的R软件的安装: R的下载地址:https://cran.r-project.org/ 进入之后点击:Download R for (Mac) OS X 选择Lastest release中的R-3.5.1.pkg,下载后直接安装即可。2.1.2 初始R软件...
2018-08-21 22:42:13
455
原创 python:ggplot(2)- 图形画法
第一章:python:ggplot第2节:python:ggplot图形画法1,绘制散点图,geom_point()读取外部数据进行绘图,例子: >>> import pandas as pd >>> from ggplot import * >&gt
2018-04-10 21:30:25
9986
2
原创 python:ggplot(1)- 绘图介绍
第一章:python:ggplot第1节:python:ggplot基本概念1,ggplot简单介绍python的常用可视化包:Matplotlib,基于该包的二次开发的包(Pandas,Seaborn,ggplot) 动态图的绘制:Plotly,pyecharts(可在网页中展示动态图)ggplot读取的数据格式为pandas的DataFrame,ggplot主要主要绘图...
2018-04-10 09:07:47
17688
2
原创 python:16:多进程编程
第一章:python第16节:多进程编程多进行变量的两种写法1,函数apply_async具体写法如下: from multiprocessing import Pool #首先要导入模块,进程池的模块导入方式可以这样编写 import time #时间用于检测运行程序的运行状态 import osdef exonerate(name): #这个函数时程序运行内容,主...
2018-04-09 10:23:28
343
原创 python:15:正则表达式
第一章:python第15节:正则表达式1,正则表达式正则表达式(RE)为高级文本模式匹配,以及搜索-替代等功能提供了基础。 Python通过标准库的re模块支持正则表达式(RE) >>> import re2,正则表达式中常见的符号和字符《python核心编程(第二版)》书中443页记录了常见的正则表达式符号和字符 表15.1 ...
2018-04-08 21:14:00
1029
原创 python:14:类(2)-- 多态和继承
第一章:python第14节:类1,类的特性类的三大特性包括,封装、多态和继承 类的多态是指同一个方法在不同类当中会有不同的功能 下面着重讲一下类的继承2,子类和派生创建子类的语法为:一个类名,后跟一个或多个需要从其中派生的父类: >>> class SubClassName(ParentClass1 [, ParentClass2, ....
2018-04-06 19:09:29
350
原创 python:14:类(1)-- 类的属性和方法
第一章:python第14节:类1,类与对象,类的简单介绍1)类表示一类实物的集合,类与实物的相互关系表示为,类是对象的定义,而实物存放了类中所定义的对象的信息。 2)面向对象编程的设计思路为: ····1> 确定对象的属性和方法 ····2> 抽象具有共同特征的对象为一类 ····3> 设计类和类之间的关系 ····4> 实例化对象 3)类...
2018-04-05 17:27:17
946
原创 biopython:2:序列组成
第一章:biopython第二节:序列组成1,序列的特性生物信息当中的序列(DNA、RNA、amino acid)与python当中的字符串有两点不同(其余属性大致相同,比如序列长度,可以进行切片等) 第一点不同:序列有 translate() ,即翻译;序列有reverse_complement() ,即反向互补序列(反向互补序列一般对DNA序列而言) 第二点不同:序列存...
2018-03-04 23:20:49
3273
基因组tRNA预测
2017-11-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人