- 博客(13)
- 收藏
- 关注
原创 R语言中循环、图形 10-17周六
for:for(i in 1:10) print('hello')i<-10while (i>0) {print('hello');i<-i-1} ifelse (score>0.5,print('passed'),print('Failed)options(digits=3)attach(mtcars)aggdata<-aggregate(mtcars,by=list(cyl,gear),Fun=mean,na.rm=TRUE) #基本条形图
2020-10-17 16:40:45
243
原创 R语言中数值和字符串处理函数
NA值转换data$age[data$age==99]<-NAfix(data)is.na(data)x<-c(1,2,NA,3)y<-sum(x)#y等于NA,因为X中包括NA值y<-sum(x,na.rm=TRUE)na.omit() #删除不完整的行Sys.Date() #查看系统时间月日a<-(1,2,3)is.number(a)a<-as.character(a)#数据排序newdata<-dat
2020-10-17 16:05:59
1479
原创 R语言按某一列分类求均值+绘图总结
D<-aggregate(.~K,data=data1,mean) #求数据集data1按照K分类后所有列的均值rm(list=ls()) #删除所有对象attach() #锁定某个对象with(mtcars,{print(summary(mpg)),plot(mpg,disp)} #with作用等同attachgrades<-read.table('student.csv',header=TRUE,row.namens='studentid',sep=',')#读表.
2020-10-16 22:18:04
9495
原创 R语言异常值诊断,计算box-cox值
data<-data.frame() #数据框的构建异常值诊断```ry=c(160,260,210,265,240,220,275,160,275,250) x1=c(70,75,65,74,72,68,78,66,70,65) x2=c(35,40,40,42,38,45,42,36,44,42) x3=c(1,2.4,2,3,1.2,1.5,4,2,3.2,3) shuju<-data.frame(y,x1,x2,x3) shuju lm1=lm(y~.,data=
2020-10-16 15:14:59
818
原创 绘制扇形图
import numpy as npimport seaborn as snsimport pandas as pdimport matplotlib.pyplot as pltdata= pd.read_excel('C:\\Users\\MAIBENBEN\\Desktop\\糖尿病.xls')labels=['Diabetes','No Diabetes']#plt.rcParams['font.sans-serif']=['SimHei'] 可解决中文乱码n1=data[data.O
2020-10-12 09:22:03
585
原创 画带有误差线的二分类数据的条形图
import numpy as npa=np.linspace(1,10,5) #从1到10等间隔选5个数print(b=np.mean(a))print(np.average(a,weights=[1,2,3,1,2])) #average可以在求均值的时候赋予权重np.var(a) #总体方差b=[[4,5],[6,7]]np.var(b) #求矩阵所有加起来的标准差np.std(a) #标准差画带有误差线的分类条形图import numpy as np.
2020-10-11 23:16:07
564
原创 python画箱型图,并得出正常值区间,subplot用法
import numpy as np import pandas as pdimport matplotlib.pyplot as pltdata=pd.read_excel('C:\\Users\\MAIBENBEN\\Desktop\\糖尿病.xls')data2=data.sort_value(by='Glucos') # 以葡萄糖这一列为基准进行排序t=(data==0).astype(int).sum(axis=0)#XXX.ndim 输出数组的维度,只有一个数。 XXX.s
2020-10-11 18:33:11
716
原创 python中format&map&lambda用法
>>>"{} {}".format("hello", "world") # 不设置指定位置,按默认顺序'hello world' >>> "{0} {1}".format("hello", "world") # 设置指定位置'hello world' >>> "{1} {0} {1}".format("hello", "wo...
2020-02-19 10:18:36
666
原创 用python将pdf文件转化为excel
import pdfplumber from openpyxl import Workbookwb = Workbook() # 创建文件对象ws = wb.active # 获取第一个sheetpath="C:/Users/MAIBENBEN/Desktop/郑州大学.pdf"pdf = pdfplumber.open(path)print('\n')print('开始读取数...
2020-02-18 10:58:46
3065
原创 2-17python笔记——random
函数原型: random.shuffle(x[, random])作用:用于将一个列表中的元素打乱。>>> import random>>> p = ["Python", "is", "powerful", "simple", "and so on"]>>> random.shuffle(p)>>> p['powe...
2020-02-17 11:06:59
138
原创 【python爬虫】爬取Q房网房价
from lxml import etree #从lxml中导入etreeimport requestsimport csvimport timedef writecsv(item): #定义写入函数 with open('qfang.csv','a',encoding='utf-8') as f: writer = cs...
2020-02-15 20:06:55
948
1
原创 Python与数据分析学习笔记(2)Pandas基本功能介绍
目录SeriesDataFrameSeries过滤NaN值DataFrame过滤NaN值DataFrame选取元素Seriesimport pandas as pdser = pd.Series([1,2,3,4,5],index=['a','b','e','d','c'])print(ser)a 1b 2e 3d 4c 5dtype:...
2020-02-01 16:47:29
270
原创 Python与数据分析学习笔记(1)NumPy以及Pandas基本介绍和应用
文章目录一、NumPy和Pandas基本介绍二、NumPy和Pandas安装三、NumPy常用功能介绍和简单示例一、NumPy和Pandas基本介绍NumPy和Pandas是利用Python进行数据分析的最基本的两个库,NumPy是用Python进行科学计算时所用到的基础库。它是大量Python数学和科学计算包的基础,比如Pandas库就用到了NumPy,pandas库专门用于数据分析,...
2020-01-31 21:44:48
875
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人