自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 正确安装gdal库:ModuleNotFoundError: No module named ‘osgeo‘

正确安装gdal库的方法

2022-09-12 18:26:17 10080 7

原创 Latex安装以及作业笔记

Latex安装参考:怎么安装LaTex - 半句多的文章 - 知乎https://zhuanlan.zhihu.com/p/56982388作业1、文档相关说明:2、公式写法:https://blog.youkuaiyun.com/weixin_30892037/article/details/97464655?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-9&utm_source=di

2021-10-10 11:36:26 221

原创 python|6.2构建并评价聚类模型

6.2.1使用sklearn估计器构建据类模型#使用sklearn估计器构建K-Means聚类模型from sklearn.datasets import load_irisfrom sklearn.preprocessing import MinMaxScalerfrom sklearn.cluster import KMeansiris=load_iris()iris_dat...

2019-10-17 20:04:04 764

原创 python|6.1使用scikit-learn转换器处理数据

model_selection模型选择模块preprocessing数据预处理模块decompisition特征分解模块实现数据预处理与模型构建前的数据标准化、二值化、数据集的分割、交叉验证和PCA降维等工作6.1.1加载datasets模块中的数据集#加载breast_cancer数据集from sklearn.datasets import load_breast_cancer...

2019-10-17 14:38:51 539

原创 python|pandas|5.4转换数据

1.哑变量处理类别型数据#哑变量处理类别型数据方法get_dummiespandas.get_dummies(data,prefix=None,prefix_sep=',',dummy_na=False,columns=None,sparse=False,drop_first=False)2.使用等宽法、等频法、聚类分析法离散化连续数据import pandas as pd...

2019-10-11 15:26:56 307

原创 python|pandas|5.3标准化数据

离差标准化数据标准差标准化数据小数定标标准化数据import pandas as pdimport numpy as npdetail=pd.read_csv('E:\大三上\张宇萌\实习任务安排(2019-10-10)\detail.csv',index_col=0,',encoding='gbk')#离差标准化#自定义离差标准化函数def minmaxscale(dat...

2019-10-11 14:08:26 735

原创 python|jupyter|pandas|5.2清洗数据

检测与处理重复值重复的类型:1.记录重复2.特征重复:有一个或多个特征名称不同,但数据完全相同记录重复#1.用list去重import pandas as pddetail=pd.read_csv('E:\大三上\张宇萌\实习任务安排(2019-10-10)\detail.csv',index_col=0,encoding='gbk')#定义去重复def delrep(list1...

2019-10-10 17:01:13 4288

原创 python|jupyter|pandas|5.1合并数据

1.堆叠#横向堆叠concatpandas.concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False,keys=None,lebels=None,names=None,verify_integrity=False,copy=True)#axis=0 按照X轴拼接 :行对齐,合并列(左右拼接)#inner 内连接 交集...

2019-10-10 16:15:24 6140 2

原创 python|jupyter||pandas|4.5创建透视表和交叉表

4.5创建透视表和交叉表使用pivot_table函数创建透视表pandas.pivot_table(data,values=None,index=None,columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,margins_name='All')#使用订单号作为透视表索引制作透视表import p...

2019-10-09 09:48:32 1065

原创 python|jupyter|pandas|4.4使用分组聚合进行组内计算

4.4使用分组聚合进行组内计算使用groupby拆分数据DataFrame.groupby(by=None,axis=0,level=None,as_index=True,sort=True,group_keys=True,squeeze=False,**kwargs)import pandas as pdimport numpy as npfrom sqlalchemy impo...

2019-10-08 23:14:02 4191 2

原创 python|jupyter|pandas|4.3转换与处理时间序列数据

4.3转换与处理时间序列数据数据分析的分析对象:数值型、类别型、时间类型转换字符串时间为标准时间#前面import pandas as pdorder1=pd.read_table('E:\大三上\张宇萌\实习任务安排(2019-9-26)/meal_order_info.csv',sep=',',encoding='gbk')#转换print('转换前订单信息表lock_tim...

2019-10-08 18:35:13 3853

原创 python|jupyter|padas|dataframe|4.2Dataframe基本操作

4.2 Dataframe基本操作介绍dataframe最常用的padas对象,类似于excel表格。完成数据读取后,数据以Dataframe结构存储1.查看Dataframe常用属性values 元素index 索引columns 列名dtypes 类型size:元素个数ndim:维度数shape:数据形状(行、列数目)T:转置(行列转换)#导入from sql...

2019-10-07 21:04:55 1322

原创 python|jupyter notebook|padas|读、写Excel文件

(一)读基本函数read_excelread_table语法padas.read_excel(io,sheetname=0,header=0,index_col=None,names=None,dtype=None)参数读取exceluser=pd.read_excel('E:\大三上\张宇萌\实习任务安排(2019-9-26)\users.xlsx')print('客户信...

2019-10-07 19:14:54 5160

原创 python|jupyter noetebook|padas|读、写文本文件(csv)

(一)读1.1基本函数read_tableread_csv1.2语法padas.read_table(filepath,sep='\t',header='infer',names=None,index_col=None,dtype=None,encoding=utf-8,engine=None,nrows=None)padas.read_csv(filepath,sep=',',h...

2019-10-07 18:50:20 1880

原创 navicat|mysql|报错|client does not support authentication

参考:https://blog.youkuaiyun.com/choumin/article/details/89513943外部组件错误解决方法:输入:mysql> alter user 'root'@'localhost' identified with mysql_native_password by '123456';//123456是密码,注意要加封号Query OK, 0 ro...

2019-10-07 16:08:16 178

原创 python|jupyter notebook|padas|读、写数据库数据

1.数据库数据padas库:函数与方法read_sql():读取、查询(综合)read_sql_table():读取表格read_sql_query():查询#语法#1. padas.read_sql(sql,con,index_col=None,coerce_float=True,columns=None)#2. padas.read_sql_table(table_nam...

2019-10-07 16:02:55 1169

原创 python|jupyter notebook|jieba|句子分词

用python jieba进行句子分词一、安装jiebapip install jieba二、常用函数jieba.lcut(s)jieba.lcut(s,cut_all=True)

2019-09-29 08:51:02 3358 3

原创 python|jupyter notebook|绘制直方图、饼图、箱线图

教材:《Python数据分析与应用》黄红梅、张良均3.3分析特征内部数据分布与分散状况直方图函数:bar语法:matplotlib.pyplot.bar(left,height,width=0.8,bottom=None,hold=None,data=None,**kwargs)#left:x轴数据height:x轴所代表数据的数量width:直方图宽度(0-1)import ...

2019-09-27 13:28:31 24534 2

原创 python|jupyter notebook|绘制散点图、折线图

导入:jupyter notebook——是一个交互式笔记本,支持运行 40 多种编程语言matplotlib.pyplot——python数据可视化numpy——Python的开源的数值计算扩展(数组)教材:《Python数据分析与应用》黄红梅、张良均3.2分析特征间的关系散点图特征:揭示特征间的相关关系函数:scatter语法: matplotlib.pyplot.scat...

2019-09-27 10:55:49 29836 1

原创 python|scrapy爬虫|当当网的一万本书

#python爬虫——以当当网为例#设定内容居中、居左、居右使用:---------:居中使用:----------居左使用----------:居右第一列第二列第三列第一列文本居中第二列文本居右第三列文本居左SmartyPantsSmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:TYPEASCIIHTML...

2019-09-26 13:34:45 367

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除