- 博客(20)
- 收藏
- 关注
原创 Latex安装以及作业笔记
Latex安装参考:怎么安装LaTex - 半句多的文章 - 知乎https://zhuanlan.zhihu.com/p/56982388作业1、文档相关说明:2、公式写法:https://blog.youkuaiyun.com/weixin_30892037/article/details/97464655?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-9&utm_source=di
2021-10-10 11:36:26
221
原创 python|6.2构建并评价聚类模型
6.2.1使用sklearn估计器构建据类模型#使用sklearn估计器构建K-Means聚类模型from sklearn.datasets import load_irisfrom sklearn.preprocessing import MinMaxScalerfrom sklearn.cluster import KMeansiris=load_iris()iris_dat...
2019-10-17 20:04:04
764
原创 python|6.1使用scikit-learn转换器处理数据
model_selection模型选择模块preprocessing数据预处理模块decompisition特征分解模块实现数据预处理与模型构建前的数据标准化、二值化、数据集的分割、交叉验证和PCA降维等工作6.1.1加载datasets模块中的数据集#加载breast_cancer数据集from sklearn.datasets import load_breast_cancer...
2019-10-17 14:38:51
539
原创 python|pandas|5.4转换数据
1.哑变量处理类别型数据#哑变量处理类别型数据方法get_dummiespandas.get_dummies(data,prefix=None,prefix_sep=',',dummy_na=False,columns=None,sparse=False,drop_first=False)2.使用等宽法、等频法、聚类分析法离散化连续数据import pandas as pd...
2019-10-11 15:26:56
307
原创 python|pandas|5.3标准化数据
离差标准化数据标准差标准化数据小数定标标准化数据import pandas as pdimport numpy as npdetail=pd.read_csv('E:\大三上\张宇萌\实习任务安排(2019-10-10)\detail.csv',index_col=0,',encoding='gbk')#离差标准化#自定义离差标准化函数def minmaxscale(dat...
2019-10-11 14:08:26
735
原创 python|jupyter|pandas|5.2清洗数据
检测与处理重复值重复的类型:1.记录重复2.特征重复:有一个或多个特征名称不同,但数据完全相同记录重复#1.用list去重import pandas as pddetail=pd.read_csv('E:\大三上\张宇萌\实习任务安排(2019-10-10)\detail.csv',index_col=0,encoding='gbk')#定义去重复def delrep(list1...
2019-10-10 17:01:13
4288
原创 python|jupyter|pandas|5.1合并数据
1.堆叠#横向堆叠concatpandas.concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False,keys=None,lebels=None,names=None,verify_integrity=False,copy=True)#axis=0 按照X轴拼接 :行对齐,合并列(左右拼接)#inner 内连接 交集...
2019-10-10 16:15:24
6140
2
原创 python|jupyter||pandas|4.5创建透视表和交叉表
4.5创建透视表和交叉表使用pivot_table函数创建透视表pandas.pivot_table(data,values=None,index=None,columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,margins_name='All')#使用订单号作为透视表索引制作透视表import p...
2019-10-09 09:48:32
1065
原创 python|jupyter|pandas|4.4使用分组聚合进行组内计算
4.4使用分组聚合进行组内计算使用groupby拆分数据DataFrame.groupby(by=None,axis=0,level=None,as_index=True,sort=True,group_keys=True,squeeze=False,**kwargs)import pandas as pdimport numpy as npfrom sqlalchemy impo...
2019-10-08 23:14:02
4191
2
原创 python|jupyter|pandas|4.3转换与处理时间序列数据
4.3转换与处理时间序列数据数据分析的分析对象:数值型、类别型、时间类型转换字符串时间为标准时间#前面import pandas as pdorder1=pd.read_table('E:\大三上\张宇萌\实习任务安排(2019-9-26)/meal_order_info.csv',sep=',',encoding='gbk')#转换print('转换前订单信息表lock_tim...
2019-10-08 18:35:13
3853
原创 python|jupyter|padas|dataframe|4.2Dataframe基本操作
4.2 Dataframe基本操作介绍dataframe最常用的padas对象,类似于excel表格。完成数据读取后,数据以Dataframe结构存储1.查看Dataframe常用属性values 元素index 索引columns 列名dtypes 类型size:元素个数ndim:维度数shape:数据形状(行、列数目)T:转置(行列转换)#导入from sql...
2019-10-07 21:04:55
1322
原创 python|jupyter notebook|padas|读、写Excel文件
(一)读基本函数read_excelread_table语法padas.read_excel(io,sheetname=0,header=0,index_col=None,names=None,dtype=None)参数读取exceluser=pd.read_excel('E:\大三上\张宇萌\实习任务安排(2019-9-26)\users.xlsx')print('客户信...
2019-10-07 19:14:54
5160
原创 python|jupyter noetebook|padas|读、写文本文件(csv)
(一)读1.1基本函数read_tableread_csv1.2语法padas.read_table(filepath,sep='\t',header='infer',names=None,index_col=None,dtype=None,encoding=utf-8,engine=None,nrows=None)padas.read_csv(filepath,sep=',',h...
2019-10-07 18:50:20
1880
原创 navicat|mysql|报错|client does not support authentication
参考:https://blog.youkuaiyun.com/choumin/article/details/89513943外部组件错误解决方法:输入:mysql> alter user 'root'@'localhost' identified with mysql_native_password by '123456';//123456是密码,注意要加封号Query OK, 0 ro...
2019-10-07 16:08:16
178
原创 python|jupyter notebook|padas|读、写数据库数据
1.数据库数据padas库:函数与方法read_sql():读取、查询(综合)read_sql_table():读取表格read_sql_query():查询#语法#1. padas.read_sql(sql,con,index_col=None,coerce_float=True,columns=None)#2. padas.read_sql_table(table_nam...
2019-10-07 16:02:55
1169
原创 python|jupyter notebook|jieba|句子分词
用python jieba进行句子分词一、安装jiebapip install jieba二、常用函数jieba.lcut(s)jieba.lcut(s,cut_all=True)
2019-09-29 08:51:02
3358
3
原创 python|jupyter notebook|绘制直方图、饼图、箱线图
教材:《Python数据分析与应用》黄红梅、张良均3.3分析特征内部数据分布与分散状况直方图函数:bar语法:matplotlib.pyplot.bar(left,height,width=0.8,bottom=None,hold=None,data=None,**kwargs)#left:x轴数据height:x轴所代表数据的数量width:直方图宽度(0-1)import ...
2019-09-27 13:28:31
24534
2
原创 python|jupyter notebook|绘制散点图、折线图
导入:jupyter notebook——是一个交互式笔记本,支持运行 40 多种编程语言matplotlib.pyplot——python数据可视化numpy——Python的开源的数值计算扩展(数组)教材:《Python数据分析与应用》黄红梅、张良均3.2分析特征间的关系散点图特征:揭示特征间的相关关系函数:scatter语法: matplotlib.pyplot.scat...
2019-09-27 10:55:49
29836
1
原创 python|scrapy爬虫|当当网的一万本书
#python爬虫——以当当网为例#设定内容居中、居左、居右使用:---------:居中使用:----------居左使用----------:居右第一列第二列第三列第一列文本居中第二列文本居右第三列文本居左SmartyPantsSmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:TYPEASCIIHTML...
2019-09-26 13:34:45
367
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人