
Python数据分析与应用
文章平均质量分 75
流光2021
这个作者很懒,什么都没留下…
展开
-
第八章 财政收入预测分析
第八章 财政收入预测分析实训实训1 求取企业所得税各特征间的相关系数import numpy as npimport pandas as pdinputfile='./income_tax.csv'data=pd.read_csv(inputfile)print('相关系数矩阵为:',np.round(data.corr(method='pearson'),2))相关系数矩阵为: year x1 x2 x3 x4 x5 x6 x7原创 2021-05-05 10:11:49 · 4348 阅读 · 3 评论 -
第七章
实训实训1 处理信用卡数据异常值1.读取信用卡数据import pandas as pddata=pd.read_csv('./credit_card.csv',encoding='gbk')print('原始数据的形状为:',data.shape)data原始数据的形状为: (65535, 28) 信用卡顾客编号 申请书来源 瑕疵户 逾期 呆账 借款余额 退票原创 2021-05-05 10:08:20 · 2939 阅读 · 1 评论 -
第四章 pandas统计分析基础
第四章 pandas统计分析基础4.1读/写不同数据源的数据4.1.1读/写数据库数据1、数据库数据读取import MySQLdbfrom sqlalchemy import create_enginefrom sqlalchemy.orm import sessionmakerengine = create_engine("mysql+pymysql://root:123456@127.0.0.1/testdb?charset=utf8mb4")session = sessionma原创 2021-05-05 10:06:50 · 6401 阅读 · 0 评论 -
第六章 使用scikit-learn构建模型
第六章 使用scikit-learn构建模型任务6.1 使用sklearn转换器处理数据6.1.1 加载datasets模块中的数据集#加载breast_canser数据集from sklearn.datasets import load_breast_cancercancer=load_breast_cancer()print('breast_cancer数据集的长度为:',len(cancer))print('breast_cancer数据集的类型为:',type(cancer))br原创 2021-04-27 14:57:45 · 2748 阅读 · 1 评论 -
第五章 使用pandas进行数据预处理
第五章 使用pandas进行数据预处理任务5.1 合并数据5.1.11堆叠合并数据1、横向堆叠#索引完全相同时的横向堆叠import numpy as npimport pandas as pdfrom sqlalchemy import create_engineconn = create_engine("mysql+pymysql://root:123456@127.0.0.1/testdb?charset=utf8mb4")detail1=pd.read_sql('meal_orde原创 2021-04-25 15:32:58 · 5133 阅读 · 1 评论 -
第三章 Matplotlib 数据可视化基础
第三章 Matplotlib 数据可视化基础3.1掌握绘图基础语法与常用参数3.1.1掌握pypot基础语法大部分的pyplot图形绘制都遵循一个流程,使用这个流程可以完成大部分图形的绘制。pyplot基本绘图流程主要分为3个部分,如下所示。创建画布与创建子图添加画布内容保存与显示图片#pyplot中的基础绘图语法import numpy as npimport matplotlib.pyplot as plt# %matlpotlib inlinedata=np.arange(0原创 2021-04-20 07:44:17 · 2573 阅读 · 1 评论 -
第二章NumPy数值计算基础
第二章 NumPy数值计算基础2.1掌握Numpy数组对象ndarray2.1.1创建数组对象2.数组创建#创建数组并查看数组属性import numpy as nparr1=np.array([1,2,3,4])print(arr1)arr2=np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])print(arr2)print(arr2.shape)print(arr2.dtype)print(arr2.size)#重新设置数组的shape属性原创 2021-04-18 12:02:15 · 1558 阅读 · 2 评论 -
Python 数据分析概述
1、认识数据分析1.1 数据分析概念数据分析是指用适当的分析方法对收集来的大量数据进行分析,提取有用信息和形成结论,对数据加以详细研究和概括总结的过程。广义的数据挖掘包括狭义数据分析和数据挖掘。狭义的数据分析是指根据分析目的,采用对比分析、分组分析、交叉分析和回归分析等分析方法,对收集的数据进行处理与分析,提取有价值的信息,发挥数据的作用,得到一个特征统计量结果的过程。数据挖掘则是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,通过应用聚类模型、分类模型、回归和关联规则等技术,挖掘潜在价值原创 2021-04-17 18:38:01 · 2580 阅读 · 0 评论