
python自学笔记之数据的获取、分析、可视化
文章平均质量分 91
worden丶
这个作者很懒,什么都没留下…
展开
-
Python数据挖掘(二)之Pandas高级处理
一、缺失值处理 1、缺失值处理思路 删除含有缺失值的样本 替换/插补(计算平均值、中位数填入) 2、如何处理NaN 判断数据是否为NaN: pd.isnull(df),pd.notnull(df) 存在缺失值NaN,并且是np.nan: 1、删除存在缺失值的:df.dropna(axis=‘rows’,inpalce=True) 2、替换缺失值:df.fillna(value,inplace=True) value:替换成的值 inplace:True会修改原数据/False不替换修改原数据原创 2020-09-19 20:47:13 · 707 阅读 · 0 评论 -
Python数据挖掘(二)之Pandas
一、pandas介绍 panel+data+analysis 二、DataFrame 1、结构:既有行索引,又有列索引的二维数组 import numpy as np import pandas as pd # 创建一个符合正态分布的10个股票5天的涨幅数据 stock_change = np.random.normal(0,1,(10,5)) # 添加行索引index stock = ['股票{}'.format(i) for i in range(10)] # 添加列索引columns date原创 2020-09-16 22:28:40 · 683 阅读 · 0 评论 -
Python数据挖掘(一)之Numpy
一、基本操作 ndarry.方法() numpy.函数名() 二、ndarray与Python原生list运算效率对比 import numpy as np import random import time # 生成一个大数组 python_list = [] for i in range(10000000): python_list.append(random.random()) ndarray_list = np.array(python_list) # 原生pythonlist求和原创 2020-09-15 20:27:29 · 546 阅读 · 0 评论 -
python学习笔记之一些测试代码(四)
# 测试代码1--json库的使用 # 新建一个字典 dic_v1 = {"confirm":500,"heal":480} #创建字典 print(dic_v1) print(type(dic_v1)) # 将字典dic_v1转换为字符串 print("将字典dic_v1转换为字符串".center(30,'=')) import json str_v1 = json.dumps(dic_v1) #将字典转换为字符串 print("字典转换为字符串后的值:",str_v1) print("使原创 2020-09-03 21:54:25 · 208 阅读 · 0 评论 -
python学习笔记之数据的可视化(三)
疫情数据的可视化 1> matplotlib 导库命令:import matplot.pyplot as plt 2> 可视化流程 1.绘制画布及绘制图形 plt.figure(figsize=(8,6),dpi =80) plt.plot(x,y,color,linestyle) 参数含义:color表示颜色,颜色的单词 linestyle表示线型,- -- : -. plt.scatter(x,y,color,marker,s)原创 2020-09-03 21:48:28 · 573 阅读 · 0 评论 -
python学习笔记之数据的分析(二)
疫情数据的分析 1.导入外部数据 pd.read_csv('文件名') 查看数据属性: columns 列名 index 行索引 shape m行n列 dtyps 各列的类型 2.查找数据 方法1:用列名直接查找 df[[列名列表]] 方法2:用loc查找 df.loc[行取值,列取值] 注意:行取值可以用逻辑值来进行映射,逻辑真(True)会返回,逻辑假(False)会去掉 df.head(n) #返回前n行,默认为5行 df.tail(n)原创 2020-09-03 21:40:51 · 198 阅读 · 0 评论 -
python学习笔记之数据的获取(一)
疫情数据获取 – 爬虫(requests,pandas,json) 1) 网站链接: https://wp.m.163.com/163/page/news/virus_report/index.html?_nw_=1&_anw_=1 2) 操作步骤: 1.打开开发者工具(在网页浏览器中打开网址,按f12即可) 2.选择‘network’面板,设置类型为‘xhr’类型,刷新页面 3.点击以‘list-total’开头的链接,查看headers和preview面板 hea原创 2020-09-03 21:15:54 · 2868 阅读 · 0 评论