- 博客(22)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注
原创 Pandas案例学习总结
目录一必要库的导入二 创建表格对象三查看基础数据及类型四 设置索引、排序函数、添加和删除列五创建DataFrame以及表的拼接六 查看统计值(求和,平均值,最大值,最小值,标准差,四分位数等等)七 唯一值、缺失值和重复值八特殊函数一必要库的导入#导入pandas库import pandas as pd#导入numpy库import numpy as np#导入seaborn库里面有很多设计模板可以直接使用import seaborn ...
2021-05-31 18:20:56
916
原创 Pandas数据分析练习10
练习10-删除数据探索Iris纸鸢花数据目录步骤1 导入必要的库步骤2 数据集地址步骤3 将数据集存成变量iris步骤4 创建数据框的列名称步骤5 数据框中有缺失值吗?步骤6 将列petal_length的第10到19行设置为缺失值步骤7 将缺失值全部替换为1.0步骤8 删除列class步骤9 将数据框前三行设置为缺失值步骤10 删除有缺失值的行步骤11 重新设置索引代码截图步骤1 导入必要的库运行以下代码#导入必要的库import p
2021-05-30 12:13:27
3372
原创 Pandas数据分析练习9
练习9-时间序列探索Apple公司股价数据步骤1 导入必要的库运行以下代码#导入必要的库import pandas as pdimport numpy as np# visualizationimport matplotlib.pyplot as plt%matplotlib inline步骤2 数据集地址运行以下代码#从目标路径导入数据集path9 = 'D:/hailong/hailong_download/pandas_exercise/exerci
2021-05-30 11:05:19
969
原创 Pandas数据分析练习8
练习8-创建数据框探索Pokemon数据目录步骤1 导入必要的库步骤2 创建一个数据字典步骤3 将数据字典存为一个名叫pokemon的数据框中步骤4 数据框的列排序和创建顺序有关,重新修改为name, type, hp, evolution, pokedex这个顺序步骤5 添加一个列place步骤6 查看每个列的数据类型代码截图步骤1 导入必要的库运行以下代码#导入pandas库import pandas as pd步骤2 创建一个数据字典运行
2021-05-29 11:15:47
509
原创 Pandas数据分析练习7
练习7-可视化探索泰坦尼克灾难数据目录步骤1 导入必要的库步骤2 从以下地址导入数据步骤3 将数据框命名为titanic步骤4 将PassengerId设置为索引步骤5 绘制一个展示男女乘客比例的扇形图步骤6 绘制一个展示船票Fare, 与乘客年龄和性别的散点图步骤7 有多少人生还?步骤8 绘制一个展示船票价格的直方图代码截图步骤1 导入必要的库运行以下代码#导入必要的库import pandas as pdimport matplotlib.p
2021-05-28 17:22:28
2082
原创 Pandas数据分析练习6
练习6-统计探索风速数据目录步骤1 导入必要的库步骤2 从以下地址导入数据步骤3 将数据作存储并且设置前三列为合适的索引步骤4 2061年?我们真的有这一年的数据?创建一个函数并用它去修复这个bug步骤5 将日期设为索引,注意数据类型,应该是datetime64[ns]步骤6 对应每一个location,一共有多少数据值缺失步骤7 对应每一个location,一共有多少完整的数据值步骤8 对于全体数据,计算风速的平均值步骤9 创建一个名为loc_stats的数
2021-05-28 12:00:59
1448
1
原创 Pandas数据分析练习5
练习5-合并探索虚拟姓名数据目录步骤1 导入必要的库步骤2 按照如下的元数据内容创建数据框步骤3 将上述的数据框分别命名为data1, data2, data3步骤4 将data1和data2两个数据框按照行的维度进行合并,命名为all_data步骤5 将data1和data2两个数据框按照列的维度进行合并,命名为all_data_col步骤6 打印data3步骤7 按照subject_id的值对all_data和data3作合并步骤8 对data1和data2按照s
2021-05-27 17:12:11
515
原创 Pandas数据分析练习4
练习4-Apply函数探索1960 - 2014 美国犯罪数据目录步骤1 导入必要的库步骤2 从以下地址导入数据集步骤3 将数据框命名为crime步骤4 每一列(column)的数据类型是什么样的?步骤5 将Year的数据类型转换为datetime64步骤6 将列Year设置为数据框的索引步骤7 删除名为Total的列步骤8 按照Year对数据框进行分组并求和步骤9 何时是美国历史上生存最危险的年代?代码截图步骤1 导入必要的库运行以下代码.
2021-05-27 11:18:50
1236
原创 Pandas数据分析练习3
练习3-数据分组探索酒类消费数据目录步骤1 导入必要的库步骤2 从以下地址导入数据步骤3 将数据框命名为drinks步骤4 哪个大陆(continent)平均消耗的啤酒(beer)更多?步骤5 打印出每个大陆(continent)的红酒消耗(wine_servings)的描述性统计值步骤6 打印出每个大陆每种酒类别的消耗平均值步骤7 打印出每个大陆每种酒类别的消耗中位数步骤8 打印出每个大陆对spirit饮品消耗的平均值,最大值和最小值代码截图步骤1 导入
2021-05-26 20:48:10
2129
2
原创 Pandas数据分析练习2
练习2-数据过滤与排序探索2012欧洲杯数据目录步骤1 - 导入必要的库步骤2 - 从以下地址导入数据集步骤3 - 将数据集命名为euro12步骤4 只选取Goals这一列步骤5 有多少球队参与了2012欧洲杯?步骤6 该数据集中一共有多少列(columns)?步骤7 将数据集中的列Team, Yellow Cards和Red Cards单独存为一个名叫discipline的数据框步骤8 对数据框discipline按照先Red Cards再Yellow Ca..
2021-05-26 12:05:40
2502
1
原创 Pandas数据分析练习1
练习1-开始了解你的数据探索Chipotle快餐数据步骤1 导入必要的库#运行以下代码importpandasaspd步骤2 从如下地址导入数据集#运行以下代码path1="../input/pandas_exercise/pandas_exercise/exercise_data/chipotle.tsv"#chipotle.tsv步骤3 将数据集存入一个名为chipo的数据框内#运行以下代码chipo=pd.read_csv(pa...
2021-05-24 16:46:16
547
原创 Excel处理多余符号--查找替换功能&SUBTITUTE公式的使用
使用工具:Microsoftoffice excel 2007Excel示例文件下载地址:hfda_ch13_raw_data.csv①处理多余符号("^")--查找替换功能的使用:replace-step1:在开始选项栏中找到"查找和选择"选项,点选"查找"或者"替换"功能(Ctrl+F为快捷键)replace-step2:点击进入到替换的界面replace-step3:在"查找内容"后的输入框中填入"^"符号,替换为""(空值),然后点击全部替换:replac..
2021-05-19 10:47:49
1527
原创 Excel分列功能的使用
使用工具:Microsoftoffice excel 2007Excel示例文件下载地址:hfda_ch13_raw_data.csv分列step1:首先选中A列,在"数据"栏选项下的数据工具栏中选中"分列"功能分列step2:选择分隔符号(默认),点击下一步分列step3:此例以"#"号为分隔符,勾选"其他",并在输入框中填入"#"号,点击下一步分列step4:点击完成分列step5:查看分列效果...
2021-05-19 10:44:26
696
原创 Excel数据分析工具安装步骤
使用工具:Microsoftoffice excel 2007step1:点击文件菜单下的Excel选项step2:点击Excel选项中的加载项,点击转到(G)-英文版为go标签。step3:勾选"查阅向导"、"分析工具库"、"规划求解加载项"、"条件求和向导"四项,点击"确定"按钮。step4:执行完前三步后,数据栏会显示"分析"选项栏,包含数据分析和规划求解(solver)的选项。...
2021-05-19 10:43:29
2914
1
原创 Excel常用函数公式20例
使用工具:Microsoftoffice excel 2016一、Vlookup函数。功能:查找引用。语法:=Vlookup(查找值,查找范围,返回查找范围中的第几列,匹配模式)。方法:在目标单元格中输入公式:=VLOOKUP(H3,B3:D9,3,0)。解读:① 返回B3:D9范围中和H3相匹配的第3列的值。② 匹配模式有2种,1为模糊匹配,0位精准匹配。二、Sumif函数。功能:单条件求和。语法:=Sumif(条件范围,条件,求和范围)。方法:在目标单元.
2021-05-16 11:27:37
12732
2
原创 Excel切片器的使用
使用工具:Microsoftoffice excel 2016一表格形式的转换打开Excel样表,点击"插入"选项中的"表格",鼠标左键选中表格目标区域,勾选"表包含标题",点击确定,表正式转化为表格形式。二表格筛选功能与简易切片器的使用1.表格筛选功能①点击"性别"列的"▽"符号(▽为筛选功能),任意选择"男"或"女"的选项,点击"确定"按钮,此时数据表格将只显示筛选分类后的结果。②同样点击"地区"列的"▽"符号,只勾选"北京"地区的选项,点击"确定"按钮,然后只显示"北...
2021-05-15 12:30:34
5072
原创 牛客网SQL题目2
牛客网SQL题目2有一个员工employees表简况如下:建表语句如下:CREATETABLE`employees`(`emp_no`int(11)NOTNULL,`birth_date`dateNOTNULL,`first_name`varchar(14)NOTNULL,`last_name`varchar(16)NOTNULL,`gender`char(1)NOTNULL,`hire_date`dateNOTNULL,...
2021-05-14 16:08:26
123
原创 牛客网SQL题目1
牛客网SQL题目1描述有一个员工employees表简况如下:建表语句如下:`emp_no`int(11)NOTNULL,`birth_date`dateNOTNULL,`first_name`varchar(14)NOTNULL,`last_name`varchar(16)NOTNULL,`gender`char(1)NOTNULL,`hire_date`dateNOTNULL,PRIMARYKEY(`emp_no`));...
2021-05-14 15:47:46
111
原创 Scrapy入门实例_爬取美剧天堂的最新前100
使用工具:Python3.6版本Python官网:https://www.python.org/Scrapy的安装pip install Scrapy。在此之前需要先安装几个包:wheel、lxml以及twistedcmd执行语句需要进入到对应的python根目录的Scripts文件夹下D:\hailong\Python3.6\Scripts然后依次运行如下语句:(1) pip install wheel(2) pip install lxml(3) pip instal
2021-05-14 15:36:29
2027
3
原创 八爪鱼-自定义模式采集数据_视频教程执行
使用工具:八爪鱼客户端在八爪鱼客户端中可以使用自定义模式灵活配置采集任务首先需要确定目标网址和采集需求以京东为例,我们需要在京东首页输入关键词"手机",然后去采集全部"手机"搜索结果的数据(八爪鱼工具采集)第一步复制粘贴目标网址复制京东首页的网址。粘贴至八爪鱼首页选项的网址输入框中,点击开始采集,点击保存设置,可以观察到八爪鱼自动的打开了这个网页,接下来就是去配置采集流程。查看采集流程的开关在设置选项里,自定义模式配置里的打开流程图是默认开启的。第二步 输入文本&am..
2021-05-09 19:23:48
1283
原创 《深入浅出数据分析》R-代码执行
书中R代码执行章节9直方图>getwd() #获取/查看当前路径>setwd("D:/hailong/hailong_download/DataAnalysis") #设置当前路径>employees <- read.csv("hfda_ch09_employees.csv",header=TRUE) #读取csv文件赋值给employees对象>employees #-P265注意:R中路径索引只能使用/不能使用\,用\就会提示错误: 由""...
2021-05-09 19:15:27
533
原创 八爪鱼-自定义模式采集数据
使用工具:八爪鱼客户端在八爪鱼客户端中可以使用自定义模式灵活配置采集任务首先需要确定目标网址和采集需求以公开数据房地产信息平台为例,首先需要挖掘出目标网址,然后去采集全部"房源"搜索结果的数据(八爪鱼工具采集)第一步 挖掘目标网址一、进入目标网址查看①输入目标网址:http://zjj.sz.gov.cn:8004/(以深圳市房地产信息平台为例)②点击"房源库"按钮,出现对应的"标题栏"③点击标题栏下的"一手预售房源"按钮,即可出现目标数据如下图所示:二、挖掘目.
2021-05-09 19:02:58
4356
1
爬虫关于xpath在代码中返回为空的问题_美剧天堂电影爬取的案例
2021-05-13
TA创建的收藏夹 TA关注的收藏夹
TA关注的人