- 博客(8)
- 收藏
- 关注
原创 用numpy和pandas进行数据分析
一、NUMPY1.创建ndarrayimport numpy as npimport numpy as np #导入numpya1=np.array([1,2,10,4]) #利用列表构建一维数组, array里得是同一数据类型,可以是列表,元组,数组或其他序列a2=np.array([[1,2,3,4],[4,15,6,17]])#利用列表构建二维数组,可以理解为矩阵a3=np.zeros(10) / zeros_likea4=np.ones(5) / ones_likea5=np
2020-07-03 15:06:53
2435
1
原创 一分钟学完python的pip安装方法
1.找到python文件夹Scripts所在的位置,按住shift键,鼠标右键点击“在此处打开命令窗口”2.pip更新的方法在python中python -m pip install --upgrade pip在anaconda中conda install mingw libpython3.下载所需要的库在命令窗口中输入pip install 库的名字使用镜像的方法,下载会快很多,如下pip install 库的名字 -i https://tuna.tsinghua.edu.cn/
2020-07-29 09:29:52
455
原创 爬虫之BeautifulSoup的用法
Beautiful Soup是python的一个HTML或XML的解析库,可以很方便地从网页中提取数据。BS自动将输入文档转换成Unicode编码,输出文档转换成UFT-8编码。用法from bs4 import BeautifulSouphtml = '''<html><head><title>The Dormouse's story</title></head><body><p class="title" nam
2020-07-24 13:20:22
2102
原创 爬虫之re 正则表达式的用法
正则表达式是通过特殊的字符序列,实现字符串的检索、替换、匹配验证。在爬虫时,使用正则表达式可以方便我们快速提取到HTML中的信息书写规则项目Value[abc]abc中的一个[a-z]a-z中的一个[0-9]0-9中的一个[a-f0-5]a-f或0-5中的一个[ab][de][12]每个[]取一个,连起来match()从字符串的开头开始对整个字符串进行匹配,一但开头匹配不成功就报错,如果不匹配,返回Noneimport reconte
2020-07-17 17:23:22
1070
原创 爬虫之XPath的用法
Xpath简介XPath (XML Path Language)是一门在 HTML\XML 文档中查找信息的语言,可用来在 HTML\XML 文档中对元素和属性进行遍历。在Python爬虫中, XPath 我们可以利用快速地定位 HTML\XML 响应中的特定元素以及获取节点的信息,并且通常情况下会比使用正则表达式提取更简单而且更高效。Xpath常用规则表达式描述nodename选取此节点的所有子节点/从当前节点选取直接子节点//从当前节点选取子孙节点.选
2020-07-17 14:17:23
7905
原创 用matplotlib进行数据可视化
python官网一、plot的使用import pandas as pdimport matplotlib.pyplot as pltplt.figure(figsize=(5,5))#设置画布的尺寸plt.title('a',fontsize=20)#标题,并设定字号大小plt.xlabel('x',fontsize=14)#设置x轴,并设定字号大小plt.ylabel('y',fontsize=14)#设置y轴,并设定字号大小x=[1,2,3,4,5]y=[1,4,9,16,25]
2020-07-08 17:23:30
427
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅