- 博客(14)
- 收藏
- 关注
原创 xpath
xpath xml,是一种数据格式,和json的位置一样,前后端交互,传输数据使用的格式 xml和html的不同: (1)xml是用来传输和存储数据的,html是用来显示数据的 (2)xml标签可以自定义,html是官方规定好的标签 (3)xml都是纯文本,而html是超文本 xml语法: (1)必须有关闭标签 (2)标签名对大小写...
2018-11-11 10:59:14
255
原创 requests
import requestsurl = ''data = {}headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36',}proxy = { 'http'...
2018-11-11 10:56:04
188
原创 re
import re'''string = '<div>啊哈,给我一杯忘情水,换我一生不伤悲</div></div></div>'pattern = re.compile(r'<div>(.*?)</div>')ret = pattern.search(string)print(ret.group())'''...
2018-11-11 10:55:19
142
原创 正则表达式解析、re
引入,为什么使用正则表达式? 字符串查找。find rfind, 局限,只能查找固定的,写死的 查找所有手机号,所有的邮箱 字符串替换单字符匹配 \d :0-9 digit [0-9] \w : 小写、大写、数字、下划线、中文 word [a-zA-Z0-9_] \D : 除了 \d \W :除了 \w \s :所有的空白字符 space \S :除了 \s...
2018-11-11 10:54:30
160
原创 urllib-cookie
import urllib.requestimport urllib.parse# 让代码保存cookieimport http.cookiejar# 创建一个cookiejar对象,用来保存cookieck = http.cookiejar.CookieJar()# 根据cookiejar对象创建一个handlerhandler = urllib.request.HTTPCoo...
2018-11-11 10:05:18
352
原创 urllib-proxy
import urllib.requesturl = 'http://www.baidu.com/s?ie=UTF-8&wd=ip'# 创建handlerhandler = urllib.request.ProxyHandler(proxies={'http': '124.193.37.5:8888'})# 根据handler创建一个openeropener = urllib...
2018-11-11 10:01:43
215
原创 urllib.error
import urllib.requestimport urllib.error# url = 'http://www.maodan.com/'url = 'https://www.cnblogs.com/zhuyue1/p/6408811.html'try: response = urllib.request.urlopen(url)# Exception 异常基类,所有异常...
2018-11-11 09:50:10
137
原创 urllib-handler
import urllib.requesturl = 'http://www.baidu.com/'headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36',}...
2018-11-11 09:47:20
199
原创 urllib-post
import urllib.requestimport urllib.parsecname = input('请输入要查询的城市:')post_url = 'http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=cname'data = { 'cname': cname, 'pid': '', 'pageIndex': '1...
2018-11-11 09:46:04
115
原创 urllib-get
import urllib.requestimport urllib.parseurl = 'https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&'page = int(input('请输入要第几页的电影:'))# 根据page计算 start limit...
2018-11-11 09:44:58
242
原创 DataFrame基础
DataFrameimport numpy as npimport pandas as pdfrom pandas import Series,DataFrameDataFrame的创建最常用的方法是传递一个字典来创建。DataFrame以字典的键作为每一【列】的名称,以字典的值(一个数组)作为每一列。此外,DataFrame会自动加上每一行的索引(和Series一样)。同Seri...
2018-10-20 08:40:55
602
原创 Series基础
Series创建import numpy as npimport pandas as pdfrom pandas import Series,DataFrame两种创建方式:由列表或numpy数组创建默认索引为0到N-1的整数型索引s = Series([1,2,3])nd = np.array([1,2,3])s = Series(nd)#通过index参数指定索引...
2018-10-20 08:39:33
271
原创 cs2人脸识别
cs2人脸识别import numpy as npimport matplotlib.pyplot as plt%matplotlib inlinefish = plt.imread("./fish.png")plt.imshow(fish)#处理图片fish.shapefish1 = fish[::,::,0]plt.imshow(fish1, cmap = "gray")...
2018-10-20 08:38:22
251
原创 numpy
Ipython命令启动: ipython notebook/jupyter notebookIpython帮助文档 Help(参数)方法 ? ??可以显示源码 Shift-Enter : 运行本单元,选中下个单元 Y : 单元转入代码状态 M :单元转入markdown状态 A : 在上方插入新单元 B : 在下方插入新单元 Double-...
2018-10-20 08:35:40
168
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人