
python碎碎
还需要学习的萌新
这个人是条懒狗,什么也没留下
展开
-
非常简陋的web服务器
from http.server import *class Myhandler(BaseHTTPRequestHandler): def do_GET(self): try: f = open(self.path[1:], 'r') self.send_response(200) self.send_header('Content_type', 'text/html') self.原创 2021-01-02 15:45:03 · 251 阅读 · 0 评论 -
可编程的web浏览方式
本段代码首先打开了优快云网站,再点击Python模块,读取与python有关的博文信息# 可以编程的web浏览方式# 非标准库 用于解析页面from bs4 import BeautifulSoup, SoupStrainer# 非标准库 用于模拟浏览器from mechanize import Browserbr = Browser()br.addheaders = [('User-Agent', 'Mozilla/5.0')]# 主页rsp = br.open('https://w原创 2021-01-01 15:53:46 · 370 阅读 · 1 评论 -
python四种方式解析网页获取页面中的链接
# 链接解释器# 使用三种不同解释器 环境python3.8#from html.parser import HTMLParserfrom urllib.request import urlopenfrom urllib.parse import urljoinimport time# 非标准库from bs4 import BeautifulSoup, SoupStrainer# 非标准库# from html5lib import html5parser, treebuilders原创 2020-12-31 12:42:11 · 2460 阅读 · 2 评论 -
用python进行简单的页面抓取
# 本代码首先输入一个初始链接,然后读取下载之,在读取到的网页中找更多的链接,依次读取下载import osimport sysimport urllibimport urllib.requestfrom urllib.parse import urlparsefrom http.client import InvalidURLimport re# from html.parser import HTMLParser# 创建下载器类class Retriever: # 表原创 2020-12-30 09:16:09 · 366 阅读 · 0 评论 -
使用urllib进行HTTP验证
# HTTP验证 环境python3.8import urllib.request, urllib.error, urllib.parsefrom base64 import encodebytesLOGIN = 'wesley'PASSWD = "you'll guess"URL = 'http://loacalhost'REALM = 'Secure Archive'""" AuthType basic 已知域AuthName:Secure Archive Au原创 2020-12-29 10:30:16 · 327 阅读 · 2 评论 -
quote()、unquote()和urlencode()
import urllib.request as ureq# 对url中的特殊字符进行转换name = 'joe mama'number = 6base = 'http://www.baidu.com'final = '?name=%s&num=%d' % (name, number)fi = base + ureq.quote(final)fi2 = ureq.unquote(fi)print(fi, fi2, sep='\n')结果/usr/bin/python3.8 /h原创 2020-12-28 11:41:06 · 402 阅读 · 0 评论 -
urlretrieve()的使用
以下代码可用于简单下载文件# 环境python3.8import urllib.request as ureqimport osimport time# 定义回调函数def callback(cur_down, cur_size, total_size): """ 回调函数 :param cur_down: 已经下载的数据块数 :param cur_size:数据块的字节数 :param total_size:文件总字节数 :return:原创 2020-12-28 10:51:22 · 676 阅读 · 1 评论 -
urlopen()的使用
import urllib.request as ureq# 打开一个url字符串表示的web连接,返回文件类型对象f = ureq.urlopen("https://www.iqiyi.com/")# 读取文件句柄print(f.fileno())# 读取7bytes文件print(f.read(7))# 读取一行print(f.readline())# 读取所有行,作为列表返回print(f.readlines())# 读取MIME(多目标因特网邮件扩展)文件print(f.in原创 2020-12-27 16:56:53 · 1081 阅读 · 0 评论 -
urlparse的基本使用
import urllib.parse as uparse# 将url字符串拆分成6元组split_info = uparse.urlparse('https://mp.youkuaiyun.com/console/home?spm=1001.2101.3001.4503')print(tuple(split_info))print(split_info[1])# 将六元组组合成urljoin_info = uparse.urlunparse(('https', 'mp.youkuaiyun.com', '/con原创 2020-12-25 14:47:47 · 422 阅读 · 3 评论 -
python核心编程第3版第一章习题
python核心编程第3版第一章习题1-1原创 2020-10-28 21:54:25 · 232 阅读 · 0 评论 -
python中读取.mat文件
import scipy.ioindian_pines = scipy.io.loadmat('Indian_pines.mat')此时读取到的是一个字典类型。原创 2019-09-18 20:26:51 · 603 阅读 · 0 评论