
python
1
Corgy.
慵懒。
展开
-
py内置函数整理
py内置函数注:标星是❤不见眼见的(对我)内置函数abs()divmod()input()*open()*staticmethod()all()enumerate()int()*ord()str()*any()eval()isinstance()pow()*sum()*basestring()execfile()issubclass()print()super()bin()file()iter()property()原创 2020-05-24 15:31:49 · 395 阅读 · 0 评论 -
爬虫爬取豆瓣电影写入csv
小白flag10 爬虫爬取豆瓣电影写入csv准备json化csv文件操作学习代码import requestsimport jsonfrom requests.packages.urllib3.exceptions import InsecureRequestWarning # 解决警告class douban_movie(): def __init__(self): self.rowCount = input('输入你想要的电影个数') # 获取文章原创 2020-06-01 15:29:16 · 814 阅读 · 0 评论 -
加水印 pil包了解
知识扩展from PIL import Image, ImageDraw, ImageFont# 确定字体font = ImageFont.truetype('C:\\WINDOWS\\Fonts\\STXINGKA.TTF', 44, index=0)def add_text_to_image(image, text, font=font): rgba_image = image.convert('RGBA') text_overlay = Image.new('RGBA',原创 2020-05-22 15:59:16 · 147 阅读 · 0 评论 -
小白flag8 py的十个小技巧
py的十个小技巧通过B站学习(一)变量交换a=1b=2tmp=aa=bb=tmpprint(a)print(b)#改为a,b=b,a(二)字符串格式化name = 'xiaowang'country = 'China'age = 19 # 需要转类型print("Hi,I'm" + name + ". I'm from" + country + ". And I'm " + str(age) + ".")# 改为print("Hi,I'm %s. I'm from原创 2020-05-21 20:12:43 · 313 阅读 · 0 评论 -
python爬虫_网易音乐歌单
小白flag7 python爬虫_网易音乐歌单准备import os #存放文件处理import time #程序运行时间计算import sys #错误信息返回 预留from selenium import webdriver #获取渲染后的html页面from lxml import etree #解析 xpath使用from urllib.parse import quote # url编码思路获取全部页面(网易云音乐包括了iframe是个坑)解析获取分析保存代码i原创 2020-05-19 20:02:52 · 223 阅读 · 0 评论 -
python类的学习_
Python类的学习目标:简但联想js类与py类的区别完成最后类的小作业介绍类(Class): 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。**类变量:**类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。**数据成员:**类变量或者实例变量用于处理类及其实例对象的相关的数据。**方法重写:**如果从父类继承的方法不能满足子类的需求,可以对其进行改写,这个过程叫方法的覆盖(override原创 2020-05-18 17:15:14 · 174 阅读 · 0 评论 -
selenium学习
selenium的基本使用介绍在进行爬虫学习的过程中遇到了动态网页的获取问题进而走进了selenium的世界本文完全转载于 https://www.cnblogs.com/wsmrzx/p/9531063.html若出现问题必将删除此博客学习去了 今天鸽了一、selenium 简介随着网络技术的发展,目前大部分网站都采用动态加载技术,常见的有 JavaScript 动态渲染和 Ajax 动态加载对于爬取这些网站,一般有两种思路:分析 Ajax 请求,通过模拟请求得到真实的数据,这种方法在转载 2020-05-17 19:35:16 · 168 阅读 · 0 评论 -
Python爬虫_小说爬取进化版
准备安装Python以及必要的模块(requests,xpath)新笔趣阁思路继上次写的代码问题改正:指定下载解决一下全局变量的问题完善部分下载函数作用可以选择爬取网站内任意小说 选择章数 保存路径代码import requestsimport timeimport sysimport osfrom lxml import etreefrom urllib import parse# 首先获取访问网站的URldef get_content(url): tr原创 2020-05-16 22:37:42 · 207 阅读 · 0 评论 -
Python爬虫_小说爬取进阶(续)--爬了一整本
准备安装Python以及必要的模块(requests,xpath)新笔趣阁思路获取网站url 采用异常处理try解析内容获得到作者 章节编辑文件写入章节 作者进一步获取文章内容编辑文件继续写入代码import requestsimport timeimport sysfrom lxml import etreefrom urllib import parse#首先获取访问网站的URldef get_content(url): try: head原创 2020-05-15 22:16:16 · 275 阅读 · 0 评论 -
Python爬虫_小说爬取进阶(失败)
准备安装Python以及必要的模块(requests,xpath)新笔趣阁思路获取网站url 采用异常处理try解析内容获得到作者 章节编辑文件写入章节 作者进一步获取文章内容编辑文件继续写入代码import requestsimport timeimport sysfrom lxml import etreefrom urllib import parse# 首先获取访问网站的URldef get_content(url): try: hea原创 2020-05-15 21:29:34 · 455 阅读 · 0 评论 -
Python爬虫_小说爬取(差差差)
前提准备安装Python以及必要的模块(requests,xpath)新笔趣阁流程代码(弟弟代码)import requestsimport timeimport sysfrom lxml import etree# 首先获取访问网站的URldef get_content(url): try: headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWeb原创 2020-05-14 21:14:32 · 1586 阅读 · 0 评论 -
python正则表达式
python正则表达式对我!正则表达式主要应用在爬虫上(一)基础演示import repattern1 = "cat"pattern2 = "bird"string = "dog runs to cat"print(re.search(pattern1, string)) #result: <_sre.SRE_Match object; span=(12, 15), match='cat'>print(re.search(pattern2, string))原创 2020-05-13 20:47:07 · 249 阅读 · 0 评论