- 博客(119)
- 收藏
- 关注
原创 ssti总结
小学的时候拿别人的好词好句,套在我们自己的作文里,此时我们的作文就相当于模板,而别人的好词好句就相当于传递进模板的内容。那么什么是模板注入呢,当不正确的使用模板引擎进行渲染时,则会造成模板注入通俗点理解:拿到数据,塞到模板里,然后让渲染引擎将赛进去的东西生成 html 的文本,返回给浏览器,这样做的好处展示数据快,大大提升效率。
2022-09-18 12:58:00
2779
原创 每日爬虫6
import requestsfrom lxml import etreeurl = 'https://kunming.zbj.com/search/f/?kw=sass'resp = requests.get(url)# print(resp.text)html = etree.HTML(resp.text)# 拿到单个服务商的信息divs= html.xpath("/html/body/div[6]/div/div/div[2]/div[7]/div/div")for div in d
2022-04-05 22:06:27
598
原创 每日爬虫5
import requestsfrom lxml import etreeurl = "https://beijing.zbj.com/search/f/?type=new&kw=saas"resp = requests.get(url)# print(resp.text)# 解析html = etree.HTML(resp.text)# 拿到每一个服务商的divdivs = html.xpath("/html/body/div[6]/div/div/div[2]/div[4]
2022-04-02 20:27:30
151
原创 每日爬虫4
# 1.拿到主页面的源代码. 然后提取到子页面的链接地址, href# 2.通过href拿到子页面的内容. 从子页面中找到图片的下载地址 img -> src# 3.下载图片import requestsfrom bs4 import BeautifulSoupimport timeurl = "https://www.umei.cc/bizhitupian/weimeibizhi/"resp = requests.get(url)resp.encoding = 'utf-8' #
2022-03-31 20:51:41
92
原创 每日爬虫3
import jsonimport requestsdef get_content_list(): from lxml import etree base_url = "http://news.4399.com/gonglue/kpct/kapai/" resp = requests.get(base_url) #输出状态码 # print(resp) #输出源代码 # print(resp.content.decode("gbk"))
2022-03-25 18:19:55
462
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人