
爬虫
a447380142
这个作者很懒,什么都没留下…
展开
-
爬虫笔记——HTTP请求
请求过程: 谷歌浏览器F12,请求www.baidu.com,如下: Name:请求的名称,一般是URL的最后一部分 Status:响应状态码,判断发送的是否得到了响应 Type:请求的文档类型 Initiator:请求源 Size:从服务器请求的资源大小 Time:从请求...原创 2019-01-17 20:25:29 · 222 阅读 · 0 评论 -
爬虫基础之列表、数组
列表 list 名字 = [元素1,元素2, ……] 可以理解为无限大,但实际是有限的。 增: 末尾追加 list.append[值] 任意位置 list.insert[位置,新数值] 直接用+ 删: del list[位置] list.remove[列表中的值] list.pop[倒序位置,正序从0开始,倒序从0开始到负数] 改: 直接修改 list[位置]=新值,...翻译 2019-02-21 20:14:51 · 641 阅读 · 0 评论 -
爬虫基础之字典、无序列表及与列表和元组的区分
字典 dict 格式 dict = {key1:value1, key2:value2, key3:value3,...} 与 list 对比 list = [4,5,6,7] index: 0 1 2 3 value: 4 5 6 7 dict1 = {"a":4, "b":5, "c":6, &q翻译 2019-02-21 21:29:05 · 480 阅读 · 0 评论 -
爬虫基础之 urllib
get :是通过网站传递参数或者直接打开页面,请求页面 post:是通过form,并不在网址上体现内容,进行数据传递 www.xxxyyy.com/temp.html?a=1&b=2 form_data = {“c”:1,“D”:2} username,password 一般都是post传递, url?username=xxxx&password=yyyy 也可以 https:/...翻译 2019-02-26 21:27:36 · 123 阅读 · 0 评论