
python
Phtomhive
这个作者很懒,什么都没留下…
展开
-
爬虫(三、清洗和组织数据)
将爬虫(二)提取到的数据进行清洗:清洗代码如下图所示:原创 2020-01-10 13:49:37 · 343 阅读 · 0 评论 -
爬虫(二、提取数据)
上一篇通过requests库已经可以抓到网页源码了,这一篇物品们要从源码中找到并提取数据。(此处选用Beautiful Soup库[词库的作用是抓取数据])select里面的搜索路径用下图的方式copy放进去:...原创 2020-01-10 13:31:03 · 265 阅读 · 0 评论 -
爬虫(初级)
crawler基本原理:Request(请求):每一个展示在用户面前的网页都必须经过这一步,也就是向服务其发送请求; Response(响应):服务器在接收到用户的请求后,会验证请求的有效性,然后向用户(客户端)发送响应的内 ...原创 2020-01-10 12:03:01 · 305 阅读 · 0 评论 -
pyCharm简单的调试指南
针对一个后缀为.py的文件如何进行调试,分两种类别:第一种:跳过函数内部的程序调试步骤: 1.点击右上角的虫子图标,然后下面会有控制面板出来,再点击Debugger,然后我们在行号那里选择要调试哪一行,点击就会有红点。如下图所示:2.最后再次点击那个虫子图标,这个时候就可以开始进行调试了,点击Step Over 或者快捷键F8就可以进行调试了。如下图:第二种:针对函...转载 2020-01-10 09:50:03 · 267 阅读 · 0 评论 -
python基础数据类型(字符串处理)
1.将字符串更改内容的方法:a = 'abcde' 改成 ‘abqde': 方法一:用join的方法,str.join(sequence); 方法二:用replace的方法,str.replace(old,new[ ,max]); 方法三:用序列切片的方法,2.从字符串s = "abcd"中取出'd‘: ...原创 2019-07-08 14:10:30 · 1094 阅读 · 0 评论 -
基本语句和函数 python
1. a = [1,2,3] b = [4,5,6] 输出 [1,2,3,4,5,6] 方法一: 方法二: 方法三:a + b2.3.在集合set['a','b','c','d'],添加’jay‘: 将集合b = set(['b','e',...转载 2019-07-08 19:52:22 · 216 阅读 · 0 评论 -
装饰器
1.闭包函数的原理就是包含内层函数的return和外层环境变量2.装饰器在本质上是一个python函数,其他函数在不需要做任何代码变动的前提下增加额外功能,装饰器的返回值(return)也是一个函数对象.3.使用装饰器极大的服用了代码,但是它有一个缺点就是原函数的元信息不见了。为此解决的方法是使用functools.wraps,wraps本身也是一个装饰器,它能把原函数的...转载 2019-07-10 13:46:39 · 110 阅读 · 0 评论