
Python
小卖部出来的Coder
这个作者很懒,什么都没留下…
展开
-
网络爬虫(三):正则表达式
正则表达式是处理字符串的强大工具,它有自己特定的语法结构。有了它,我们就能实现字符串的检索、替换、匹配验证。对于爬虫来说,有了它,要从 HTML 里提取想要的信息就非常方便了。打开开源中国提供的正则表达式测试工具 http://tool.oschina.net/regex/,输入待匹配的文本,然后选择常用的正则表达式,就可以得出相应的匹配结果了。例如,输入下面这段待匹配的文本:Hell...原创 2020-03-13 23:11:46 · 568 阅读 · 1 评论 -
网络爬虫(二):爬虫基本库Requests的使用
2.4 cookie与session原创 2020-03-12 22:48:56 · 560 阅读 · 0 评论 -
网络爬虫(一):爬虫基础原理
一、学习前言学习完Python语言后,总觉得有难以用武之地,纸上学来终觉浅,绝知此事要躬行,如果不加以使用就很容易忘记,为了加深python语言的记忆和理解,我选择学习网络爬虫的技术来进一步提升自己的能力。其次觉得爬虫是一项必须掌握的技术,有很多用武之地,看似简单却趣味无穷,入门容易但真的想做好也是需要下一番功夫的。经过我的一番了解和学习,爬虫技术也有很深的奥秘,爬虫技术也很容易失效,企业...原创 2020-03-04 23:05:42 · 1670 阅读 · 0 评论