
python爬虫学习总结
qq_43028008
Be who you were created to be, and you will set the world on fire。
展开
-
Selenium和PhantomJS的使用总结
1. SeleniumSelenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,类型像我们玩游戏用的按键精灵,可以按指定的命令自动操作,不同是Selenium 可以直接运行在浏览器上,它支持所有主流的浏览器(包括PhantomJS这些无界面的浏览器)。Selenium 可以根据我们的指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏,或者判断网站上某些动作是否发生。...原创 2019-07-07 22:09:16 · 226 阅读 · 0 评论 -
正则表达式总结
1. 正则表达式的初步介绍正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是用来匹配字符串非常强大的工具,在其他编程语言中同样有正则表达式的概念,Python同样不例外,利用了正则表达式,我们想要从返回的页面内容提取出我们想要的内容就非常简单了规则:...原创 2019-06-29 22:38:02 · 103 阅读 · 0 评论 -
xpath的总结
1. XPath语法XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 都构建于 XPath 表达之上1.1 节点的关系父(Parent)子(Children)同胞(Sibling)先辈(Ancestor)后代(Descendan...原创 2019-07-06 21:23:40 · 169 阅读 · 0 评论