
python
python
黑夜中坚持
这个作者很懒,什么都没留下…
展开
-
爬虫爬取网站数据(urllib、requests、lxml)
简介 urllib和requests都可以进行页面爬取操作,通过urllib.urlopen()、requests.get()等方法传入url从而获取url页面等信息.另外可以通过lxml中的etree方法通过xpath解析DOM树.其他的库比如BeautifulSoup和lxml一样都可以用来解析xml/html. 使用实例代码(requests+lxml) # -*- coding: UTF-8 -*- import sys reload(sys) sys.setdefaultencoding(..原创 2021-06-02 16:14:58 · 684 阅读 · 1 评论 -
python中heapq的使用
from heapq import heapify, heappop, heapreplace, heappush, nsmallest, nlargest # 创建最小堆 heapify(list) # 从最小堆中删除并返回栈顶元素 top = heappop(list) # 向最小堆中添加元素 heappush(list, val) # 从最小堆中先删除栈顶元素然后向最小堆中添加元素 res = heapreplace(list, val) # 先向最小堆中添加元素val,并返回堆顶元素 res = h原创 2020-07-24 11:36:46 · 721 阅读 · 0 评论