
python
金艾一
大概是个半死宅半虫合丝的准程序员吧
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python正则表达式和re库
----------------------正则表达式 --------------操作符 .任何单个的字符 []字符集,对单个的字符给出取值范围 [^]非字符集,对单个的字符给出排除范围 *前个字符的0到无限次出现 +前个字符的1到无限次出现 ?前个字符0到1次出现 |或,取其一 {m}扩展它的前一个字符m次 {m,n}扩展他的前一个字符m到n次 ^将当前模式从字符串开头开始匹配 $将当前模式...原创 2019-12-28 16:42:48 · 208 阅读 · 0 评论 -
Python网页爬虫练习:requests库&Beautiful爬取bilibili网页信息
我是卢本伟! import requests from bs4 import BeautifulSoup import bs4 def get_blibli_vedio():#获取bilibili实时热榜视频排行榜 url = "https://www.bilibili.com/ranking?spm_id_from=333.851.b_7072696d6172795061676554...原创 2019-12-27 18:48:15 · 1060 阅读 · 0 评论 -
Python网络爬虫 BeautifulSoup库的使用方法
Beautifulsoup库的基本组成元素和基本的API调用方法,需要注意的地方都在注释里了 #!/usr/bin/env python # -*- coding:utf-8 -*- import requests from bs4 import BeautifulSoup def test_beautifulsoup():#测试BeautifulSoup try: ...原创 2019-12-26 13:39:16 · 302 阅读 · 0 评论 -
Python request库基本使用方法
request库的基本使用方法,不多bb,上代码,需要注意的地方都在注释里了 import requests from bs4 import BeautifulSoup def get_html_text(url): try: r=requests.get(url,timeout=50)#返回的r是Response类的对象,超过50s时抛出Timeout异常 ...原创 2019-12-26 13:36:12 · 575 阅读 · 0 评论