Python
文章平均质量分 57
只要我足够菜,你们就骂不了我
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
淘宝商品信息定向爬虫
只用来学习请勿无限制使用爬虫 功能描述 目标:获取淘宝搜索页面的信息媒体去其中的商品名称和价格 程序的结构设计 步骤1:提交商品搜索请求,循环获取页面 步骤2:对每个页面,提取商品名称和价格信息 步骤3:将信息输出到屏幕上 修改headers的方法请看:https://blog.youkuaiyun.com/wyatt007/article/details/105433009 import requests import re def getHTMLText(url): try: # 淘宝用了原创 2021-07-19 01:35:19 · 892 阅读 · 0 评论 -
全国理科大学排名定向爬虫实例
全国理科大学排名(拿来练手就好别贪玩哦) 程序的结构设计 步骤1:从网页上获取大学排名网页内容getHTMLText() 步骤2:提取网页内容中信息到合适的数据结构fillUnivList() 步骤3:利用数据结构展示并输出结果printUnivList() import requests from bs4 import BeautifulSoup import bs4 def getHTMLText(url): try: r = requests.get(url, timeout原创 2021-07-17 02:24:44 · 154 阅读 · 0 评论 -
Python爬虫学习笔记
requests库 Beautiful Soup库 Tag 标签,最基本的信息组织单元,分别用<>和</>标明开头和结尾 Name 标签的名字,< p >…< /p >的名字的p,格式:< tag >.name Attributes 标签的属性,字典形式组织,格式:< tag >.attrs NavigableString 标签内非属性字符串,<>…</> 中字符串,格式< .原创 2021-07-16 19:35:59 · 154 阅读 · 0 评论
分享