自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

笔墨留年。

小白成长日记。

博客等级

码龄9年

51
原创

1409
点赞

5148
收藏

1909
粉丝

关注

私信

热门文章

分类专栏

最新评论

python爬虫入门教程(二)：开始一个简单的爬虫
weixin_53534738: import requests from bs4 import BeautifulSoup wy=requests.get('https://www.baidu.com') #请求百度首页 print(wy) #打印请求结果的状态码 print(wy.content) #打印请求到的网页源码 ym=BeautifulSoup(wy.content,'lxml')#将网页源码构造成BeautifulSoup对象，方便操作 a_bq= ym.find_all('a')#获取网页中的所有a标签 text=''#创建一个空字符串 for a in a_bq: href=a.get('href')#获取a标签对象的href属性，即这个对象指向的链接地址 text+=href+'\n' #加入到字符串中，并换行 with open('UL.txt','w') as f: f.write(text)
python爬虫入门教程(二)：开始一个简单的爬虫
何欢小星星: 谢谢楼主
xyolo？几行Python代码轻松完成yolo3目标检测
伤痛在所难免32: setup.py里有下载列表，包的名字对不上，被判为不存在，所以一直下载
python爬虫入门教程(二)：开始一个简单的爬虫
m0_62986094: 谢谢博主
python爬虫入门教程(二)：开始一个简单的爬虫
不会敲码的阿宇: 谢谢作者大大，很优秀一易懂的一篇文章。我这里说一下我学习过程中的一些错误欢迎大家指正，爬取baidu.com输出连接哪里好像百度更新了源网页，会出现不报错但没有输出，改一个其他的网站例如sohu之类的可以看到链接输出。而且保存文本数据时，照着原代码出现了报错，typeErroe,将循环体里面内容加一个判定条件就解决了这个报错， if href: # 检查href是否存在 text += href + '\n' # 加入到字符串中，并换行

数据采集

关注

文章平均质量分 78

关注数：文章数：12 文章阅读量：468169 文章收藏量：3689

作者: 笔墨留年

如果觉得委屈，那就努力让自己变得更强大。

展开

专栏收录文章