最近有人私信说,上一篇爬虫太难了,我看不懂,然后我今天就发布一篇超级无敌简单的爬虫。
上代码:
import requests
if __name__ == '__main__':
#指定url
url = "https://www.baidu.com/"
#发送请求
response = requests.get(url=url)
#获取响应的数据 response.text是响应的字符串形式的数据
page_text = response.text
print(page_text)
#持久化存储
with open('./baidu.html', 'w', encoding='utf-8') as fp:
fp.write(page_text)
print('爬取成功')
说明一下哈:这里需要安装requests库,
可以直接pip install requests 也可以根据第一篇的爬虫进行安装自行选择。
爬取成功后就会显示一个小的网页的全部信息,可以试一下,适合新手。