在网易云课堂上看的教学视频,现在来巩固一下知识:
- 先确定自己要爬的网站,以新浪新闻网站为例确

import requests #跟java的导包差不多,python叫导入库
res = requests.get('http://news.sina.com.cn/china/')#爬取网页内容
res.encoding = 'utf-8' #将得到的网页内容转码,避免乱码
print(res.text) #将网页内容以text形式输出

2.简单学习BeautifulSoup
from bs4 import BeautifulSoup
a = '<a href