首先安装环境,在setting里面的project interpreter里面安装requests和lxml



首先第一步:抓取网页 从url开始 在url里面输入要爬取的网站

第一种方法 通过lxml和xpath组合得到(在网页中按下F12在左边小箭头那里获取要爬取的数据的目录)
之后进行for in 循环

保存到text
content = ’ '.join(content)
print(content)
save_txt(name,content)
未完待续。明天更
5万+

被折叠的 条评论
为什么被折叠?



