初始化一个scrapy项目
scrapy startproject ifengHotNews 用scrapy初始化一个爬虫项目
import scrapy
class getIfengNews(scrapy.Spider):
name = "hotNews"
start_urls = ["http://www.ifeng.com/"]
def parse(self, response):
for con in response.xpath('//div[@id="headLineDefault"]/ul/ul[2]/li'):
txt = con.xpath('a/text()').extract_first()
yield {'title': txt}
执行 scrapy runspider hotNews.py -o ./ifengHotNews.json
生成的文件
本文介绍如何使用Scrapy框架初始化并实现一个简单的凤凰网新闻爬虫项目。通过具体代码示例,展示从创建项目到解析数据的全过程。
767

被折叠的 条评论
为什么被折叠?



