class ABCD:
def create_urls(self) -> []:
pass
def parse_the_list_page(self):
pass
def parse_details_page(self):
pass
def start_spider(self, max_workers: int = 16):
print('ojbk:', self)
self.create_urls()
self.parse_the_list_page()
self.parse_details_page()
问题1:
celery直接调用start_spider时候,无法传入self参数,可以通过另外建立一个方法,用来调用爬虫的start_spider,例如:
@app.task
def spider():
ABCD().start_spider()
问题2:
当celery调用爬虫时,爬虫的类方法里面存在有logger模块时,使用logger.add方法会导致celery无法调用爬虫,需要将logger.add方法去掉即可
在Celery中直接调用start_spider方法无法传入self参数,可以创建一个装饰器任务来间接调用。同时,如果爬虫类方法内使用logger.add会导致Celery调用失败,需移除该方法。
2509

被折叠的 条评论
为什么被折叠?



