22、实现爬虫即服务

实现爬虫即服务

1. 使用 Elasticsearch 查询特定技能的工作岗位

1.1 准备工作

示例代码默认使用本地 Elastic Cloud 引擎,而非本地 Elasticsearch 引擎,你可按需修改。当前操作将在本地运行的单个 Python 脚本中完成,而非在容器或 API 后执行。

1.2 操作步骤

代码位于 11/03/search_jobs_by_skills.py 文件中,具体步骤如下:

from sojobs.scraping import get_job_listing_info
from elasticsearch import Elasticsearch
import json

if __name__ == "__main__":
    es = Elasticsearch()
    job_ids = ["122517", "163854", "138222", "164641"]
    for job_id in job_ids:
        if not es.exists(index='joblistings', doc_type='job-listing', id=job_id):
            listing = get_job_listing_info(job_id)
            es.index(index='joblistings', doc_type='job-listing', id=job_id, body=listing)
    search_defin
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值