JobFunnel 项目推荐
项目基础介绍和主要编程语言
JobFunnel 是一个开源的自动化工具,旨在从多个招聘网站上抓取职位信息,并将这些信息整合到一个无重复的 CSV 文件中。该项目主要使用 Python 编程语言开发,适合 Python 3.11 及以上版本。
项目核心功能
JobFunnel 的核心功能包括:
- 多网站职位抓取:能够从多个招聘网站(如 Indeed、Glassdoor 等)抓取职位信息,避免用户在不同网站之间来回切换。
- 去重功能:自动去除重复的职位信息,确保用户看到的每个职位都是唯一的。
- 自定义配置:支持通过 YAML 配置文件或命令行参数进行自定义搜索,用户可以根据自己的需求设置搜索关键词、地区、职位类型等。
- 自动化搜索:可以设置定时任务(如使用 crontab),实现每晚自动抓取最新的职位信息。
- 远程工作筛选:支持筛选远程工作职位,用户可以根据自己的需求设置远程工作的级别(如全职远程、部分远程等)。
- 公司屏蔽:用户可以屏蔽不感兴趣的公司,避免看到这些公司的职位信息。
- 职位年龄过滤:用户可以设置抓取的职位信息的最大年龄(以天为单位),过滤掉过期的职位信息。
项目最近更新的功能
JobFunnel 最近更新的功能包括:
- 开发者模式安装:新增了开发者模式的安装方式,方便开发者进行代码贡献和调试。开发者模式下,项目会自动安装所有必要的依赖,包括测试、代码格式化等工具。
- 预提交钩子:引入了预提交钩子(pre-commit hooks),确保代码在提交前符合项目的代码风格和质量标准。预提交钩子包括 Black、isort、Prettier 和 Flake8 等工具。
- 代码覆盖率报告:在运行测试时,自动生成代码覆盖率报告,帮助开发者了解测试覆盖情况,确保代码质量。
- 数据恢复功能:新增了从缓存文件夹中恢复丢失数据的功能,用户可以从历史抓取数据中重新构建主 CSV 文件。
- CLI 命令结构优化:优化了命令行接口(CLI)的命令结构,用户可以通过
funnel inline -h
查看详细的命令结构。
通过这些更新,JobFunnel 不仅提升了开发者的使用体验,还增强了项目的稳定性和功能性,使其成为一个更加强大和易用的职位信息抓取工具。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考