SkillNER 开源项目教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00760/article/details/142506568

SkillNER 开源项目教程

SkillNER A (smart) rule based NLP module to extract job skills from text 项目地址: https://gitcode.com/gh_mirrors/sk/SkillNER

1. 项目介绍

SkillNER 是一个基于规则的自然语言处理（NLP）模块，旨在从非结构化的工作岗位描述、文本和申请者的简历中自动提取技能和认证信息。该项目使用 EMSI 数据库（一个开源技能数据库）作为知识库链接器，以防止技能重复。SkillNER 的设计目标是帮助用户快速识别和提取文本中的技能信息，适用于招聘、人才管理等多个领域。

2. 项目快速启动

安装

首先，通过 pip 安装 SkillNER：

pip install skillNer

接下来，安装 spacy 的 en_core_web_lg 模型，这是 SkillNER 的主要插件之一：

python -m spacy download en_core_web_lg

示例代码

以下是一个简单的示例，展示如何使用 SkillNER 从一段文本中提取技能：

import spacy
from spacy.matcher import PhraseMatcher
from skillNer.general_params import SKILL_DB
from skillNer.skill_extractor_class import SkillExtractor

# 初始化 spacy 模型
nlp = spacy.load("en_core_web_lg")

# 初始化 SkillExtractor
skill_extractor = SkillExtractor(nlp, SKILL_DB, PhraseMatcher)

# 定义要处理的文本
job_description = """
You are a Python developer with a solid experience in web development and can manage projects. 
You quickly adapt to new environments and speak fluently English and French.
"""

# 提取技能
annotations = skill_extractor.annotate(job_description)

# 输出结果
print(annotations)