常见问题解决方案 - SkillNER开源项目-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00198/article/details/144820543

常见问题解决方案 - SkillNER开源项目

SkillNER A (smart) rule based NLP module to extract job skills from text 项目地址: https://gitcode.com/gh_mirrors/sk/SkillNER

1. 项目基础介绍和主要编程语言

SkillNER是一个基于规则的自然语言处理（NLP）模块，用于从文本中自动提取技能和认证信息。这个项目主要应用于从职位发布和求职者的简历中识别技能点。SkillNER使用EMSI数据库（一个开源技能数据库）作为知识库链接器，以防止技能信息的重复。

该项目的主要编程语言是Python，并且依赖于几个流行的Python库，如spacy进行自然语言处理。

2. 新手常见问题及解决步骤

问题一：如何安装SkillNER？

问题描述： 新手在使用SkillNER前，需要先安装这个模块。

解决步骤：

使用pip命令安装SkillNER：
```
pip install skillner
```
安装spacy的en_core_web_lg模型，这是SkillNER的一个主要插件：
```
python -m spacy download en_core_web_lg
```
注意：安装en_core_web_lg可能需要一些时间，因为它的体积较大（约800MB），但只需要安装一次。

问题二：如何使用SkillNER提取技能？

问题描述： 用户安装完SkillNER后，可能不清楚如何使用它来提取技能。

解决步骤：

导入必要的模块：

import spacy
from skillner.skill_extractor_class import SkillExtractor

加载spacy的模型和SkillNER的技能提取器：

nlp = spacy.load("en_core_web_lg")
skill_extractor = SkillExtractor(nlp)

使用提取器处理文本，例如提取职位发布中的技能：

text = "You are a Python developer with a solid experience in web development and can manage projects."
skills = skill_extractor.extract_skills(text)
print(skills)