
自然语言处理
文章平均质量分 53
菜菜的菜001
这个作者很懒,什么都没留下…
展开
-
英文文本处理流程
‘’’ nltk学习 & 常见的英文文本处理流程包括的步骤:’’’分词 Tokenization英语的分词就是简单的分词,包括标点,而中文的分词则是在识别单词。词性标注 Part-of-speech Tagging·词性标注实际上包含了分词和标注两个部分。句法分析 Constituency Parsing1.导入 相应的类、库import nltkfrom nltk import word_tokenize,sent_tokenizetokenization,也叫word segm原创 2022-02-24 15:44:01 · 1254 阅读 · 0 评论 -
指代消歧工具安装
spacy安装步骤:1.可以直接pip spacy (与neuralcoref结合应用的话,酌情安装 -_- )2.下载model(预训练模型),如en_core_web_sm(面向英语的小模型)[pip注意安装位置,压缩包形式:压缩文件名.tar.gz]。注意下载与自己spacy对应版本的en_core_web_sm,参考https://github.com/explosion/spacy-models/releases/tag/en_core_web_sm-2.1.0en_core_web_l原创 2022-02-23 09:40:24 · 1736 阅读 · 2 评论 -
自然语言处理
英文处理基本操作原创 2022-02-22 17:08:54 · 653 阅读 · 0 评论