spaCy预训练模型与用户自定义模型的合并问题
如前文《spaCy V3.0 文本分类模型训练、评估、打包及数据预处理》,训练了一个自定义文本分类模型。欲将其与spaCy的中文预训练模型合并使用,发现文本分类准确率没有了。单独使用完全没有问题。
mynlp = spacy.load('training/config/model-best')
nlp = spacy.load('zh_core_web_sm')
nlp.add_pipe('textcat', source=mynlp)
doc = nlp('循环泵投运前的检查')
print([t.text for t in doc])
print([(t.tag_, t.dep_, t.head.text) for t in doc])
print(doc.cats)
结果如下:
[循环泵, 投运, 前, 的, 检查] #分词没有问题
[(‘NN’, ‘compound:nn’, ‘投运’),
(‘NN’, ‘nmod’, ‘检查’),
(‘LC’, ‘case’, ‘投运’),
(‘DEG’, ‘case’, ‘投运’),
(‘NN’, ‘ROOT’, ‘检查’)] #词性及语义解析也正确
{‘A’: 0.09942209720611572,
‘B’: 0.11867694556713104,
‘C’: 0.1328020542860031,
‘E’: 0.041155699640512466,
‘M’: 0.14576852321624756,
‘O’: 0.1472093015909195,
‘R’: 0.26786068081855774,