NLP
NER, Multilabel-classification, Relation-Extraction, BERT, GPT, ChatGPT,
magic_road
土豪的生活你无法理解
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
NER任务中BERT-CRF 模型的英文数据padding与aligning
最近因为需要用BERT-CRF模型做一个英文数据的实体抽取模型训练,因为github上BERT-CRF大多是对中文数据做NER, 这里特此记录一下处理过程中的解决方法与思路,废话不多说直接上代码,这里的代码模版参考的是 CLUENER2020项目下的BERT-CRF模型代码, 主要修改部分在 collate_fn 部分的 batch数据的 padding与aligning处理。原创 2022-09-22 17:45:51 · 1181 阅读 · 0 评论 -
Multi-label classification 遇到文本张量不一致问题
在文本多分类模型测试过程报如下错误: RuntimeError: stack expects each tensor to be equal size, but got [512] at entry 0 and [863] at entry 7.之前模型代码写的是 truncation='only_second', 如果文本数据长度差异太大,就必须 truncation设置为True. 改好后就没有上面报错。原创 2023-03-28 14:30:00 · 492 阅读 · 1 评论
分享