
自然语言处理
jingyi130705008
你已经很好了,只是你还可以更好。如有疑问,可加qq 1339087315联系~
展开
-
FastText 微调
安装之前只需要把model.cc文件中以下几行代码注释掉即可实现【冻结词向量】。原创 2024-03-31 17:04:28 · 484 阅读 · 0 评论 -
基于gensim的文档相似度判断
基于gensim的文档相似度判断:包含文本预处理、向量获取、相似度计算等。原创 2022-11-01 15:17:14 · 422 阅读 · 0 评论 -
paddlenlp使用预训练模型实现快递单信息抽取中CrossEntropyLoss()指定weight报错
paddlenlp使用预训练模型实现快递单信息抽取中CrossEntropyLoss()指定weight报错原创 2021-08-17 19:44:38 · 490 阅读 · 0 评论 -
深度学习在NLP中的演进
前一段时间看了一篇知乎专栏《PTMs| 2020最新NLP预训练模型综述》,介绍了NLP的一些主流模型。如下图所示:原创 2021-02-18 17:32:15 · 242 阅读 · 0 评论 -
TextCNN简介与应用
1.基本原理介绍 TextCNN常用来做短文本的分类问题,其基本网络结构如下图所示:从上图不难看出,TextCNN主要包括嵌入层、卷积层、池化层和全联接softmax层:Embedding:这一层是图中最左边的7乘5的句子矩阵,高为句子中单词的个数,宽为词向量的纬度,这个可以类比为图像中的原始像素点。 Convolution:这一层经过 kernel_sizes=(2,3...原创 2020-02-03 20:09:02 · 1526 阅读 · 0 评论 -
FastText简单实践
fastText原理和文本分类实战https://blog.youkuaiyun.com/feilong_csdn/article/details/88655927Python interfacehttps://github.com/salestock/fastText.pyimport fasttextroot_path = "/Users/documents/"t...原创 2020-01-16 17:47:59 · 536 阅读 · 0 评论 -
textRank原理及实现
TextRank原理同PageRank一样,这里暂时就不论述:1.代码实现# encoding = utf-8import jieba# 利用jieba分词# 返回分割后的word listdef getWords(text): allGraphs = text.split('\n') allWords = [] for graph in allGraphs: all...原创 2020-01-13 15:38:24 · 831 阅读 · 0 评论