
其余
自然语言的其余内容
拙小拙
这个作者很懒,什么都没留下…
展开
-
Springer 期刊的latex模板,参考文献无法显示
1.从该网站下载的latex模板。3. 将上图中bst文件夹下的文件全部拖到上一级。2. 导入模板,代码部分显示引用了文献,但pdf未显示。原创 2024-05-18 22:13:34 · 1089 阅读 · 3 评论 -
torchsnooper输出torch中的变量类型/维度
输出函数中的内容import torchsnooper@torchsnooper.snoop()def func(x,y): ... return 在函数前加@torchsnooper.snoop()输出语句中的内容import torchsnooperwith torchsnooper.snoop(): 语句1 语句2 ··· 在语句前使用with torchsnooper.snoop():下图是一张结果图。...转载 2021-01-27 20:24:58 · 483 阅读 · 0 评论 -
python 实现词向量的表示 包括词袋模型/TF-IDF/Word2Vec
词袋模型from sklearn.feature_extraction.text import CountVectorizer#语料库train_x= ['build fails due publication-tests.xml build target','due to sb']test_x =['build one to ']#将文本中的词语转换为词频矩阵cv_ = CountVectorizer()#计算个词语出现的次数X = cv_.fit_transform(train_x).原创 2020-12-13 20:29:06 · 2598 阅读 · 2 评论 -
python 实现 FastText 包括gensim和fasttext库
A. FastText2种方式:windows10系统安装gensim即可 pip install gensim1. gensim(1) 可用于训练词向量(2) 可找出相似的词向量from gensim.models import FastText# data_token为分词 可运用自己的语料库data_token =[['update', 'orion', '9'], ['import', 'file', "n't", 'work', 'anymore', 'orion.eclipse.转载 2020-10-06 13:12:57 · 2046 阅读 · 3 评论 -
自然语言处理相关的博客链接
如何用 word2vec 计算两个句子之间的相似度?转载 2020-09-06 15:13:09 · 132 阅读 · 0 评论 -
自然语言处理—向量表示
目录将分词进行向量化的表示独热表示(one-hot representation)词空间模型(word space model)1.基于矩阵的分布表示2.基于聚类的分布方法3.基于神经网络的分布方法语言模型常用模型:将分词进行向量化的表示独热表示(one-hot representation)仅符号化词,不包含任何语义信息。词空间模型(word space model)用于词义消歧。目前被直接成为分布表示(distributional representation)<二十世纪90年代>转载 2020-06-30 19:20:06 · 966 阅读 · 0 评论