自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 给大家推荐一篇综述文章,对于词向量的发展说的非常详细。可以迅速了解目前以及历史的主流工具以及方法。

综述简介。

2024-06-19 17:56:13 180

原创 词频g指数计算方法-python实现

词频指数g计算方法以及python实现

2022-11-16 11:17:47 1127

原创 lda主题演化与热度python实现

lda主题演化与热度python实现

2022-10-11 21:51:23 8699 63

原创 python轮子文件下载网址推荐

python库轮子文件下载

2022-07-07 21:00:51 1547

原创 关于最近自然语言处理的一些心得体会(二)

在分词方面 我最终选用了JIEBA分词:我通过AINLP公众号进行了对比 ,对比结果如下:通过其分词结果可以看出效果比较好的有:jieba, HANLP, BaiduLac之前笔者尝试过斯坦福nlp 由于其在中文分词的里面分的将词汇分的过于精细,导致其分词效果到达不了我们想要的结果,最终笔者选择了jieba。ps: HANLP感觉很是很棒的, 大家也可试一下。在这里给大家推荐一个中文分局的方法:用python进行精细中文分句(基于正则表达式)那么我们继续进行下一步的步骤。我们首先将

2021-10-20 11:03:28 1860

原创 关于最近自然语言处理的一些心得体会(一)

首先是关与文档处理: 在我们批量处理文档的时候,首先要做的是读取某个文件夹下的所有txt文件名,并通过文件名来定位其文件并读取。因此:我们可以用os.listdir命令进行读取。具体在python实现如下:path = "E:/pythoncode/test-corpus/corpus"filename = os.listdir(path)filenames = []doc = []for i in filename: filenames.append(i) # ..

2021-10-18 16:30:49 1001

词向量综述文章,推荐观看

词向量综述词向量综述

2024-06-19

维基百科100维词向量模型下载

word2vec预训练模型,gensim做的

2022-08-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除