- 博客(6)
- 收藏
- 关注
原创 word2vec结合TF_IDF进行多标签文本分类(三)
本文是在Word2vec的基础上结合TF_IDF对中文文本分类的方式。数据格式见此链接关于TF_IDF的理论可自行搜索具体方式参考下图:模型构建:迭代结果:结果可视化:
2022-07-13 11:47:20
1343
2
原创 采用Bi-LSTM结合Word2vec进行中文文本多标签分类
关于word2vec的详细介绍可以参考此篇文章实现方式采用了gensim工具,并根据结果进行文本向量化。本篇文章采用的数据集和上篇文章采用的一样和上篇文章不同的是加入了注意力机制层和进行词嵌入的时候对权重进行了赋值,关于keras中Embedding层的介绍可以参考这篇文章并引入了Bi-LSTM构建的模型:运行结果:结果可视化:...
2022-07-12 19:40:28
1237
4
原创 基于keras采用LSTM实现多标签文本分类(一)
1.多标签即一条语句可能有多个类别划分。例如,这个酸菜鱼又酸又辣。属于酸和辣两个标签。在采用神经网络学习时,最后一层的激活函数应采用sigmoid激活函数,相当于对这条语句做了多个二分类。2.多分类即每条语句只有一个标签,在采用神经网络学习时,最后一层的激活函数应采用softmax激活函数,最后选取类别中的最大值作为预测结果。关于sigmoid和softmax 的区别此处再说明。本次数据集的格式为:关于LSTM的学习可以参考这篇。关于词向量化的方式,本文采用keras 内置Tokenizer A
2022-07-08 21:25:17
2907
1
原创 Java 实现线段树的两种方式
线段树就是采用树形结构维护数组区间,使得查询的时间复杂度由O(n)下降到O(log n)方式一数组实现:方式二 建树实现:
2022-07-06 22:18:21
410
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人