- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 以单字为单位完成CNN文本分类。
CNN(char)文本分类完整流程数据(预)处理网络构建整体调度完整流程常见的深度学习文本分类主要分为三个模块。1、数据处理。2、网络构建。3、整体调度main。数据(预)处理目的 :将各种乱七八糟形式的初始数据转换成神经网络所支持的数据,如:等长的Sentence。举例子:见如下代码块。初始数据: 体育\tNBA球星某某某绝杀了...and so on.转换 ...
2020-03-14 16:41:08
437
原创 Fasttext:最简单最快的分类代码。
关于Fasttext的原理,不多赘述,类似于CBOW的模式来完成分类。使用的python代码。import jiebaimport fastText.FastText as ff# 数据格式 (中文)# 今天 天气 不错 ,所以 我 和 宝宝 出去 玩。 __label__name1 #也就是对数据每一行分词,后缀标签,建议写成这种格式,否则要自己改默认设置。# 要注意 ‘...
2019-09-04 12:21:27
704
原创 python——Fasttext新手学习笔记。
Fasttext 如他的名字一样,最大的特点:fast。[https://github.com/facebookresearch/fastText/tree/master/python#requirements]FastText是一个高效学习单词表示和句子分类的库。在本文中,我们将介绍如何在Python中使用FastText。目录需求/要求(指的是环境要求)安装使用概述1、词表示模...
2019-09-01 23:20:52
7839
4
原创 text_cnn:文本分类实战(三)执行部分
直入正题在搞定数据预处理和建模之后,我们要把这些东西整合起来。代码稍微有点多。功能一、训练事先将各种路径设置好,方便以后的调用。二、测试自己又在以上功能的情况下,添加了单文本的测试。如下图。测试结果如下:接下来会完成charcnn,据说效果会比wordcnn好,因为分词的不准确性。...
2019-08-16 12:44:57
511
原创 text_cnn:文本分类实战(二)参数设置和构建网络
文章目录CNN实战CNN用的是tf.layers.conv1d实战之前在一章完成了数据处理部分,可以将文本转换成等大小的图片,标签可以转换成数字后再one-hot。不多说数据,开始模型的设置。建议写成类class TCNNconfig(object): # CNN 配置参数 n_dim num_class padding_size drop_out ... 调用co...
2019-04-10 11:37:33
1954
原创 text_cnn:文本分类实战(一)数据处理部分
文章目录原理介绍实战原理介绍这里就简单介绍几句原理,也不上图了,因为讲的细的blog超级多。传统的CNN用来处理图像数据,通过卷积提取特征,方便处理。文本和图像的区别在于文本的特征相对较少,所以可以采用一维卷积进行特征提取。步骤如下:(一)文本拉伸成一个图片(矩阵):词嵌入,可以采用w2v(二)卷积层:对矩阵进行卷积(三)池化层:Max Pooling 使卷积后的特征数据变成一列(行...
2019-04-10 11:16:43
2409
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人