- 博客(7)
- 收藏
- 关注
原创 tensorflow 2.0+ 基于预训练BERT模型的多标签文本分类
tensorflow 2.0+ 基于BERT的多标签文本分类在多标签分类的问题中,模型的训练集由实例组成,每个实例可以被分配多个类别,表示为一组目标标签,最终任务是准确预测测试数据的标签集。例如:文本可以同时涉及宗教、政治、金融或教育,也可以不属于其中任何一个。电影按其抽象内容可分为动作片、喜剧片和浪漫片。电影有可能属于多种类型,比如周星驰的《大话西游》,同时属于浪漫片与喜剧片。多标签和多分类有什么区别?在多分类中,每个样本被分配到一个且只有一个标签:水果可以是苹果或梨,但不能同时是苹果和
2020-09-22 17:48:03
4680
2
原创 tensorflow 2.0+ 基于预训练BERT模型 的文本分类
简介基于transformers的语言模型在许多不同的自然语言处理(NLP)基准任务测试上都取得了很大进展。迁移学习与大规模的transformers语言模型训练的结合正在成为现代NLP的一个标准。在这篇文章,我们对transformers体系结构和文本分类问题做一些必要的理论介绍。然后,我们将演示预训练BERT模型在文本分类任务的微调过程,这里运用的是TensorFlow 2.0+的 Keras API。文本分类–问题及公式一般来说, 分类是确定新样本的类别问题。我们有数据集D,在文档中包含文本
2020-08-26 17:22:14
9034
20
原创 在python sklearn使用 SVM做分类
sklearn 之 SVM SVC(C-Support Vector Classification)实现基于libsvm,台湾大学林智仁教授团队开发的一个库。支持多分类。 1. SVM二分类 >>> import numpy as np>>> X = np.array([[-1, -1], [-2, -1], [1, 1], [2, ...
2018-04-19 00:37:10
48005
2
原创 Long-Short Term Memory(长短时记忆模型)
长短期记忆(Long-Short Term Memory, LSTM)是一种时间递归神经网络(RNN),论文首次发表于1997年。由于独特的设计结构,LSTM适合于处理和预测时间序列中间隔和延迟非常长的重要事件。 LSTM的表现通常比时间递归神经网络及隐马尔科夫模型(HMM)更好,比如用在不分段连续手写识别上。2009年,用LSTM构建的人工神经网络模型赢得过ICDAR手写识别
2017-07-14 10:33:18
13802
1
原创 决策树(Decision tree)
机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表某个可能的属性值,而每个叶节点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测。1. 决策树的构造
2017-06-29 10:31:23
1011
原创 推荐系统得分与SVD提升性能
本文基于《机器学习实战》第14章内容1. 推荐系统得分计算原理。 首先,说一下推荐系统。因为SVD的其中一个应用就是推荐系统。 简单版本的推荐系统能够计算项或者人之间的相似度。更先进的方法则先利用SVD从数据中构建一个主题空间,然后在该空间下计算其相似度。 这里从食物推荐介绍。推荐的目的是希望为用户寻找没有尝过又好
2017-06-22 10:35:52
640
原创 Win10下安装tensorflow (Python3.5)
现在windows下也可以直接安装tensorflow了,但是版本要求是Python 3.5.x1. CPU版本如果你的系统没有 NVIDIA GPU,只能安装CPU版本。最简单的方法是pip安装,(1)安装好Python 3.5.x(2)安装好numpy 与pip , 因为tensorflow是基于numpy写的。(最好是安装numpy+mkl)(3)最后
2017-06-20 23:32:53
2280
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人