自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

lqk

从零开始,需要鸡汤

  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

转载 自然语言处理系列-2-文本分类-深度学习-2

3. 正文与标题文档分为正文和标题两部分,一般两部分分开处理,可以共享Embedding层也可以不共享,人机写作分类问题中我们没有共享Embedding。3.1 正文多层CNN,未使用标题CNN需要设置不同大小的卷积核,并且多层卷积才能较好的捕获文本的特征,具体网络结构如下:3.2 正文 CNN Inception,未使用标题3.3 基于Hierarchical Attention的...

2018-09-19 20:08:40 716

转载 自然语言处理系列-2-文本分类-深度学习-1

深度学习模型的重点是模型的构建和调参,相对来说任务量能小不少。RNN、LSTM等模型由于拥有记忆能力,因而在文本处理上表现优异,但是缺点很明显就是计算量很大,在没有GPU加速情况下,不适合处理大批的数据,CNN在FaceBook的翻译项目上大放异彩也表明CNN在文本处理领域上的重要性,而且相对RNN来说,速度明显提升。本文尝试了多层CNN、并行CNN、RNN与CNN的结合、基于Hierarchic...

2018-09-19 19:52:48 427

转载 自然语言处理系列-2-文本分类-传统机器学习方法

文档分类是指给定文档p(可能含有标题t),将文档分类为n个类别中的一个或多个,本文以人机写作为例子,针对有监督学习简单介绍传统机器学习方法。 文档分类的常见应用:新闻分类: 也就是给新闻打标签,一般标签有几千个,然后要选取k个标签,多分类问题,可见2017知乎看山杯比赛该比赛是对知乎的问题打标签;人机写作判断: 判断文章是人写的还是机器写的,二分类问题,可见CCF2017的360人机大战题目;...

2018-09-19 18:13:17 1872

转载 自然语言处理系列-2-文本聚类

本文主要简要介绍文本聚类,1: 什么是文本聚类先说说聚类的概念,聚类又称群分析,是数据挖掘的一种重要的思想,聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。(以上来自百度百科).再说到文本聚类,文本聚类其实也...

2018-09-19 15:07:07 3442

转载 自然语言处理系列-1-基本应用

基本应用

2018-09-14 17:52:30 342

转载 计算机视觉系列-2-图像分类

给定一张输入图像,图像分类的任务是判断该图像属于哪类, 如果是多任务分类, 可以用于分类该图像包含哪个类别。 深度学习作为机器学习中非常重要的分支, 在图像领域中应用非常广泛. 在图像分类任务中, 通常采用卷积层(CNN)提取特征, 加上全连接层进行分类, 目前最常见的基于CNN的模型有以下几种:1: LeNet。卷积网络的第一个成功应用是由Yann LeCun于1990年代开...

2018-09-11 21:30:46 2630

原创 计算机视觉系列-1-任务及应用

计算机视觉系列-1-任务及标注下图很好的展示了图像识别的四种任务: 1. 图像分类(Image classification)如图(a), 给定一张输入图像,图像分类的任务是判断该图像属于哪类, 如果是多任务分类, 可以用于分类该图像包含哪个类别。 所以该类任务的标注非常简单, 只需要标注图片的种类即可. 如果是多任务的, 只需要多标注几种图片是否包含某类物品即可;2. 目标检...

2018-09-07 09:25:12 661

python教程

python教程不容错过,ython 编辑 Python[1] (英国发音:/ˈpaɪθən/ 美国发音:/ˈpaɪθɑːn/), 是一种面向对象的解释型计算机程序设计语言,由荷兰人Guido van Rossum于1989年发明,第一个公开发行版发行于1991年。 Python是纯粹的自由软件, 源代码和解释器CPython遵循 GPL(GNU General Public License)协议[2] 。Python语法简洁清晰,特色之一是强制用空白符(white space)作为语句缩进。 Python具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中[3] 有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。需要注意的是在您使用扩展类库时可能需要考虑平台问题,某些可能不提供跨平台的实现。 7月20日,IEEE发布2017年编程语言排行榜:Python高居首位[4] 。

2017-09-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除