- 博客(9)
- 收藏
- 关注
原创 在深度学习时代如何用 HowNet 搞事情 | 讲座笔记
本文时清华大学刘知远教授于 2018 年 5 月 26 日在中关村分享 HowNet 讲座时记录的笔记。 讲座详情:https://mp.weixin.qq.com/s/QyRGYU8-Fl4VcJFuUPhoTQ一、深度学习特点分布式表示层次结构 二、自然语言的表示自然语言包含从汉字到文档的多粒度语言单位,词汇、短语、句子、文档语义符号表示:词袋模型(one ...
2018-05-26 23:38:44
3643
原创 主题模型 LDA 入门(附 Python 代码)
一、主题模型在文本挖掘领域,大量的数据都是非结构化的,很难从信息中直接获取相关和期望的信息,一种文本挖掘的方法:主题模型(Topic Model)能够识别在文档里的主题,并且挖掘语料里隐藏信息,并且在主题聚合、从非结构化文本中提取信息、特征选择等场景有广泛的用途。主题可以被定义为“语料库中具有相同词境的词的集合模式”,比如说,主题模型可以将“健康”,“医生”,“病人”,“医院” ...
2018-05-25 09:25:19
110572
70
原创 深度学习(CNN RNN)在文本分类中的应用
一、文本分类历史上世纪 50 年代:专家规则(pattern)上世纪 80 年代:知识工程建立专家系统上世纪 90年代后:统计学习方法,人工特征工程 + 浅层分类模型特征工程机器学习的目标是把数据转换成信息,再提炼到知识的过程。特征工程没有很强的通用性,主要要结合对特征任务的理解,主要分为,文本预处理、特征提取、文本表示,将文本转换为计算机可以理解的形式,封装能...
2018-05-25 08:55:08
8925
原创 基于 LSTM 的 Character-Level 文本生成模型
1. 序列数据的生成步骤Deep learning 产生序列数据的方法一般是用 RNN 来预测下一个或者多个 token,比如说给定输入 “the cat is on the ma”,那么网络就会训练数据并且产生目标”t”,这里的 token 可以是一个词或者一个字符,任何 Deep Learning 的网络都可以给下一个 token 的概率建模,我们将这个网络训练出来的模型称为 “语言模型”...
2018-03-06 13:24:40
8333
1
原创 LSTM-RNN 前向传播原理及 Python 实现
1.Forward propagation for the basic Recurrent Neural Network1.1 - RNN cell 1. 计算隐藏状态 : a⟨t⟩=tanh(Waaa⟨t−1⟩+Waxx⟨t⟩+ba)a⟨t⟩=tanh(Waaa⟨t−1⟩+Waxx⟨t⟩+ba)a^{\langle t \rangle} = \tanh(W_{aa} a^{\l...
2018-03-05 15:03:24
2677
原创 中文分词引擎 java 实现 — 正向最大、逆向最大、双向最大匹配法
正向最大匹配法分词目标:在词典中进行扫描,尽可能地选择与词典中最长单词匹配的词作为目标分词,然后进行下一次匹配。 算法流程:假设词典中最长的单词为 5 个(MAX_LENGTH),那么最大匹配的起始子串字数也为 5 个(1)扫描字典,测试读入的子串是否在字典中(2)如果存在,则从输入中删除掉该子串,重新按照规则取子串,重复(1)(3)如果不存在于字典中,则从右向左减少...
2018-02-22 05:04:40
7597
3
原创 Apache http.conf 实例配置详解
##################################### General Settings##################################ServerType standalone# apache软件安装的位置,主机目录ServerRoot "/usr/local/apache"# 记录 httpd 父进程的进程号PidFile "/var...
2018-02-20 08:08:07
4262
原创 HTTP协议常用头部实例详解(Request、Response)
Request Headers分析 HTTP 协议的时候可以通过浏览器的开发者工具进行查看。下图是访问的URL:https://www.google.com.hk/Accept:text/html, application/xhtml+xml, application/xml;q=0.9, image/webp, image/apng, */*; q=0.8作用:向服务器申明...
2018-02-20 06:40:07
34609
8
翻译 基于卷积神经网络的图像超分辨率[译文]
提出了一种基于卷积神经网络的单图像超分辨率方法。方法直接学习低/高分辨率图像之间的端对端映射。映射表现为一个深度卷积神经网络,它将低分辨率图像作为输入,将高分辨率图像作为输出。并进一步证明了传统的基于稀疏编码的SR方法可以被看做为CNN。但是不像传统的方法分开处理每个部件,我们的方法共同优化了所有的层。深度CNN有轻量的结构,但是也展现出先进的重建质量,并且在实际在线使用中展现了良好的速度。
2017-03-07 15:24:29
26197
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人