- 博客(20)
- 收藏
- 关注
原创 情感分析学习笔记
简介最主要就是说情感分析在实际的应用场景中起到一个什么作用。词法分析学习笔记:词法分析处理流程其实就是基于句子中正负情感的关键词多少来判断句子的情感立场。词法分析的关键点是情感词典的建立与维护,缺点也是随着情感词典的变大维护难度了加大,维护成本上升,搜索性能下降。机器学应用在情感分析中的应用学习笔记:这个PPT其实就是说明子如何使用朴素贝叶斯来解决垃圾邮件问题,其实和中文分词中讲...
2020-03-27 16:29:12
542
原创 句法分析学习笔记
句法分析能够帮助我们更好的理解句子,说白了就是从语法的角度来理解句子的含义。句法分析难点与方法学习笔记:此张PPT主要就是说明了由于中文的特性,使得中文的句法分析成熟度不高,较于词法分析的成熟度低。此张PPT主要在说树库起到的作用,有了树库才有统计学应用于句法分析,即PCFG。而树库就是用来给候选树打分的基础,有了大规模树库才能够对正确的句法树打一个高分值,而不合理的句法树则会得一个...
2020-03-17 17:11:47
508
原创 关键词提取算法学习笔记
简介中最为重要就是说了有监督算法和无监督算法的区别,为什么有监督算法不适合于关键词提取进行了特别说明。TF-IDF学习笔记:其实这张PPT核心就是底部这句话,过滤掉常见的词语,保留得要的词语。TextRank学习笔记:这张PPT主要讲得就是底部这个公式,理解了这个公式就理解整个PPT了,说白了就是一个词I被其它词J引用合计得到一个分数除以其它词J引用除词I之外即词K的分数之和,再乘以...
2020-03-07 17:48:16
605
原创 词性标注与命名实体识别学习笔记
词性标注学习笔记 :识别词性能帮助我们消除岐议为分析句子的结构(主谓宾)打下基础。词性标注分为使用规则进行词性标注,使用HMM进行词性标注。命名实体识别学习笔记 :我看视频但是对命名实体识别难点不太理解,咨询老师,老师给我发了如下两个实体名,我一看就理解了,如果在这个视频中加上两个实体名例子,更有利于童鞋们理解为什么是难点。头孢羟氨苄甲氧苄啶胶囊综合配套改革试验区建设领导小组办公室...
2020-03-03 11:09:36
705
1
原创 中文分词学习笔记
中文分词简介学习笔记 :分词是中文自然语言处理中非常核心的一个技术。分词是句法分析、词性标注、命名实体识别等自然语言处理技术的基础。规则分词查询速度快,不能处理未纳入词库的新词。统计分词能够处理新词,但是查询速充相对规则分词慢。共同的难点是岐义词的识别。规则分词学习笔记 :选择哪种分词方式根据实际情况来,你的数据集在哪个方式表现好,就选择哪个。中文分词逆向最大匹配代码学习笔记 :...
2020-02-15 17:10:13
435
原创 图像识别模型学习笔记 :
由于我想做的是人机对话产品,对这块的知识我没深入学习,只是按照视频中把代码跑通了,也没去查具体API很多参数用法,我感觉视频中只要简要讲了讲如何把这些模型用起来,但是如何用的更好,解决实际工作问题,比如说用RESNET来识别苹果,哪些苹果是大的表面光滑没有斑点,哪些苹果是有斑点个点也比较小,甚至识别出有可能是坏的,向这样的案例就需要大家自已去查资料学习了。在跑代码的过程中个人认为大家需要注意以下...
2020-02-11 17:07:51
407
原创 文本向量学习笔记
文本向量其实是文本的一个数字化表达,以利于计算机理解文本,文本向量表达文本的好坏就决定了计算能否准确文本的意思。文本向量分为词向量,文档向量,句向量。文本向量算法学习笔记 :词袋模型:简单的统计词频,不能表示句中的词序,也无法表达语议。词向量模型:上下文相似的词其语议也相似。词向量直观理解学习笔记:词义相似度高在空间上越近。深度神经网络语言模型学习笔记:神经网络求取文本向量,...
2020-02-10 12:15:52
2087
原创 循环神经网络学习笔记
RNN是为了处理序列数据而生,能够顺序获取序列之间的关系,但是也存在处理过长序列会引起梯度消失、梯度爆炸,信息丢失问题。为了解决RNN的问题,LSTM就诞生了,LSTM主要是通过遗忘门,输入门,输出门来解决这些问题。遗忘门主要是来控制记住什么信息,忘记什么信息。比如我今天下午去游泳,对于泳字来说只有游字是重要的,前面的几个字不重要,这时遗忘门就要告知泳字前面几个字是不重要的。输入门主要是用来...
2020-02-08 09:53:22
422
1
原创 卷积神经网络(CNN)学习笔记
为什么需要卷积神经网络?全连接神经网络主要存在参数过多不便处理高维数据这两大问题,卷积神经网络是通过参数共享(卷积核共享),池化降维来解决上述两个问题。这个公式很重要,特征图经过卷积之后会是什么维度的数据,全靠它。最大池化对于纹理特征敏感,均值池化对背景特征敏感。卷积函数代码跟踪视频理解:针对不同的输入图片使用不同的卷积核进行卷积并演示其进行卷积后的输出是什么形状,从而把卷积输出公式...
2020-02-06 18:47:21
653
原创 全连接神经网络(FCN)学习笔记(为什么过拟合)
多层神经网络和激活函数前面章节已经讲过了,我觉得有点重复,咨询老师为什么要这样做,老师说很多童鞋并不是能够每天坚持学习,有很多童鞋一开始学习了几天,就放下不学了,等到下次要再学时有可能是一个星期,两个星期,甚至一个月,前面的东东有可能都忘了,而本课程一开始前几章节是基础,是非常重要的尤其是深度学习原理,关系到后续章节你是否能学懂,所以才设置重复的课程。Mnist多层分类视频学习笔记:此视频中讲解...
2020-02-04 12:04:10
2327
原创 深度神经网络原理代码实战学习笔记
这一章的内容其实就是把深度神经网络原理用MNIST分类代码讲解了一遍,其实还是前几节的内容,只不过更细一些,估计是老师担心大家前面没学懂,又在这把前面的内容总结再讲,以利于大家都听懂吧。更细的方面应该有以下两点吧:1、学习率如何退化,说白了就是一开始学习率较大利于跳过一些山谷即局部最优问题。2梯度下降四个优化算法的区别,这一块我开始并不明白,SGD为何会导致参数学习收敛过程震荡,咨询老师,老...
2020-02-03 19:50:23
395
原创 手写数字图片识别笔记
理解手写数字图片Minst数据集的组成结构,即由测试集,验证集、训练集组成,可以说训练神经网络数据集的组成工作都是由这三部分组成的。Minst数据集构成:测试集:5000张图片,每张图片都是由784列数字组成。即在内存中表现的是5000行784列的张量数据。验证集:10000张图片,10000行784列训练集:50000张图片,50000行784列读取数据集操作是由mnist = inp...
2020-02-02 17:18:22
892
原创 深度学习基本开发流程学习笔记
如图所示1:准备数据就是生成左下方图,即100个数据点以Y=2X为基准分布在二维空间。2:搭建模型就是正向传播和反向传播的过程3:迭代训练就是重复多次正向传播和反向传播,一直到LOSS值很小。4:使用模型就是把训练好模型的参数W和B重新加载来解决现实问题,如图中就是生成右下方的图。说白了就是测试模型是不是学到了Y=2X的数据分布规则。其实给出的线性回归代码已经将这四步讲得很明确了,具体...
2020-02-01 21:04:16
1282
原创 理解Tensorflow编程基础
编程模型理解:将张量数据即输入的样本和标签通过placeholder加载到图中,通过OP将Variable与张量进行组合,并放入到CPU或GPU中执行,最后执行完毕得到输出。这些操作放到图中要执行的话是需要通session来启动的。变量操作理解:Variable与Get_Varible的区别就是Variable能够自动给同名变量自动定义名字,从而达到区分两个变量的作用,但是Get_Vari...
2020-01-31 19:45:17
268
原创 深度神经网络原理
本节主要讲了深度神经网络的原理,首先从手写数字图像识别的例子讲起看视频我始终不理解W和B是怎么来的,循环迭代训练到什么程度停止训练呢?带着这个问题咨询老师,老师说W和B是根据X的数据情况来生成的,比如一张数字手写图片是28行,28列的像素组成的,这些像素都是由数字组成,即一张黑白手写数字图片是由28行、28列的数字组成。直观如下图所示:哪么W也必须是初始化成为一个X行(行数由程序指定)2...
2020-01-30 18:26:23
2590
原创 深度学习与传统编程的区别
1月28号开始学习《TensorFlow实战深度学习入门》,做如下学习笔记:在学习第二节课深度学习与传统编程的区别解开我困惑多时的问题,即深度学习比传统编程究竟好在哪,如图所示深度学习核心在于算法能够通过数据训练出模型后续业务规则有变化时他能够通过更新的数据学习到业务规划的变化,而无需重新编程...
2020-01-30 16:23:05
840
原创 过年无聊,边学边用Python
转眼就年初三了,本来想好好玩一玩,年初一壮着胆子出去逛了下,发现电影院、公园、周边景点全都关了,想看的夺冠等几个贺岁片也都不上映了,窝在家里看电视久了也觉得无聊,思来想去还是开始人机对话的学习可以多打发些这无聊时光,打开年前购买的自然语言处理专题课,专题课是由一系列课程组成,第一个课程是《零基础编程入门》使用的是编程语言是Python,此课程针对的是没有任何编程经验的童鞋,我已经是编程多年的,并不...
2020-01-27 21:29:44
253
原创 报名NLP课程注意事项。
答应了老板就开始找相关课程老师咨询,这一咨询下来才发现这个市场真乱呀,有大几K甚至上W价格的课程,也有几百的聊天机器人课程,我甚至看到有几十元的深度学习视频课程。大几K、上W的课程主要是服务好,比如有助教及时批改作业,及时督促跟进学生的情况,老师看上去也很牛的水平,几百就没这些服务了,老师答疑也是24小时之内答疑。我本业是想选个上W的课程,但是担心自已学不下来,没得报销,想来还是保险些,选个几百的...
2020-01-20 18:35:49
1164
1
原创 开发一个人机对话产品要多久
今天给领导汇报了人机对话技术的调研成果,领导问我如果我们使用后两种模式的话,大概要多少人,多长的时间,当时就把我问住了,领导说这个数据你得给我呀,我就又开始在课程平台上咨询,半天下来,得到咨询结果是一个完整的NLP即自然语言处理团队,也就是所说的人机对话技术团队首先要有算法工程师研究算法模型,开发工程师在算法工程师的领导下实现模型,还要有数据工程师爬取数据,清洗数据,为开发搭建模型提供原材料,还要...
2020-01-17 20:49:13
558
2
原创 人机对话学习笔记
人机对话技术三种打开方式最近公司有个新项目在谈,其中有一部分功能是人机对话,原有的团队中没有这方面的技术人员,领导看我最近刚完成一个项目,比较闲,就让我研究下要完成人机对话需要哪些技术,学习这些技术大概要多久?接到这个任务,我先是上网搜索相关的资料,半天搞下来直接把自已头整晕了,因为资料实在太多,要想梳理出头绪对于外行来说实在是比较难,怎么办呢?冷静下来,想了想还是要找这个方面技术专家咨询才是...
2020-01-15 21:25:53
995
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅