- 博客(31)
- 资源 (1)
- 收藏
- 关注
转载 注意力机制(Attention Mechanism)在自然语言处理中的应用
原博客见http://www.cnblogs.com/robert-dlut/p/5952032.html近年来,深度学习的研究越来越深入,在各个领域也都获得了不少突破性的进展。基于注意力(attention)机制的神经网络成为了最近神经网络研究的一个热点,本人最近也学习了一些基于attention机制的神经网络在自然语言处理(NLP)领域的论文,现在来对attention在NLP中的应用进行...
2018-11-02 16:30:21
584
原创 机器学习书单
1. 数学基础1.微积分:《微积分学教程》 (F.M.菲赫金哥尔茨)俄罗斯的数学书2.线性代数:《Linear Algebra and Its Applications,Third Edition (David C.Lay)》讲得很实际,线性代数最重要的就是与实际应用相联系才能够理解其意义3.概率与统计:《概率论与数理统计 (陈希孺)》或《概率论与数理统计(盛骤/谢式千/潘承毅)》这两...
2018-10-24 21:44:00
312
转载 R语言-特殊值
这几个都是R语言里面的特殊值,都是R的 保留字(reserved words)。它们的意义分别为: NA:表示缺失值(Missing value),是“Not Available”的缩写 Inf:表示无穷大,是“Infinite”的缩写 NaN:表示非数值,是“Not a Number”的缩写 NULL:表示空值,即没有内容 下面通过一些例子来了解它们的用法...
2018-10-24 21:22:34
3818
原创 课时9.yum命令的使用-大数据与人工智能实战L1系列课程-小象学院
知识要点1.yum介绍 yum是基于RMP包管理,能够从指定的服务器自动下载安装RPM包,并且自动处理依赖关系,方便快捷。2.常用命令 查看yum提供的rpm列表 yum list 使用管道查找yum提供的java软件包 yum list | grep java 使用yum安装lrzsz yum install -y l...
2018-09-22 13:16:46
215
原创 课时8.常用压缩和解压缩-大数据与人工智能实战L1系列课程-小象学院
1.zip压缩/解压缩,压缩文件后缀名.zip zip tes.zip test.txt 压缩文件夹 zip -r dirtest.zip dirtest 解压缩文件/文件夹 unzip tes.zip/dirtest.zip2.gzip压缩/解压缩,压缩文件后缀名.gz gzip test.txt 解压gz文件: ...
2018-09-22 13:15:59
323
原创 课时7.vim文本编辑器-大数据与人工智能实战L1系列课程-小象学院
1.vim test 首先会进入“一般模式”,此模式只接受各种快捷键,不能编辑文件内容; i 从一般模式进入编辑模式,此模式下可以输入内容; o 从一般模式进入编辑模式并且是光标所在行的下一行开始输入内容; u 撤销到上一步操作,多次撤销按多次u; Esc 退出编辑模式,回到一般模式; : 进入“底行命令模式”,输入wq命令,回...
2018-09-22 13:15:11
195
原创 课时6.文件权限操作-大数据与人工智能实战L1系列课程-小象学院
1.文件或文件夹权限 文件夹或者文件名称前用四种字母和符号表示的一串字符串表示的文件或者文件夹类型和权限。 -:表示文件类型为文件 d:表示文件类型为文件夹 l:小写的L表示符号链接 r:可读 w:可写 x:可执行2.drwxrwxr-x文件夹权限举例: 第一组rwx:表示这个文件夹的拥有者对文件夹的权限:可读可写可...
2018-09-22 13:14:05
243
原创 课时5.查看文件内容-大数据与人工智能实战L1系列课程-小象学院
1.将文件内容全部输出到控制台 cat filename2.将文件内容分页显示,按空格下翻页,按b字母键上翻页,按q字母键退出 more filename3.将文件内容分页显示,按空格下翻页,按b字母键上翻页,按上箭头(↑)上翻一行,按下箭头(↓)下翻一行。 less filename5.Linux中每一个文件有一个inode,文件名修改inode编号不变...
2018-09-22 13:13:12
390
原创 课时4.文件创建与删除-大数据与人工智能实战L1系列课程-小象学院
1.创建文件 touch filename2.删除文件 rm filename(会有提示是否删除) rm –f filename(强制删除)3.创建文件夹 mkdir dirname mkdir -p dir1/dir2/dir3(递归创建文件夹) mkdir dir/{dir1,dir2}在dir在已存在的dir文件夹下同时创建...
2018-09-22 13:12:27
274
原创 课时3.用户管理-大数据与人工智能实战L1系列课程-小象学院
知识要点1.添加新组 groupadd groupname2.添加新用户 useradd username3.设置用户密码 passwd username4.给用户添加组 usermod -g groupname username5.添加新用户同时添加组 useradd -g groupname username6.查看用户...
2018-09-22 13:11:32
265
原创 课时2.系统管理命令-大数据与人工智能实战L1系列课程-小象学院
知识要点1.查看本地时间 date2.查看主机名 hostname3.修改主机名(重启后永久生效) vim /etc/sysconfig/network 4.修改IP(重启后永久生效) vim /etc/sysconfig/network-scripts/ifcfg-eth05.修改/设置IP和主机名映射 vim /...
2018-09-22 13:10:48
223
原创 课时1.常用命令和快捷键-大数据与人工智能实战L1系列课程-小象学院
知识要点学习本节课程之前请参照本课时资料完成虚拟机的安装!1.停止进程 ctrl + c2.清屏 ctrl + l3.搜索历史命令 ctrl + r4.文件名自动补全 Tab键5.进入目录 cd path6.进入用户家目录 cd ~7.进入最近上一次访问的目录 cd -8.返回上一级目录 ...
2018-09-22 13:08:37
233
原创 离线安装tensorflow
由于某些原因,电脑不让联网,但需要用tensorflow框架,没办法只能离线安装tensorflow,实话能有网谁愿意入坑啊。本着屡败屡战的精神,本人试了网上的大多数方法,最后安装成功,并将此分享一下。1.尽量用python3.5(不要上来就给自己加难度)。2.最好用anaconda,这样好多库都不用自己去安,而且各个库之间的依赖连接的很好。本人用的是Anaconda3-4.2.0-windows...
2018-06-26 17:07:32
22741
26
转载 end2end learning含义
在DeepLearning的文章中有看到end2end一次,作者们似乎都比较喜欢这个end2end learning的方式。那么到底啥是end2end?找了一下相关论文,没找到专门讲这个概念的,看来应该不是很严格定义的一个说法。那就搬运一下Quora上的提问和回答吧。问题:https://www.quora.com/What-is-end-to-end-learning-in-machine-le...
2018-05-18 20:21:46
1633
转载 cross_validation问题
This module was deprecated in version 0.18 in favor of the model_selection module into which all the refactored classes and functions are moved. Also note that the interface of the new CV iterators ar...
2018-04-03 11:23:31
2729
转载 人工智能的基础--知识分类
文章对先验知识和对知识的哲学意义一些看法。原文链接https://blog.youkuaiyun.com/VucNdnrzk8iwX/article/details/79723327一、元知识的概念元知识的定义目前对元知识的定义,在学术界还没有一个严格的概念。通常来说,元知识就是“关于知识的知识”。元知识可用来描述一类知识或知识集合所包含的内容、基本结构和一般特征。没有元知识, 人们无法描述知识、使用知识和认...
2018-04-03 11:05:57
1765
转载 metrics
1. sklearn.metrics.roc_curve(true_y. pred_proba_score, pos_labal)计算roc曲线,roc曲线有三个属性:fpr, tpr,和阈值,因此该函数返回这三个变量,l例如import numpy as npfrom sklearn.metrics import roc_curvey = np.array([1,1,2,2])pred =...
2018-04-03 10:52:01
742
转载 one-hot编码(独热编码)
一、One-Hot Encoding One-Hot编码,又称为一位有效编码,主要是采用位状态寄存器来对个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。 在实际的机器学习的应用任务中,特征有时候并不总是连续值,有可能是一些分类值,如性别可分为“male”和“female”。在机器学习任务中,对于这样的特征,通常我们需要对其进行特征数字化,如下面的例子:有如下三...
2018-04-02 10:00:55
1371
原创 anaconda中python2与python3
1.查看anaconda中安装的环境有哪些:>conda info --envs2.激活环境>activate python35
2018-04-01 22:29:04
232
原创 anaconda相关问题
1. anaconda 启动非常慢,开始是初始化,然后更新 repodata,很久很久。 解决方法Windows下:1)使用管理员运行:conda prompt2)执行命令 conda update anaconda-navigator3)还是不行就试试命令:anaconda-navigator --reset最后通过anaconda-navigator --reset 命令成功解决了。2....
2018-03-30 14:52:23
11668
2
转载 Boost算法(GDBT,AdaBoost,XGBoost)原理及实践
提升(Boost)简单地来说,提升就是指每一步我都产生一个弱预测模型,然后加权累加到总模型中,然后每一步弱预测模型生成的的依据都是损失函数的负梯度方向,这样若干步以后就可以达到逼近损失函数局部最小值的目标。下面开始要不说人话了,我们来详细讨论一下Boost算法。首先Boost肯定是一个加法模型,它是由若干个基函数及其权值乘积之和的累加,即其中b是基函数,beta是基函数的系数,这就是我们最终分类器...
2018-03-17 14:49:37
3126
原创 欠拟合、过拟合、交叉校验
这里首先解释一下bias和variance的概念。模型的Error = Bias + Variance,Error反映的是整个模型的准确度,Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,Variance反映的是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。解决高方差1. 获得更多的训练实例 2. 尝试减少特征的数量 3. 尝试增加正则化程度 λ解决高偏差...
2018-03-17 14:03:00
429
转载 收集一些常用的正则表达式
1 . 校验密码强度密码的强度必须是包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间。^(?=.*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$ 2. 校验中文字符串仅能是中文。^[\\u4e00-\\u9fa5]{0,}$ 3. 由数字、26个英文字母或下划线组成的字符串^\\w+$ 4. 校验E-Mail 地址同密码一样,下面是E-mail地址合规性的正则...
2018-03-15 16:15:47
233
转载 Python简单实现二元一次方程求根
#!/usr/bin/env python3# -*- coding: utf-8 -*- import math def my_def(a,b,c): coeffic = [a,b,c] leng = len(coeffic) - 1 for num in coeffic: #限制输入的数据类型 if no...
2018-03-15 16:09:09
14545
转载 AI 经典书单 | 人工智能学习该读哪些书
人工智能相关岗位中,涉及到的内容包含:算法、深度学习、机器学习、自然语言处理、数据结构、Tensorflow、Python 、数据挖掘、搜索开发、神经网络、视觉度量、图像识别、语音识别、推荐系统、系统算法、图像算法、数据分析、概率编程、计算机数学、数据仓库、建模等关键词,基本涵盖了现阶段人工智能细分领域的人才结构。将上面的岗位涉及到的知识和技术划类,就形成了今天的五份书单:1人工智能科普类:人工智...
2018-03-15 13:37:14
372
转载 学习资源汇总
Deep Learning(深度学习)ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):一ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):二Bengio团队的deep learning教程,用的theano库,主要是rbm系列,搞python的可以参考,很不错。deeplearning.net主页,里面包含的信息量非常多,有software...
2018-02-12 13:06:47
991
转载 深度学习参考资料
Deep Learning(深度学习)ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):一ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):二Bengio团队的deep learning教程,用的theano库,主要是rbm系列,搞python的可以参考,很不错。deeplearning.net主页,里面包含的信息量非常多,有software...
2018-02-12 13:04:27
520
转载 数据挖掘与机器学习的区别
数据挖掘和机器学习的区别和联系,周志华有一篇很好的论述《机器学习和数据挖掘》可以帮助大家理解。 数据挖掘受到很多学科领域的影响,其中数据库、机器学习、统计学无疑影响最大。简言之,对数据挖掘而言,数据库提供数据管理技术,机器学习和统计学提供数据分析技术。 由于统计学往往醉心于理论的优美而忽视实际的效用,因此,统计学界提供的很多技术通常都要在机器学习界进一步研究,变成有效的机器学习算法之后才能...
2018-02-12 13:00:22
20540
1
tesseract-ocr.rar
2020-04-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人