
Machine Learning
文章平均质量分 65
深度学习视觉
这个作者很懒,什么都没留下…
展开
-
TVM搭建系列(二)
安装NDKAndroid NDK 是一组使您能将 C 或 C++(“原生代码”)嵌入到 Android 应用中的工具。在平台之间移植其应用。重复使用现有库,或者提供其自己的库供重复使用。在某些情况下提高性能,特别是像游戏这种计算密集型应用。Android NDK下载将其解压到/opt 文件夹下,并修改环境变量:export NDKROOT=/opt/ndk/andro...原创 2020-04-20 12:10:03 · 1063 阅读 · 0 评论 -
神经网络能否直接判断奇偶数
神经网络判断奇偶数拥有神经网络的深度学习比机器学习的一大特点是,深度学习的非线性转换能够实现一定程度上的特征提取和特征组合。但是,当你传入一批自然数进入模型中训练,想要预测奇偶性的时候,你会发现,这个任务有点难。但是,如果你将这些数值转为二进制的时候,这个任务又变得可行。可以看出,深度学习也需要我们做一下数据的预处理工作。当然,也侧边看出了神经网络并非万能。1. 神经网络如何针对当前的任务建立...翻译 2020-03-23 14:41:19 · 1229 阅读 · 0 评论 -
CNN提取的特征中是否含有物体的位置信息
前言这篇文章解释了CNN是怎么学到图片内的绝对位置信息。探究了CNN到底有没有编码位置信息,这些位置信息在哪些神经元中被编码、这些位置信息又是如何被暴露给神经网络学习的。这是一篇ICLR2020接收的文章。此前,关注位置信息只在NLP的任务中,因为字符位置不同,文本表达的语义不同。但是,CV一直没有这个需求,大家一致认为CNN具有平移不变性。在CV的三大物体感知任务中,分类不需要位置信息,语义...原创 2020-03-20 15:41:56 · 2626 阅读 · 0 评论 -
【NLP】容纳众多优秀模型的自然语言处理库PyTorch-Transformers
前言Github:Pytorch-transformers该工具追求着这样的一个目标,几行代码调用最先进的模型,加载训练好的模型参数,来完成自然语言项目,比如机器翻译、文本摘要、问答系统等。Transformers 同时支持 PyTorch 和TensorFlow2.0,用户可以将这些工具放在一起使用。安装PyTorch-Transformerspip install pytorch-t...原创 2020-03-19 21:02:09 · 978 阅读 · 0 评论 -
【自然语言处理】Text Summarization文本摘要与注意力机制
Text Summarization英文原文公众号【深度学习视觉】整理什么是NLP中的文本摘要自动文本摘要是在保持关键信息内容和整体含义的同时,生成简洁流畅的摘要的任务。文本摘要目前大致可以分为两种类型:Extractive Summarization:重要内容、语句提取。Abstractive Summarization:文本总结。Extractive Summariza...原创 2020-03-14 20:35:03 · 3334 阅读 · 1 评论 -
【NLP-code】查看文字覆盖率
深度学习视觉公众号:深度学习视觉import pandas as pdfrom tqdm import tqdmimport operator# 获取词汇表中的所有字dict_path = '../bertModel/vocab.txt'token_dict = getTokenDict(dict_path)# 获取sentencestrain_data_file = '...原创 2020-03-10 12:21:59 · 610 阅读 · 0 评论 -
【NLP】命名实体识别demo代码解读
代码来源:flyai深度学习框架:tensorflow公众号:深度学习视觉完整代码获取:公众号后台回复(命名实体识别demo代码解读)主要部分Embeddinginput:所有文字的字典文件,{index:word,…};所有文字的embedding文件,{word:embedding,…};output:将字典中的文字全部用embedding表示,{index:emb...原创 2020-02-19 14:42:21 · 1018 阅读 · 0 评论 -
python常用可视化工具
更多深度学习资讯都在公众号:DLCVtensorboard和tensorboardX被开发用来支持chainer, mxnet, numpy。https://github.com/lanpa/tensorboardXvisdom,常用于pytorch数据可视化,也支持numpy。https://github.com/facebookresearch/visdomseab...原创 2020-02-04 19:28:01 · 773 阅读 · 0 评论 -
神经网络结构图可视化工具
更多深度学习资讯都在公众号:DLCVNN-SVGGithub:NN-SVGPlotNeuralNet (Star:7.3k)Github:PlotNeuralNet使用门槛高,用LaTex语言编辑,但是美观。Draw_convnet(Star:1.6k)Github:Draw_convnetPython script for illustrating Conv...原创 2020-02-04 19:26:39 · 1417 阅读 · 0 评论 -
ImageNet图像分类对抗攻击-方案整理
公众号:DLCV赛题地址:https://tianchi.aliyun.com/competition/entrance/231761/forum赛题介绍:按照最大浮动32干扰的话,最高分为5。方案关键词:模型ensemble;多尺度ensemble;数据增强。第一名(Score:4.4)在最初开始,从 ImageNet 数据集中挑选出 1000张可以被线下防御模型正确分类...原创 2020-01-22 17:19:07 · 2641 阅读 · 0 评论 -
【物体分割】天池农业AI挑战赛-总结
赛题社会价值通过计算机自动识别大面积卫星图中的物体,有助于预估农产品产量,城市面积等工作。赛题所属类型图像分割与分类赛题特点类间差异小;存在标注噪声;物体尺度差异大;有效物体占比低;图片尺寸达到30亿左右的像素,无法直接训练。赛题工作模型选择本次分割的图像中,全局信息很重要,某一个类别的确定会受到它周边像素与类别的影响。本次比赛最佳模型框架deeplab v3+...原创 2020-01-22 17:17:00 · 696 阅读 · 0 评论 -
马尔可夫链介绍
知识交点:马尔可夫链介绍简介马尔可夫链(Markov chain),又称离散时间马尔可夫链(discrete-time Markov chain)为状态空间中经过从一个状态到另一个状态的转换的随机过程。该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关。这种特定类型的“无记忆性”称作马尔可夫性质。在马尔可夫链的每一步,系统根据概率分布...原创 2019-07-26 16:22:32 · 15099 阅读 · 0 评论 -
梯度下降与牛顿法
知识交点:梯度下降与牛顿法梯度下降:θ1=θ0−α∇J(θ0)\theta_{1}=\theta_{0}-\alpha \nabla J(\theta_0) \quadθ1=θ0−α∇J(θ0) evaluated at θ0\theta_{0}θ0计算举例:假设目标函数为f(θ)=θ2f(\theta)=\theta^2f(θ)=θ2,初始值θ0=1\theta_0=1θ0=1...原创 2019-07-26 16:21:27 · 507 阅读 · 0 评论 -
最小二乘法与最小一乘法
知识交点:最小二乘法与最小一乘法什么是最小二乘法:最小二乘法是一种误差度量方法,一种被优化的问题,在线性最小二乘问题中可以直接求解x=(ATA)−1ATbx=\left(A^{T} A\right)^{-1} A^{T} bx=(ATA)−1ATb得到全局最优,但是在非线性最小二乘问题中无法用此方法求解,此时就需要迭代法来求解,比如梯度下降法,牛顿法。最小二乘与极大似然的关系:在测量误差服...原创 2019-07-26 16:20:08 · 6151 阅读 · 0 评论 -
决策树剪枝
知识交点:决策树剪枝为什么要剪枝一颗完全生长的决策树难免会遇到过拟合的情况。因此,我们需要对决策树进行剪枝,提升模型的泛化能力。决策树的剪枝操作通常有两种方法,预剪枝与后剪枝。预剪枝预剪枝的核心思想是在树中节点进行扩展之前,先计算当前的划分是否能带来模型泛化能力的提升,如果不能,则不再继续生长子树。此时可能存在不同类别的样本同时存于节点中,可以按照多数投票的原则判断该节点所属类别。预剪枝...原创 2019-07-26 16:18:52 · 1409 阅读 · 0 评论 -
决策树ID3,C4.5,CART
来源:决策树ID3,C4.5,CART简述:决策树是一种自上而下,对样本数据进行树形分类的过程,由节点和有向边组成。节点分为内部节点和叶子节点,其中每个内部节点表示一个特征或属性,叶子节点表示类别。决策树常用于分类问题于回归问题,完全生长的决策树模型具有简单直观、解释性强的特点。常用的决策树算法通常,我们希望决策树能够低复杂度的拟合训练数据,达到良好的分类效果,但是从若干个决策树中选取最优的...原创 2019-07-26 16:17:09 · 417 阅读 · 0 评论 -
几种主要分布
内容范围:正态分布,泊松分布,多项分布,二项分布,伯努利分布原文传送门:https://www.jianshu.com/p/0ef1d796389e简述:正态分布是上述分布趋于极限的分布,属于连续分布。其它属于离散分布。。。。...原创 2019-04-23 15:33:29 · 1070 阅读 · 0 评论 -
样本方差为何除以n-1
原文传送门:https://www.jianshu.com/p/2f7ef68092db1.设样本均值为Xˉ\bar{X}Xˉ ,样本方差为S2S^2S2,总体均值为μ\muμ ,总体方差为σ2\sigma^2σ2,那么样本方差S2S^2S2的公式为:S2=1n−1∑i=1n(xi−X‾)2S^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\overli...原创 2019-04-23 15:37:59 · 431 阅读 · 0 评论 -
采样的作用
**定义:**采样本质上是对随机现象的模拟,根据给定的概率分布,来模拟产生一个对应的随机事件。采样可以让人们对随机事件及其产生过程有更直观的认识。**实例:**通过对二项分布的采样,可以模拟”抛硬币出现正面还是反面“这个随机事件,进而模拟产生一个多次抛硬币出现的序列。采样的作用:1.采样也是一种信息降维,可以起到简化问题的作用。2.采样得到的样本集可以看作是一种非参数模型,即用较少量的样本...原创 2019-04-25 13:53:53 · 4608 阅读 · 0 评论 -
PCA最大方差
原文链接:https://www.jianshu.com/p/fb5f08bc9e9c简述:PCA是一种线性、非监督、全局的降维算法。在高维的特征数据空间中有可能会包含冗余与噪声,因此需要寻找数据内部的主成分来表征原始数据,从而达到降维与降低训练复杂的目的。求解步骤:1.对样本数据进行中心化处理;(使数据分布更具方向性,使得特征向量更具原数据表达性。)2.求样本协方差矩阵;3.对协方差...原创 2019-04-25 13:57:44 · 698 阅读 · 0 评论 -
余弦距离介绍
原文链接:https://www.jianshu.com/p/2ae25fc02d4e涉及到数学公式的地方,还请查看原文链接。概述: 在机器学习领域中,通常将特征表示为向量的形式,所以在分析两个特征向量之间的相似性时,常用余弦相似度表示。例如将两篇文章向量化,余弦距离可以避免因为文章的长度不同而导致距离偏大,余弦距离只考虑两篇文章生成的向量的夹角。余弦相似度的取值范围是[-1,1],相同两个...原创 2019-04-25 14:01:26 · 34552 阅读 · 9 评论 -
似然函数简明讲解
概述: 统计学中,似然函数是一种关于统计模型参数的函数。当给定输出x时,关于参数θ\thetaθ 的似然函数L(θ∣x)L(θ|x)L(θ∣x)似然值等于给定参θ\thetaθ后变量x的发生概率L(θ∣x)=P(X=x∣θ)L(\theta | x)=P(X=x | \theta)L(θ∣x)=P(X=x∣θ)。实列: 一枚拥有正反对称值L为1的硬币,做上抛三次动作,那么上抛三次都为正面的概率P...原创 2019-04-25 14:05:26 · 9784 阅读 · 0 评论 -
逻辑回归直白介绍
原文链接:https://www.jianshu.com/p/fc92e3e99a1a涉及到数学公式的地方,还请查看原文链接。线性回归模型公式:g(x)=ω0+ω1x1g(x)=\omega _0 + \omega _1x_1g(x)=ω0+ω1x1逻辑回归模型公式:f(x)=11+e−g(x)(包含了线性回归)f(x) = \frac{1}{1+e^{-g(x)} } (包含了线性回...原创 2019-04-25 14:09:56 · 336 阅读 · 0 评论 -
7种损失函数
主要内容: 0-1,Hinge,Logistic,Cross Entropy,Square,Absolute,Huber简述: 损失函数刻画了模型与训练样本的匹配程度。分类损失1. 对于二分类问题,Y={1,-1},我们希望signf(xi,θ)=y1sign f(x_i,\theta)=y_1signf(xi,θ)=y10-1损失:L0−1(f,y)=1f.y≤0L_{0-1}(...原创 2019-06-18 10:50:58 · 4132 阅读 · 0 评论 -
Boosting and Bagging
作者:Fain博客:https://fainke.com微信公众号:知识交点介绍Boosting1.Boosting方法训练基分类器时采用串行的方式,各个基分类器之间有依赖。2.Boosting的基本思路时将基分类器层层叠加,每一层在训练的时候,对前一层基分类器分错的样本给予更高的权重。测试时,根据各层分类器的结果的加权得到最终的结果。stackingBaggingBaggin...原创 2019-07-07 22:12:48 · 339 阅读 · 0 评论 -
nn.ConvTranspose2d与nn.Upsample的区别
微信公众号:知识交点(机器学习成长之路)作者:泛音 # 有参数可以训练nn.ConvTranspose2d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True, dilation=...原创 2019-07-10 16:28:07 · 8457 阅读 · 0 评论 -
ReLu激活函数
**概述:**ReLU函数的计算是在卷积之后进行的,因此它与tanh函数和sigmoid函数一样,同属于非线性激活函数。ReLU函数的倒数在正数部分是恒等于1的,因此在深度网络中使用relu激活函数就不会导致梯度小时和爆炸的问题。并且,ReLU函数计算速度快,加快了网络的训练。不过,如果梯度过大,导致很多负数,由于负数部分值为0,这些神经元将无法激活(可通过设置较小学习率来解决)。1.ReLu:...原创 2019-06-30 13:06:07 · 12546 阅读 · 0 评论 -
机器学习实战视频
视频资源内容包括但不限于:1.机器学习项目实战-HTTP日志聚类分析2.数据探索分析-农粮组织数据集3.做球赛事分析4.用户流失预警5.贷款申请最大化利润6.Python时间序列分析7.Python库分析科比生涯数据8.scikit-learn模型建立与评估9.使用Gensim库构造中文维基百度数据词向量模型10.自然语言处理词向量模型-Word2Vex11.24Xgboos...原创 2019-07-24 09:22:47 · 328 阅读 · 0 评论 -
特征工程
学习笔记机器学习特征工程功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入机器学习你好! 这是你第一次使用 Markd...原创 2019-01-05 21:29:28 · 592 阅读 · 0 评论