
机器学习
文章平均质量分 73
c2a2o2
这个作者很懒,什么都没留下…
展开
-
Windows 10 x64下编译安装ninja
1. 准备工作S1. 安装git for Windows,下载地址:https://git-scm.com/download/winS2. 安装Visual Studio 2015S3. 安装Python 3.x2. Clone ninja库打开git bash,分别运行如下两行命令:git clone git://github.com/ninja-build/ninja.git && cd ninjagit checkout release123. 编译ni转载 2022-03-15 10:46:46 · 3623 阅读 · 0 评论 -
本科生新算法打败NeRF,不用神经网络照片也能动起来,提速100倍
万万没想到,把照片变3D这件事,离了神经网络也是这般丝滑。而在此之前,新视角合成这方面的“大牛”,是近两年大火的NeRF(神经辐射场)。它是一个简单的全连接神经网络,使用2D图像的信息作为训练数据,还原拥有体积的3D场景。但最近,来自伯克利大学的研究人员提出了一个叫做Plenoxels的方法。不需要神经网络,仅仅通过梯度下降和正则化便实现了同样的效果,而且速度还快了100倍!那么他们是如何做到这点的呢?由NeRF到Plenoxels的进化为了帮助大家理解Plenoxels,我转载 2022-03-09 13:12:20 · 315 阅读 · 0 评论 -
AD-NeRF:用于说话人头部合成的音频驱动神经辐射场
作为构建未来虚拟世界诸多应用的主干,如何创造栩栩如生的虚拟数字人,一直是计算机视觉、计算机图形学与多媒体等人工智能相关学科密切关注的重要研究课题。近日,中国科学技术大学联合的卢深视科技有限公司、浙江大学与清华大学共同打造的 AD-NeRF 技术,引发了学界及业界关注。来自中科大张举勇课题组等机构的研究者们在近期大火的神经辐射场(NeRF: Neural Radiance Fields)技术基础上,提出了一种由语音信号直接生成说话人视频的算法。仅需要目标人物几分钟的说话视频,该方法即可实现对该人物超级逼真的形转载 2022-03-08 15:36:08 · 1618 阅读 · 0 评论 -
Windows 安装 pytorch3d
Windows 安装 pytorch3d首先安装pytorch,我安装的是python 3.8 + cuda 10.2 + pytorch 1.7.1 + torchvision 0.8.2 + cub 1.10.0其中,cudnn和cudatoolkit与cuda的版本一致的,cub直接conda是不行的,需要从github上下载release,再在环境变量里添加CUB_HOME作者:胡写含链接:https://www.jianshu.com/p/ffd696866469来源:简书转载 2022-03-01 20:50:06 · 837 阅读 · 1 评论 -
Pivotal Tuning for Latent-based Editing of Real Images
文中引用一下[38]的论点,越靠近W空间,编辑能力越强。要点:真实图片的inversion空间与GAN的W空间混合,使得它们都在生成器的domain之内。本文研究目标,对于真实图片的高清编辑,论点:对于一个编辑任务,对于真实图片的映射到隐层空间后已经out of domain,导致生成的图片会有伪影,因提出了训练生成器,扩大生成器的输入domain,使得编辑后的采样点也在生成器的输入域范围内。所以,本文在训练的时候是pivotal tuning,轻微调整生成器,使得那些从真实图片映射至隐空间可能转载 2022-02-14 10:12:32 · 1162 阅读 · 0 评论 -
[解决方案记录]No module named fused(stylegan2的bug,已更新)
基本情况https://github.com/rosinality/stylegan2-pytorch/issues/81运行psp时出现的问题。其实就是stylegan2里面采用了c++编译等功能带来的bug,非常烦人。系统:windows平台:pycharm + jupyter notebookGPU:GTX1660Ti解决方案(0)无脑但是有效:直接把fused_leakyrelu,upfirdn2d_native和FusedLeakyRelu替换为pytorch实现即可。参转载 2021-10-03 17:06:12 · 3158 阅读 · 3 评论 -
从对比学习(Contrastive Learning)到对比聚类(Contrastive Clustering)
从对比学习(Contrastive Learning)到对比聚类(Contrastive Clustering)作者:凯鲁嘎吉 - 博客园http://www.cnblogs.com/kailugaji/ 想要了解对比聚类,首先应该清楚对比学习的整个过程。最经典的对比学习的文章是Hinton团队提出的SimCLR,该方法首先将一个实例(图像)变换成两种不同的增广实例(图像),然后用神经网络训练得到投影表示,用余弦相似性求出两两投影表示之间的相似性,并最大化相同实例投影表示之间的一致性。而对比...转载 2021-07-22 08:59:44 · 2930 阅读 · 0 评论 -
SCAN Learning to Classify Images without Labels(翻译)
SCAN Learning to Classify Images without Labels概览Approach: A two-step approach where feature learning and clusteringare decoupled.Step 1:Solve a pretext task + Mine k nearest neighbrs通过利用特征相似性来挖掘每张图片的最近邻居nearest neighbors,研究发现这些nearest neighbors很转载 2021-07-15 10:20:18 · 558 阅读 · 0 评论 -
【Deep Clustering】Improving Unsupervised Image Clustering With Robust Learning
Abstract非监督图像聚类算法通常是提出一个辅助目标函数间接训练模型,并且聚类结果受到错误的预测和过于自信(overconfidence)的结果的影响,作者通过提出RUC (Robust learning for Unsupervised Clustering)模块解决这个问题,该模块将现有聚类算法生成的伪标签(可能会包含错误分类的样本)看作噪声样本,而它的重新训练过程可以纠正错误分类并缓解过度自信的问题。该模块可以作为其他聚类算法的附加模块用来提高精度RUC主要由两个部分组成:1. ext转载 2021-07-15 08:39:21 · 1235 阅读 · 0 评论 -
对比学习(Contrastive Learning):研究进展精要
对比学习(Contrastive Learning)最近一年比较火,各路大神比如Hinton、Yann LeCun、Kaiming He及一流研究机构比如Facebook、Google、DeepMind,都投入其中并快速提出各种改进模型:Moco系列、SimCLR系列、BYOL、SwAV…..,各种方法相互借鉴,又各有创新,俨然一场机器学习领域的军备竞赛。对比学习属于无监督或者自监督学习,但是目前多个模型的效果已超过了有监督模型,这样的结果很令人振奋。我想,NLP领域的Bert模型,对于这波图像领域的对转载 2021-07-13 16:41:33 · 2528 阅读 · 0 评论 -
facebook新无监督论文-Unsupervised Learning of Visual Features by Contrasting Cluster Assignments
最近比较关注无监督论文,因此只要发现有新的文章都会读一遍,facebook近期刚出了一篇Unsupervised Learning of Visual Features by Contrasting Cluster Assignments,这是记录的第二篇讲无监督的文章,和之前那篇思路差别还是比较大的,文章也很良心,有git代码,也顺便看了下实现,文档很详细,代码写的也比较规范,准备后面有时间实验一下效果~概述unsupervised image representations在近些年的工作中已经缩转载 2021-07-13 16:17:03 · 4245 阅读 · 1 评论 -
Ubuntu18.04+RTX 2080Ti+CUDA 10.0 +cuDNN+PyTorch搭建深度学习环境
注意tensorflow-gpu-2.0有几处代码改动,在跑faster-rcnn的时候有点问题,所以后面需要把tensorflow-gpu版本改成1.1+的。我这里的环境是:Ubuntu16.04+2080ti+Display Driver430.50+cuda10.0+cudnn7+Anaconda(python3.6)+tensorflow-gpu-1.13.11. 显卡驱动: 版本430.50,有不同的安装格式,这里我下的是runfile。安装显卡驱动步骤:(1)lsmod转载 2021-06-30 21:26:14 · 750 阅读 · 0 评论 -
COCO2017数据集api说明
什么是COCO?COCO数据集是Microsoft制作收集用于Detection + Segmentation + Localization + Captioning的数据集,本人收集了其2017年的版本,一共有25G左右的图片和600M左右的标签文件。COCO数据集共有小类80个,分别为[‘person’, ‘bicycle’, ‘car’, ‘motorcycle’, ‘airplane’, ‘bus’, ‘train’, ‘truck’, ‘boat’, ‘traffic light’, ‘f转载 2021-06-28 11:59:57 · 687 阅读 · 0 评论 -
深入理解风格迁移三部曲(三)--FUNIT
FUNIT: Few-Shot Unsupervised Image-to-Image Translationproject:https://nvlabs.github.io/FUNIT/作者:陈扬[toc]简介无监督的图像到图像转换方法学习利用图像的非结构化(UNlabel)数据集将给定类中的图像映射到不同类中的类似图像。在ICCV2019上,NVIDIA-Lab发表了Image-to-image最新的研究成果,基于少量类别学习的FUNIT.笔者在CVPR2020的投稿中正好也大量涉及到了转载 2021-06-23 13:47:30 · 2611 阅读 · 0 评论 -
一文搞懂faiss计算
Faiss的全称是Facebook AI Similarity Search。这是一个开源库,针对高维空间中的海量数据,提供了高效且可靠的检索方法。暴力检索耗时巨大,对于一个要求实时人脸识别的应用来说是不可取的。而Faiss则为这种场景提供了一套解决方案。Faiss从两个方面改善了暴力搜索算法存在的问题:降低空间占用加快检索速度首先,Faiss中提供了若干种方法实现数据压缩,包括PCA、Product-Quantization等。(1)对于一个检索任务,我们的操作流程一定分为三步:训练、构.转载 2021-06-22 16:47:23 · 3251 阅读 · 1 评论 -
如何利用PyTorch中的Moco-V2减少计算约束
介绍SimCLR论文(http://cse.iitkgp.ac.in/~arastogi/papers/simclr.pdf)解释了这个框架如何从更大的模型和更大的批处理中获益,并且如果有足够的计算能力,可以产生与监督模型类似的结果。但是这些需求使得框架的计算量相当大。如果我们可以拥有这个框架的简单性和强大功能,并且有更少的计算需求,这样每个人都可以访问它,这不是很好吗?Moco-v2前来救援。注意:在之前的一篇博文中,我们在PyTorch中实现了SimCLR框架,它是在一个包含5个类别的简单数据转载 2021-06-16 13:58:36 · 261 阅读 · 0 评论 -
Understanding the Behaviour of Contrastive Loss理解对比损失的性质以及温度系数的作用
论文标题:Understanding the Behaviour of Contrastive LossUnderstanding the Behaviour of Contrastive Lossarxiv.org对比学习中的温度系数是一个神秘的参数,大部分论文都默认采用小的温度系数来进行自监督对比学习(例如0.07,0.2)。然而并没有对采用小温度系数的解释,以及温度系数是如何影响学习过程的,即温度系数这个角色的意义。本文章对对比损失(Contrastive Loss)中的温度系数进.转载 2021-06-14 09:55:46 · 1956 阅读 · 2 评论 -
ICML 2020: 从Alignment 和 Uniformity的角度理解对比表征学习
Title: 《Understanding Contrastive Representation Learning through Alignment and Uniformity on the Hypersphere》Author:Tongzhou Wang ; Phillip IsolaUnderstanding Contrastive Representation Learning through Alignment and Uniformity on the Hyperspherearxiv.转载 2021-06-14 09:35:44 · 6413 阅读 · 0 评论 -
真·无监督!延世大学提出图像到图像无监督模型,实验结果超SOTA
图像翻译目的是用模型将源域图像转换到目标域图像,通常涉及标签图到场景图的转换、图像风格、人脸的属性变换、标签图到场景图的转换。图像翻译任务自生成对抗网络提出就得到了快速发展,例如经典的pix2pix、CycleGAN、StarGAN。上述模型虽然实现了从源域图像到目标域图像的转换,但也需要一定的标签参与或者需要建立源域和目标域各自的生成器。而近日韩国延世大学的一篇名为《Rethinking the Truly Unsupervised Image-to-Image Translation》的论文转载 2021-06-04 10:34:50 · 373 阅读 · 0 评论 -
DivCo: Diverse Conditional Image Synthesis via Contrastive Generative Adversarial Network
DivCo: Diverse Conditional Image Synthesis via Contrastive Generative Adversarial Network条件生成对抗网络(Conditional generative advictorial networks,cGANs)的目标是在给定输入条件和latent codes的情况下合成各种不同的图像,但不幸的是,它们通常会遇到模式崩溃的问题。为了解决这个问题,以前的工作[47,22]主要集中在鼓励latent codes与其生成的图像之转载 2021-06-03 17:10:44 · 796 阅读 · 0 评论 -
一篇综述带你全面了解迁移学习的领域泛化(Domain Generalization)
领域泛化 (Domain Generalization, DG)是近几年非常热门的一个研究方向。它研究的问题是从若干个具有不同数据分布的数据集(领域)中学习一个泛化能力强的模型,以便在未知 (Unseen)的测试集上取得较好的效果。本文介绍DG领域的第一篇综述文章《Generalizing to Unseen Domains: A Survey on Domain Generalization》。该论文一共调研了160篇文献,其中直接与领域泛化相关的有90篇。文章从问题定义、理论分析、方法总结...转载 2021-06-01 15:44:39 · 3949 阅读 · 0 评论 -
损失函数约束类间不一致性
损失函数约束类间不一致性及类内一致性参考书籍:Python深度学习-基于PyTorch交叉熵损失函数对不同类之间的距离的区分性较小。原因:softmax具备分类能力但是不具备度量学习的特征,没法压缩同一类别。因此,研究者们提出了几种损失函数。(1)三元组损失Triplet loss三元组损失属于度量学习,通过计算两张图象之间的相似度,使得输入图像被归入到相似度大的图像类别中去。L t = ∑ [ ∥ f ( x i a ) − f ( x i p ) ∥ 2 2 − ∥ f ( x i a ) −转载 2021-05-17 08:35:37 · 492 阅读 · 0 评论 -
Free Lunch for Few-Shot Learning: Distribution Calibration(ICLR 2021)
论文笔记 FSL 7】Free Lunch for Few-Shot Learning: Distribution Calibration(ICLR 2021)下载地址|论文源码转载 2021-04-25 17:35:23 · 1057 阅读 · 2 评论 -
对比学习(Contrastive Learning)综述
A.引入 https://zhuanlan.zhihu.com/p/346686467A.引入深度学习的成功往往依赖于海量数据的支持,其中对于数据的标记与否,可以分为监督学习和无监督学习。1. 监督学习:技术相对成熟,但是对海量的数据进行标记需要花费大量的时间和资源。2. 无监督学习:自主发现数据中潜在的结构,节省时间以及硬件资源。2.1 主要思路:自主地从大量数据中学习同类数据的相同特性,并将其编码为高级表征,再根据不同任务进行微调即可。2.2 分类:2.2.1生成..转载 2021-04-20 08:21:14 · 5944 阅读 · 0 评论 -
ICLR2021 | 显存不够?不妨抛弃端到端训练Revisiting Locally Supervised Learning Alternative to End-to-end Training
智源导读:本文主要介绍清华大学黄高团队被ICLR2021接收的一篇文章:Revisiting Locally Supervised Learning: an Alternative to End-to-End Training。论文链接:https://openreview.net/forum?id=fAbkE6ant2代码链接:https://github.com/blackfeather-wang/InfoPro-Pytorch撰文 |王语霖,清华大学首发于知乎专栏:炼丹学徒...转载 2021-04-17 17:25:51 · 473 阅读 · 0 评论 -
迁移学习——Domain Adaptation
Domain Adaptation在经典的机器学习问题中,我们往往假设训练集和测试集分布一致,在训练集上训练模型,在测试集上测试。然而在实际问题中,测试场景往往非可控,测试集和训练集分布有很大差异,这时候就会出现所谓过拟合问题:模型在测试集上效果不理想。以人脸识别为例,如果用东方人人脸数据训练,用于识别西方人,相比东方人识别性能会明显下降。当训练集和测试集分布不一致的情况下,通过在训练数据上按经验误差最小准则训练的模型在测试上性能不好,因此出现了迁移学习技术。领域自适应(Domain Adapt转载 2021-03-27 10:57:44 · 391 阅读 · 0 评论 -
最简单的 self-supervised 方法 对比学习 总结
从Kaiming的MoCo和Hinton组Chen Ting的SimCLR开始,自监督学习(SSL)成了计算机视觉的热潮显学。凡是大佬大组(Kaiming, VGG,MMLAB等),近两年都是搞了几个自监督方法的。从一开始的新奇兴奋地看着Arxiv上新发布的SSL方法(像MoCo, SwAV, BYOL, SimSiam等这些方法着实有趣),但是有一些相关的文章多少有些泛滥了,让人有些眼花缭乱。 最近FAIR的一个工作,着实让我眼前一亮,觉得好有意思,颇为叹服。关键的是这个方法特别简单,应当可以称之为最简单转载 2021-03-25 15:05:58 · 469 阅读 · 0 评论 -
理解对比表示学习(Contrastive Learning)
目录一、前言二、对比学习三、主要论文(附代码分析)1. AMDIM ([Bachman](https://arxiv.org/pdf/1906.00910.pdf) *et al.* 2019)2. SIMCLR ([Geoffrey Hinton](https://arxiv.org/pdf/2002.05709.pdf) *et al* 2020)3.MOCO ([Kaiming He](https://ieeexplore.ieee.org/document/9157636) *et al转载 2021-03-19 10:52:31 · 1955 阅读 · 0 评论 -
关于Hinton团队无监督新作SimCLR的所思所想
方法SimCLR伪代码[2]SimCLR示意图[1]具体而言就是:随机采样一个batch; 对batch里每张图像做两种增强,可以认为是两个view; 让同一张图的不同view在latent space里靠近,不同图的view在latent space里远离,通过NT-Xent实现。方法的确蛮简单的,想起了我们2017年的一篇文章Unsupervised Triplet Hashing for Fast Image Retrieval。方法见下图:Unsuperv.转载 2021-03-18 16:13:48 · 435 阅读 · 0 评论 -
基于Pytorch的动态卷积复现
论文的题目为《Dynamic Convolution: Attention over Convolution Kernels》paper的地址https://arxiv.org/pdf/1912.03458.pdf代码实现地址,其中包含一维,二维,三维的动态卷积;分别可以用于实现eeg的处理,正常图像的处理,医疗图像中三维脑部的处理等等(水漫金山)。https://github.com/kaijieshi7/Dynamic-convolution-Pytorch,大家觉得有帮助的话,我就求个star转载 2021-02-27 09:54:35 · 2888 阅读 · 2 评论 -
论CondConv、DynamicConv、DyNet的区别与联系
章首发于极市平台微信公众号(ID:extrememart)CondConv:https://arxiv.org/abs/1904.04971DynamicConv:https://arxiv.org/abs/1912.03458DyNet:https://arxiv.org/abs/2004.10694上个月初次看到华为的DyNet一文时,第一感觉这不又是一次CondConv的翻版吧。为什么说又呢?因为之前看到MSRA的DynamicConv时已经产生过了类似的感觉。之前一直没时间静下...转载 2021-02-27 09:38:21 · 817 阅读 · 0 评论 -
条件卷积,我更愿称之为动态卷积CondConv: Conditionally Parameterized Convolutions for Efficient Inference
CondConv: Conditionally Parameterized Convolutions for Efficient Inferencepaper:https://arxiv.org/abs/1904.04971code:https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet/condconvhttps://zhuanlan.zhihu.com/p/141868898该文是谷歌大神.转载 2021-02-27 09:15:53 · 4450 阅读 · 0 评论 -
【CUDA】win10切换不同版本的CUDA
在win10中显卡驱动只能安装一个,但是可以同时安装多个版本的cuda,如当需要切换版本时,先查看系统变量中CUDA_PATH的CUDA版本号然后在path中将cuda8相关的路径上移到最上面转载 2020-11-15 15:24:48 · 297 阅读 · 0 评论 -
这个 GitHub Trending 让我在腾讯会议中“换脸成”任何人!来唠唠如何上手
前言:GitHub 上又火了个项目,蛮有趣的:可以让你在 ZOOM 、腾讯会议等等软件中“换脸”成别人。自己 fork 到本地,调了一调。作者封装的已经相当好了,当然了,像我这种 CRUD 程序员 + AI 小白 肯定是要调一天的,不调一天是不可能的,也就调调就崩溃+一顿改环境这样子。咱们聊聊这个程序的原理与应用时的注意事项。今天上午开了个班会,用的腾讯会议,变身哈利波特、C罗、施瓦辛格完全没问题…项目地址:https://github.com/alievk/avatarify作者是个..转载 2020-10-05 16:21:51 · 2497 阅读 · 0 评论 -
【论文理解】ArcFace: Additive Angular Margin Loss for Deep Face Recognition(InsightFace)
论文地址:https://arxiv.org/abs/1801.07698github:https://github.com/deepinsight/insightface这篇论文基本介绍了近期较为流行的人脸识别模型,loss变化从softmax一路捋到CosFace,然后提出ArcFace,可以说起到很好的综述作用。论文评价对比方面也做了非常详细的对比策略方案分析。数据清洗工作也对后续研究应用有较大意义。数据和代码都开源,相当良心。本文主要工作概述:在三个影响人脸识别模型精度的主要因素上都转载 2020-05-09 22:22:31 · 598 阅读 · 0 评论 -
【CVPR 2018】腾讯AI lab提出深度人脸识别中的大间隔余弦损失
论文导读】 深度卷积神经网络(DCNN)在人脸识别中已经取得了巨大的进展,通常的人脸识别的核心任务都包括人脸验证与人脸识别,涉及到特征判别。很多模型都是使用Softmax损失函数去监督模型的训练,但是现在已经有资料证明,Softmax loss缺乏足够的在分类任务上的判别力,所以取得的效果也不是最好的。针对这个问题,本文设计了一个新的损失函数,我们称之为大间隔余弦损失。Figure 1图 1:我们提出的 CosFace 框架。在训练阶段,带有大间隔(large margin)的具有判别性的面部转载 2020-05-09 18:13:42 · 601 阅读 · 0 评论 -
基于深度学习识别模型的缺陷检测
根据读者反映,咱们的这个PCB素材设置的不对,应该是没有漆,铜线等等,应该是黑白的。额,具体我也知道,但没去过工厂,实在很难获得这些素材。。。所以就当是一次瑕疵识别的实践,具体的数据集你可以自己定义。代码在Github:Source code : https://github.com/Ixiaohuihuihui/Tiny-Defect-Detection-for-PCB一点心路历程,供需...转载 2020-03-01 23:48:37 · 3366 阅读 · 3 评论 -
结合深度学习的图像修复怎么实现?
作者:QZhang链接:https://www.zhihu.com/question/56801298/answer/155891603来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。019.09.02更新,目前共整理了15篇论文,仅供学习参考附: inpainting这个坑在CV大家族里是个相当小众的方向了,然而做了三年才发现这是个大坑...DL+...转载 2020-02-04 23:41:16 · 2001 阅读 · 0 评论 -
stylegan生成循环gif图片
style参考地址:https://github.com/NVlabs/stylegan生成gif参考地址:https://github.com/parameter-pollution/stylegan_paintingspaper地址:https://arxiv.org/abs/1812.04948"""generating cycle gif images"""import os...转载 2019-10-26 10:52:43 · 664 阅读 · 0 评论 -
支持向量机通俗导论(理解SVM的三层境界)
前言 动笔写这个支持向量机(support vector machine)是费了不少劲和困难的,原因很简单,一者这个东西本身就并不好懂,要深入学习和研究下去需花费不少时间和精力,二者这个东西也不好讲清楚,尽管网上已经有朋友写得不错了(见文末参考链接),但在描述数学公式的时候还是显得不够。得益于同学白石的数学证明,我还是想尝试写一下,希望本文在兼顾通俗易懂的基础上,真真正正能足以成为一篇完转载 2017-04-16 09:47:27 · 836 阅读 · 0 评论