
深度学习
文章平均质量分 65
GondorFu
这个作者很懒,什么都没留下…
展开
-
DPO: Direct Preference Optimization 介绍
DPO 是 RLHF 的屌丝版本,RLHF 需要加载 4 个模型(2个推理,2个训练),DPO 只需要加载 2 个模型(1个推理,一个训练)。原创 2024-09-14 17:47:28 · 1978 阅读 · 0 评论 -
Diffusion Model: DDIM
虽然 DDPM 中假定了扩散过程服从马尔科夫特性,但是即使不满足依然可以使用 DDPM 的训练过程进行求解。因此 DDIM 就设计了一个不服从马尔科夫特性的扩散过程,从而加速采样。因此,就可以使用如下非马尔科夫分布对反向扩散过程进行采样。DDIM 的分布与 DDPM 的分布之间的差别主要是将。二 中给出了逆向扩散过程概率分布,不过具体进行采样时,由于。的估计代入 二 中的逆向扩散分布中得到具体的递归采样公式。具体设计如下,只要满足如下定义,边缘分布就满足。的具体推导过程中是要求边缘分布服从。原创 2023-11-25 17:36:52 · 767 阅读 · 0 评论 -
Diffusion Model: DDPM
分布的推导过程:推导过程中,直接递归迭代即可。同时,过程中使用了 —— 两个高斯分布的和也满足高斯分布,其中均值为两个高斯分布均值的和,方差为两个高斯分布方差的和。四、具体生成(采样)过程:根据 二 中推导的公式,依次计算前一步图像的分布。就是 diffusion model 需要估计的噪声均值,而噪声的方式是由。三、具体训练过程:训练过程比较直接,利用 一 中的公式即可。原创 2023-11-25 09:19:31 · 714 阅读 · 0 评论 -
word2vec介绍
  word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一...转载 2018-07-31 10:51:27 · 200 阅读 · 0 评论 -
NLP——文本处理预处理
NLP——文本处理预处理词袋模型(Bag of Words, BoW)从字面意义上来看,文档包含词、短语、句子和段落等要素,在多数文本分类方法中,都将文本中出现的这些要素作为文本特征,而且随着要素级别的增高,其表达的语义越清晰,附带的信息也越丰富,但是特征组合的数目也会越大,因此,很少使用句子和段落作为特征。根据研究人员的实验,目前常见的特征项表示方法有:词、短语(Phrase)和 N-g...转载 2018-07-19 18:06:55 · 16063 阅读 · 0 评论 -
在openai gym环境下利用强化学习算法 demo
在openai gym环境下利用强化学习算法 demoOpenAI Gym环境:本实验采用CartPole环境,该环境中有一辆小车在一个一维的无阻力轨道上行动,在车上绑着一个连接不太结实的杆,这个杆会左右摇晃,给小车施加一个正向的力或负向的力,保证杆子竖直不倾倒。如下图所示。 本实验采用策略网络,它可以通过观察环境状态,直接预测出概率最大的执行策略,执行这个策略后可以获得最大的期...转载 2018-11-29 20:16:03 · 1775 阅读 · 1 评论 -
Coursera 概率图模型笔记
Coursera 概率图模型笔记Probabilistic Graphical Models 1: Representation...原创 2020-02-22 22:14:26 · 246 阅读 · 0 评论 -
欠拟合和过拟合
欠拟合和过拟合加载 IMDB 数据集,并采用独热编码NUM_WORDS = 10000(train_data, train_labels), (test_data, test_labels) = keras.datasets.imdb.load_data(num_words=NUM_WORDS)def multi_hot_sequences(sequences, dimensio...原创 2018-08-08 20:29:33 · 377 阅读 · 0 评论 -
GBDT+LR算法解析及Python实现
GBDT+LR算法解析及Python实现1. GBDT + LR 是什么本质上GBDT+LR是一种具有stacking思想的二分类器模型,所以可以用来解决二分类问题。这个方法出自于Facebook 2014年的论文Practical Lessons from Predicting Clicks on Ads at Facebook。2. GBDT + LR 用在哪GBDT+LR...转载 2019-03-08 10:07:51 · 935 阅读 · 0 评论 -
数据科学中必须熟知的5种聚类算法
数据科学中必须熟知的5种聚类算法聚类算法是机器学习中涉及对数据进行分组的一种算法。在给定的数据集中,我们可以通过聚类算法将其分成一些不同的组。在理论上,相同的组的数据之间有相同的属性或者是特征,不同组数据之间的属性或者特征相差就会比较大。聚类算法是一种非监督学习算法,并且作为一种常用的数据分析算法在很多领域上得到应用。在数据科学领域,我们利用聚类分析,通过将数据分组可以比较清晰的获取到数据...转载 2019-02-14 17:40:08 · 1036 阅读 · 1 评论 -
随机森林
随机森林可调输入参数介绍 —— scikit-learn分类器def __init__(self, n_estimators='warn', criterion="gini", max_depth=None, min_samples_split=2,...原创 2020-01-17 11:43:47 · 816 阅读 · 0 评论 -
基于域迁移的无监督语义分割
基于域迁移的无监督语义分割数据集对于语义分割的域适配,主要基于两个计算机合成数据集GTA5:https://download.visinf.tu-darmstadt.de/data/from_games/ SYNTHIA:http://synthia-dataset.net/真实验证集:CITYSCAPE:https://www.cityscapes-dataset.com/ CamVid:http://mi.eng.cam.ac.uk/research/projects/VideoR原创 2020-12-28 10:03:46 · 1629 阅读 · 0 评论 -
基于分割的停车位检测
VH-HFCN based Parking Slot and Lane Markings Segmentation on Panoramic Surround View2018 IEEE Intelligent Vehicles Symposium (IV):在逆透视变换图像对停车线进行语义风格,实现停车位检测。给出了一个包含 4200 PSV 图片的语义风格数据集http://cs1.tongji.edu.cn/tiev/resourse/ 针对应用场景中分割对象都是直线,提出了一种 VH-H.原创 2020-12-22 20:32:51 · 1972 阅读 · 1 评论 -
Line Segment Detection Using Transformers without Edges
Line Segment Detection Using Transformers without Edges算法流程基于给定图片首先基于 ResNet 提取图片特征 选取 ResNet Conv5(C5) feature 拉平构成Coarse Encoder (粗编码)的输入向量对特征进行编码 与第二步同时选取 ResNet Conv4(C4) feature 拉平构成 FineEncoder (精编码)的输入向量对特征进行编码,从而实现多尺度 在解码过程中,基于传入...原创 2021-01-13 20:16:16 · 516 阅读 · 0 评论 -
单目自监督稠密景深估计
Unsupervised Learning of Depth and Ego-Motion from VideoCVPR 2017:基于非结构化的视频输入,采用无监督学习框架得到了单目景深和相机运动估计。在训练时,景深和相机运动耦合在一起训练;但是在应用时可以单独使用。文章材料(论文,源码,演示视频)链接:https://people.eecs.berkeley.edu/~tinghuiz/projects/SfMLearner/算法原理整个算法的训练输入就是视频的三帧子序列。其中深度估..原创 2020-12-14 20:38:45 · 1067 阅读 · 0 评论 -
Pytorch CUDA 训练错误汇总
CUDA 训练错误汇总RuntimeError: CUDA error: device-side assert triggeredCUDA error: device-side assert triggered 为 CUDA 内置错误,所以 pytorch 无法打印具体错误信息。此时可以通过添加CUDA_LAUNCH_BLOCKING=1 环境变量来打印具体错误信息。CUDA_LAUNCH_BLOCKING=1 python main.pyAssertion `t >= 0 &am.原创 2020-12-31 10:02:54 · 2324 阅读 · 0 评论 -
Pytorch DistributedDataParallel 多卡训练
pytorch 多卡GPU训练基础知识常用方法torch.cuda.is_available():判断 GPU 是否可用 torch.cuda.device_count():计算当前可见可用的 GPU 数 torch.cuda.get_device_name():获取 GPU 型号,如Tesla K80 torch.cuda.manual_seed():为当前 GPU 设置随机种子 torch.cuda.manual_seed_all():为所有可见可用 GPU 设置随机种子 tor.原创 2020-12-28 14:48:14 · 13142 阅读 · 3 评论 -
基于文本的图像生成
基于文本的图像生成原创 2022-09-06 11:35:23 · 1473 阅读 · 0 评论 -
视觉自监督学习
视觉自监督学习原创 2022-09-06 11:13:05 · 790 阅读 · 0 评论 -
libtorch vision 基础功能介绍
libtorch Tensor 元素引用tensor.index({0, "...", 49, 212}) // 取第 1 维上 (0, *, 49, 212) 上的所有元素Opencv 读取图像常用转换torch::from_blob:从 cv::Mat 转 Tensorcv::cvtColor(frame, frame, CV_BGR2RGB); // step1. BGR->RGBframe.convertTo(frame, CV_32FC3, 1.0f / 255.0f)原创 2021-08-16 10:48:17 · 785 阅读 · 0 评论 -
基于 onnx 的 pytorch 模型结构可视化
有时候为了更好的分析现有模型结构,可能需要对模型进行可视化。这里推荐一个在线的可视化图片生成工具 —— netron。通过网页端简单上传 模型就能生成对应模型原创 2021-06-17 19:43:55 · 5469 阅读 · 0 评论 -
Pytorch tensorboard 使用
from torch.utils import tensorboardimport numpy as npimport keywordimport torchimport shutildef main(): shutil.rmtree('./saved') writer = tensorboard.SummaryWriter('./saved') # add_hparams for i in range(5): writer.add_hpar.原创 2021-05-29 11:38:52 · 371 阅读 · 0 评论 -
GradCAM 神经网络注意力可视化
GradCAM 神经网络注意力可视化GradCAM (GradCAM++)开源工具:https://pypi.org/project/pytorch-gradcam/论文地址:https://arxiv.org/pdf/1610.02391https://arxiv.org/pdf/1710.11063github:https://github.com/vickyliin/gradcam_plus_plus-pytorchGradCAM 是针对图片分类网络的性能可视化分析工具。它通过将.原创 2021-05-21 10:28:52 · 5339 阅读 · 5 评论 -
torchvision Faster RCNN 代码详解
参考博客:https://zhuanlan.zhihu.com/p/31426458 https://zhuanlan.zhihu.com/p/145842317参考代码:https://github.com/supernotman/Faster-RCNN-with-torchvision原创 2021-03-25 09:06:18 · 1268 阅读 · 0 评论 -
ubuntu16 CUDA cuDNN 安装总结
ubuntu16 CUDA 安装总结Nvidia 官网右上角有搜索功能,可以很方便的查找相关功能和获取资料,比如搜索 CUDA 和 cuDNN。CUDA 安装从 nvidia 官网通过各种链接进入 CUDA 下载页面:https://developer.nvidia.com/cuda-downloads通过点击选择诸如操作系统的选项获取安装方法,推荐选择 runfile 的安装方式。下载安装文件之后就可以通过上述图片左下角的 documentation 进入安装文档。如果需要安装旧版本的原创 2020-07-11 15:23:34 · 724 阅读 · 0 评论 -
Tensorflow Keras
Tensorflow Keras翻译自:https://www.tensorflow.org/guide/keras导入tf.kerasimport tensorflow as tffrom tensorflow import keras通过Sequential model构建神经网络model = keras.Sequential()# Adds a dense...原创 2018-08-08 20:18:55 · 2031 阅读 · 0 评论 -
Tensorflow 入门
Tensorflow 入门计算图Tensorflow通过计算图来定义神经网络的结构,每个节点就是一个运算,而常量也被转化为一种永远输出固定值的运算。import tensorflow as tfa = tf.constant([1.0, 2.0], name="a")b = tf.constant([2.0, 3.0], name="b")result = a + b在...原创 2018-11-01 17:12:13 · 178 阅读 · 0 评论 -
深度神经网络
深度神经网络深度学习与深度神经网络深度学习:一类通过多层非线性变换对高复杂性数据建模算法的合集。可以看出深度学习有两个非常重要的特性——多层和非线性。对于非线性而言,因为现实中存在着大量的非线性关系,而线性模型即输入参数的加权组合并不能很好地解决这种关系。而深度学习通过添加激活函数,即添加非线性函数引入了非线性很好的解决了线性模型的局限性。其中tf.nn.relu、tf.sigmoi...原创 2018-11-20 17:15:50 · 1318 阅读 · 0 评论 -
Tensorflow完整实例——MNIST数字识别问题
Tensorflow完整实例——MNIST数字识别问题完整实例程序import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_dataINPUT_NODE = 784 # 输入节点OUTPUT_NODE = 10 # 输出节点LAYER1_NODE = 500 #...原创 2018-11-21 14:33:02 · 1053 阅读 · 0 评论 -
图像识别与卷积神经网络
图像识别与卷积神经网络卷积层和池化层样例import tensorflow as tfimport numpy as npM = np.array([ [[1],[-1],[0]], [[-1],[2],[1]], [[0],[2],[-2]] ])print "Matrix shape is: ",M.shape""...原创 2018-11-21 16:57:37 · 383 阅读 · 0 评论 -
循环神经网络
循环神经网络循环神经网络简介循环神经网络的主要用途是处理和预测序列数据,其挖掘数据中的时序信息以及语义信息的深度表达能力被充分利用,并在语音识别,语言模型,机器翻译以及时序分析等方面实现了突破。循环神经网络的来源就是为了刻画一个序列当前的输出与之前信息的关系。从网络结构上,循环神经网络会记忆之前的信息,并利用之前的信息影响后面结点的输出。也就是说,循环神经网络的隐藏层之间的结点是有连接的,...原创 2018-11-22 11:41:34 · 1461 阅读 · 0 评论 -
TensorFlow TensorBoard 可视化
TensorBoard 可视化命名空间与 TensorBoard图上的节点为了更好地组织可视化效果图中的计算节点,TensorBoard支持通过Tensorflow命名空间来管理可视化效果图上的节点。import tensorflow as tfwith tf.variable_scope("foo"): a = tf.get_variable("bar", [1]...原创 2018-11-26 19:07:30 · 301 阅读 · 0 评论 -
AlexNet 介绍
AlexNet 介绍AlexNet架构首先论文中的原始图像大小有误,应该是 227 * 227,但是作者写成了 224 * 224。第一层:原始图像大小为 227 * 227 * 3(长宽为 227像素,rgb三通道)。使用的卷积核大小为 11 * 11 * 3,stride(步长)为 4,一共使用 96个卷积核。得到的数据大小为 55 * 55 * 96 ( (227-11...原创 2018-08-14 19:03:05 · 1430 阅读 · 0 评论 -
常见神经网络汇总
常见深度网络汇总AlexNethttps://blog.youkuaiyun.com/a40850273/article/details/81672425YOLOyolo v1:https://zhuanlan.zhihu.com/p/46691043 yolo v2:https://zhuanlan.zhihu.com/p/47575929 yolov3:https://www.ji...原创 2020-01-14 20:17:51 · 637 阅读 · 0 评论 -
deeplearing.ai 深度学习课程笔记
deeplearing.ai 深度学习课程笔记一、神经网络与机器学习直观理解神经网络。随着神经网络层的加深,所提取的特征(函数)不断组合,最终得到更宏观、更复杂的所需要的特征。简单的例子比如房屋价值预测。基础特征可能是房间数,面积,邮编,交通等情况。当神经网络进行学习时,可能 hidden layer 中的某个神经元,实现的等效逻辑就是根据邮编和交通情况估计了房子是在富人区还是平民区,这个...原创 2020-01-01 23:26:39 · 685 阅读 · 0 评论