Zhuanshan_-优快云博客

原创八股文记录

卷积：卷积层通过特定数目的卷积核对输入的多通道特征图进行扫描和运算，从而得到多个拥有更高层语义信息的输出特征图。

2024-10-29 14:35:22 634

原创 FFJORD复现

复现了任天琦的ffjord文章，记录下。

2024-09-14 10:42:47 272

原创 latent-diffusion model测试&训练

最近在看ldm，稍微理解了一些原理，开始上手测试，开始栽树，记录一下。

2024-09-14 10:42:08 659 3

原创 stable diffusion官方版本复现

历经千辛万苦，生成了demo图片。

2024-02-19 20:19:26 1039

在转镜方案中，也存在一面扫描镜（一维转镜）和一纵一横两面扫描镜（二维转镜）两种技术路线。一维转镜线束与激光发生器数量一致，而二维转镜可以实现等效更多的线束，在集成难度和成本控制上存在优势。但是，仅靠一束光线仅能测出一个点的距离，没法满足如自动驾驶等的探测需求，因此，需要加上更多的线束，这样就能探测出障碍物的垂直轮廓了，线束越多能够探测的精度就越高。与MEMS微振镜平动和扭转的形式不同，转镜是反射镜面围绕圆心不断旋转。完全取消活动部件减少震动，不需要获得部件，依靠电子部件控制旋转角度。

2023-12-18 12:44:46 995

原创 Re9 Attention is all you need

主流序列转录模型基于复杂的循环神经网络和卷积神经网络，包括一个encoder和decoder，同时在这之中使用一个叫注意力机制attention的东西本文提出了一个简单的网络架构，仅仅使用注意力机制，而没有使用神经网络，实验结果表明效果更好。

2023-12-14 19:12:53 875

原创 Re8 Generative Modeling by Estimating Gradients of the Data Distribution

提出基于分数的模型框架，首先通过分数匹配估计数据密度的梯度，然后通过朗之万动力学生成样本，并提出通过训练噪声条件分数网络，并能生成高质量的图像。GAN隐式表示了生成器网络可以产生的所有对象的分布。通过近似最大似然直接学习分布的概率密度，如VAE。概率分布由其抽样过程的模型隐式表示，如GAN。

2023-11-30 20:50:01 562

原创 GAN&VAE&Diffusion

px==qx。

2023-11-29 16:21:05 1912

原创 Re6:State of the Art on Diffusion Models for Visual Computing

Abstract将会主要介绍扩散模型的基本数学概念、流行的扩散模型实现细节，以及其应用，最后讨论可用的数据集，指标等1 Introduction生成式模型的能力大爆发，如Stable Diffusion, Imagen, Midjourney, DALL-E 2, DALL-E 3等2 Scope of this STAR挑战网络上的3D物体或场景的实例图片很少扩散模型的推理时间很慢，网络规模太大，训练速度慢，推理速度慢3 Fundamentals of Diffusion

2023-11-22 22:24:29 1027

原创博弈论入门

即将n=7，再大没有意义。同时满足四个式子时，解得。

2023-11-21 20:48:19 340

原创 Re7:Difusion Models: A Comprehensive Survey of Methods and Applications

扩散模型(Diffusion Model)首篇综述-Diffusion Models: A Comprehensive Survey of Methods and Applications。

2023-11-15 18:43:22 290

原创深度学习网络参数计算

总参数量只与卷积核的尺寸、通道数、层数相关，而与输入数据的大小无关。

2023-11-08 20:04:20 92

原创生成网络-学习笔记鲁鹏-北邮

VAE的编码器与自编码器不同，自编码器是直接得到输出z（编码），而VAE的编码器输出是一个概率分布，其中m为分布均值，σ为分布方差。e是方差范围内的采样值，e与exp(σ)做乘积，得到的值作为偏移量与m相加后最为最后输出（带有噪声的）编码。A：解码器只能生成已有的图片，如输入满月与半月的图像，希望生成中间状态的月亮，只是用解码器是无法实现的。2. 训练完后的编码器作为有监督学习的初始特征提取模型（利用少量有标签的数据，训练最终的网络）。其中，噪声的方差σ是从数据中学到的，取exp是为了保证是一个正数。

2023-11-07 21:01:55 118

原创 Re5读论文 Neural Ordinary Differential Equations

师兄推荐的论文，开冲！已经把常微分方程是什么还给张宇老师了，哎~~~

2023-11-06 15:54:27 188

原创 Re4读论文 Denoising Diffusion Probabilistic Models

Denoising Diffusion Probabilistic ModelsNeurlPS2020

2023-11-03 12:32:34 120

原创李宏毅机器学习 Diffusion Model

Imagen所用文字Encoder，其中FID值越小，生成的图片越好，CLIP值越大越好，文字编码的大小较影响生成图片的质量。4：从平均值(mean)=0，方差(variance)=1的normal distribution中sample出ε，大小与image一致，是一张全是噪音的图片。Denoise内部通过输入噪音图片和步骤step，产生一张噪音图，即预测这张照片中噪音应该的样子，再用输入图片减去噪音图片，生成输出图。5：红框内为干净图片和噪音图片混合生成的噪音，结合t，进行逼近。

2023-10-31 22:25:11 288 1

原创 pytorch深度学习实践6-10

每一次空间压缩都会引入非线性，即可以从8维降维到6维，6维后可继续降维至一维空间，找到8维空间到一位空间的非线性神经网络，添加sigma拟合非线性变换。算出对应每个数字的概率值，选取最大的即为输出数字。输入n维向量，和n维的权重做内积。逻辑回归解决的是分类问题。计算属于每个分类的概率。一行一样本，一列一特征。

2023-10-26 19:22:50 71

原创 Re3读论文 3D Face Reconstruction in Deep Learning Era: A Survey

一篇关于人脸建模、追踪、应用的综述文章、

2023-10-26 15:25:30 160

原创 Re2读论文：GANHead: Towards Generative Animatable Neural Head Avatars-CVPR2023

摘要和结论都描述了下自己的工作和模型的优异性通过使用正则空间的三个网络生成完整真实的人脸形象，GANhead能够展现粗几何、详细的正常纹理。通过形变模块后，生成的人脸形象可以直接由FLAME参数生成动画（使用LBS线性蒙皮算法）大量的实验表明GANHead在人脸形象生成和原始扫描拟合有其优越性。

2023-10-23 11:26:24 196 1

原创 markdown/Latex/tmux常用语法

经常在csdn写东西，常用的markdown语句记录一下。

2023-10-15 12:56:15 211 1

原创李宏毅机器学习-PCA

聚类就是给一堆没有标签的数据分类，贴标签。

2023-10-12 21:04:27 209

原创李宏毅机器学习-SVM

第二步原本的loss function是：如果预测结果 g(x^n) 正确，则等于0。如果预测结果错误，则等于1。但是这样的做法，loss function是不可微的，没法用GD来求解，因此我们需要更换损失函数。因此横坐标为两者相乘，我们希望同号时两者相乘越大/小越好，所以原则上我们希望横轴越大，loss越小。理想情况下，我们希望二者异号时loss=1，同号时loss=0，也就是黑色线，但这没法微分。越大越好，越positive，同理，真实为-1时，再看眼这个式子，我们当然希望真实为1时，

2023-10-10 21:39:14 130 1

原创 60分钟速成PyTorch笔记

【代码】60分钟速成PyTorch笔记。

2023-10-06 22:17:55 127 1

原创李宏毅深度学习笔记3：预测神奇宝贝(回归)、分类神奇宝贝(分类)

需要许多数据集来进行训练，因此需要很多宝可梦的进化前后数据，十个数据组成的数据集定义Loss function，Loss function是函数的函数，即损失值受wbw,bwb影响yy为真实值，损失值为真实值减预测值求平方再相加绘制wblossw,b,losswbloss图形，颜色越红代表损失值越大，越蓝代表损失值越小，函数越好。

2023-10-06 14:06:00 689 1

原创 Linux(ubuntu)命令总结

共10位，第1位表示文档类型，d表示目录，-表示文件，l表示链接文件，d表示可随机存取的设备，如U盘等，c表示一次性读取设备，如鼠标、键盘等。后9位，依次对应三种身份所拥有的权限，身份顺序为：owner、group、others，权限顺序为：readable、writable、executable。表示这是一个普通文件，拥有者有读和写权限，而组内成员和其他人只有读权限。中有账号名命名的文件夹，也就是经常看到的。首先看下ubuntu的网络结构，是系统的根目录，在这之下有。这个我们常用的文件夹，

2023-10-04 22:35:39 130 1

原创李宏毅深度学习笔记2：深度学习简介、反向传播

深度学习的发展过程2009年使用GPU训练网络2011年在语音识别领域逐渐流行2012年使用深度学习方法赢得ILSVRC图像识别比赛深度学习的三步曲定义一系列函数定义损失函数优化模型手写数字识别任务损失函数：已知参数，通过模型得到输入数据的输出值；已知真实值将每个损失函数加总。

2023-10-04 19:27:01 162 1

原创 windows/ubuntu安装

win和ubuntu安装

2023-09-30 17:06:01 137

原创 3B1B深度学习系列视频学习笔记

本文是学习b站3b1b学习笔记，部分参考。

2023-09-23 15:55:07 155 1

原创超分辨显微成像技术

—电子波长为光波长的千分之一，因此电子显微镜的分辨率是光学显微镜的1000倍，但是电镜需要在成像物体上覆上一层金属膜，如果这样观察活细胞会立刻杀死细胞，一次无法对活细胞进行成像。——特制荧光染料与细胞器结合，染色标记后打一束激发光，就会产生绿色荧光。定义光学显微镜分辨率极限为200nm。n:成像的介质，一般空气取1。d：两个艾里斑的最小距离。：孔径半角，最大90°。

2023-09-18 11:05:01 401

原创李宏毅深度学习笔记1:基本概念简介、PyTorch Tutorial

李老师深度学习笔记1

2023-09-16 15:53:25 238 1

原创 pytorch深度学习实践1-5讲

pytorch学习

2023-09-10 15:07:32 106 1

原创 kaggle Airbus Ship Detection Challenge coco数据集转voc(xml)格式

本文是kaggle_ship数据集转化为coco格式的基础上将其转化为适合yolo训练的voc格式。kaggle Airbus Ship Detection Challenge 训练集下载：https://blog.youkuaiyun.com/weixin_42880443/article/details/82015347kaggle Airbus Ship Detection Challenge 训练...

2019-05-02 10:28:03 2442 5

原创 Yolov3 mAp计算，吐血整理，含Bug处理

Yolov3 mAp计算，吐血整理，含Bug处理用了两天时间把计算mAp值该踩的坑基本上踩了一遍，整理一下，以免以后忘记一.所需材料训练好的权重weights验证集图片验证集的xml格式标记Fastrcnn的voc_eval.pyhttps://github.com/rbgirshick/py-faster-rcnn/blob/master/lib/datasets/voc_eval...

2019-05-02 09:50:57 5002 7

weixin_44796129的博客