- 博客(33)
- 收藏
- 关注
原创 激光雷达LIDAR
在转镜方案中,也存在一面扫描镜(一维转镜)和一纵一横两面扫描镜(二维转镜)两种技术路线。一维转镜线束与激光发生器数量一致,而二维转镜可以实现等效更多的线束,在集成难度和成本控制上存在优势。但是,仅靠一束光线仅能测出一个点的距离,没法满足如自动驾驶等的探测需求,因此,需要加上更多的线束,这样就能探测出障碍物的垂直轮廓了,线束越多能够探测的精度就越高。与MEMS微振镜平动和扭转的形式不同,转镜是反射镜面围绕圆心不断旋转。完全取消活动部件减少震动 ,不需要获得部件,依靠电子部件控制旋转角度。
2023-12-18 12:44:46
995
原创 Re9 Attention is all you need
主流序列转录模型基于复杂的循环神经网络和卷积神经网络,包括一个encoder和decoder,同时在这之中使用一个叫注意力机制attention的东西本文提出了一个简单的网络架构,仅仅使用注意力机制,而没有使用神经网络,实验结果表明效果更好。
2023-12-14 19:12:53
875
原创 Re8 Generative Modeling by Estimating Gradients of the Data Distribution
提出基于分数的模型框架,首先通过分数匹配估计数据密度的梯度,然后通过朗之万动力学生成样本,并提出通过训练噪声条件分数网络,并能生成高质量的图像。GAN隐式表示了生成器网络可以产生的所有对象的分布。通过近似最大似然直接学习分布的概率密度,如VAE。概率分布由其抽样过程的模型隐式表示,如GAN。
2023-11-30 20:50:01
562
原创 Re6:State of the Art on Diffusion Models for Visual Computing
Abstract将会主要介绍扩散模型的基本数学概念、流行的扩散模型实现细节,以及其应用,最后讨论可用的数据集,指标等1 Introduction生成式模型的能力大爆发,如Stable Diffusion, Imagen, Midjourney, DALL-E 2, DALL-E 3等2 Scope of this STAR挑战网络上的3D物体或场景的实例图片很少扩散模型的推理时间很慢,网络规模太大,训练速度慢,推理速度慢3 Fundamentals of Diffusion
2023-11-22 22:24:29
1027
原创 Re7:Difusion Models: A Comprehensive Survey of Methods and Applications
扩散模型(Diffusion Model)首篇综述-Diffusion Models: A Comprehensive Survey of Methods and Applications。
2023-11-15 18:43:22
290
原创 生成网络-学习笔记 鲁鹏-北邮
VAE的编码器与自编码器不同,自编码器是直接得到输出z(编码),而VAE的编码器输出是一个概率分布,其中m为分布均值,σ为分布方差。e是方差范围内的采样值,e与exp(σ)做乘积,得到的值作为偏移量与m相加后最为最后输出(带有噪声的)编码。A:解码器只能生成已有的图片,如输入满月与半月的图像,希望生成中间状态的月亮,只是用解码器是无法实现的。2. 训练完后的编码器作为有监督学习的初始特征提取模型(利用少量有标签的数据,训练最终的网络)。其中,噪声的方差σ是从数据中学到的,取exp是为了保证是一个正数。
2023-11-07 21:01:55
118
原创 Re5读论文 Neural Ordinary Differential Equations
师兄推荐的论文,开冲!已经把常微分方程是什么还给张宇老师了,哎~~~
2023-11-06 15:54:27
188
原创 Re4读论文 Denoising Diffusion Probabilistic Models
Denoising Diffusion Probabilistic ModelsNeurlPS2020
2023-11-03 12:32:34
120
原创 李宏毅机器学习 Diffusion Model
Imagen所用文字Encoder,其中FID值越小,生成的图片越好 ,CLIP值越大越好, 文字编码的大小较影响生成图片的质量。4:从平均值(mean)=0,方差(variance)=1的normal distribution中sample出ε,大小与image一致,是一张全是噪音的图片。Denoise内部通过输入噪音图片和步骤step,产生一张噪音图,即预测这张照片中噪音应该的样子,再用输入图片减去噪音图片,生成输出图。5: 红框内为干净图片和噪音图片混合生成的噪音,结合t,进行逼近。
2023-10-31 22:25:11
288
1
原创 pytorch深度学习实践6-10
每一次空间压缩都会引入非线性,即可以从8维降维到6维,6维后可继续降维至一维空间,找到8维空间到一位空间的非线性神经网络,添加sigma拟合非线性变换。算出对应每个数字的概率值,选取最大的即为输出数字。输入n维向量,和n维的权重做内积。逻辑回归解决的是分类问题。计算属于每个分类的概率。一行一样本,一列一特征。
2023-10-26 19:22:50
71
原创 Re3读论文 3D Face Reconstruction in Deep Learning Era: A Survey
一篇关于人脸建模、追踪、应用的综述文章、
2023-10-26 15:25:30
160
原创 Re2读论文:GANHead: Towards Generative Animatable Neural Head Avatars-CVPR2023
摘要和结论都描述了下自己的工作和模型的优异性通过使用正则空间的三个网络生成完整真实的人脸形象,GANhead能够展现粗几何、详细的正常纹理。通过形变模块后,生成的人脸形象可以直接由FLAME参数生成动画(使用LBS线性蒙皮算法)大量的实验表明GANHead在人脸形象生成和原始扫描拟合有其优越性。
2023-10-23 11:26:24
196
1
原创 李宏毅机器学习-SVM
第二步原本的loss function是:如果预测结果 g(x^n) 正确,则等于0。如果预测结果错误,则等于1。但是这样的做法,loss function是不可微的,没法用GD来求解,因此我们需要更换损失函数。因此横坐标为两者相乘,我们希望同号时两者相乘越大/小越好,所以原则上我们希望横轴越大,loss越小。理想情况下,我们希望二者异号时loss=1,同号时loss=0,也就是黑色线,但这没法微分。越大越好,越positive,同理,真实为-1时,再看眼这个式子,我们当然希望真实为1时,
2023-10-10 21:39:14
130
1
原创 李宏毅深度学习笔记3:预测神奇宝贝(回归)、分类神奇宝贝(分类)
需要许多数据集来进行训练,因此需要很多宝可梦的进化前后数据,十个数据组成的数据集定义Loss function,Loss function是函数的函数,即损失值受wbw,bwb影响yy为真实值,损失值为真实值减预测值求平方再相加绘制wblossw,b,losswbloss图形,颜色越红代表损失值越大,越蓝代表损失值越小,函数越好。
2023-10-06 14:06:00
689
1
原创 Linux(ubuntu)命令总结
共10位,第1位表示文档类型,d表示目录,-表示文件,l表示链接文件,d表示可随机存取的设备,如U盘等,c表示一次性读取设备,如鼠标、键盘等。后9位,依次对应三种身份所拥有的权限,身份顺序为:owner、group、others,权限顺序为:readable、writable、executable。表示这是一个普通文件,拥有者有读和写权限,而组内成员和其他人只有读权限。中有账号名命名的文件夹,也就是经常看到的。首先看下ubuntu的网络结构,是系统的根目录,在这之下有。这个我们常用的文件夹,
2023-10-04 22:35:39
130
1
原创 李宏毅深度学习笔记2:深度学习简介、反向传播
深度学习的发展过程2009年使用GPU训练网络2011年在语音识别领域逐渐流行2012年使用深度学习方法赢得ILSVRC图像识别比赛深度学习的三步曲定义一系列函数定义损失函数优化模型手写数字识别任务损失函数:已知参数,通过模型得到输入数据的输出值;已知真实值将每个损失函数加总。
2023-10-04 19:27:01
162
1
原创 超分辨显微成像技术
—电子波长为光波长的千分之一,因此电子显微镜的分辨率是光学显微镜的1000倍,但是电镜需要在成像物体上覆上一层金属膜,如果这样观察活细胞会立刻杀死细胞,一次无法对活细胞进行成像。——特制荧光染料与细胞器结合,染色标记后打一束激发光,就会产生绿色荧光。定义光学显微镜分辨率极限为200nm。n:成像的介质,一般空气取1。d:两个艾里斑的最小距离。:孔径半角,最大90°。
2023-09-18 11:05:01
401
原创 kaggle Airbus Ship Detection Challenge coco数据集转voc(xml)格式
本文是kaggle_ship数据集转化为coco格式的基础上将其转化为适合yolo训练的voc格式。kaggle Airbus Ship Detection Challenge 训练集下载:https://blog.youkuaiyun.com/weixin_42880443/article/details/82015347kaggle Airbus Ship Detection Challenge 训练...
2019-05-02 10:28:03
2442
5
原创 Yolov3 mAp计算,吐血整理,含Bug处理
Yolov3 mAp计算,吐血整理,含Bug处理用了两天时间把计算mAp值该踩的坑基本上踩了一遍,整理一下,以免以后忘记一.所需材料训练好的权重weights验证集图片验证集的xml格式标记Fastrcnn的voc_eval.pyhttps://github.com/rbgirshick/py-faster-rcnn/blob/master/lib/datasets/voc_eval...
2019-05-02 09:50:57
5002
7
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人