叶大富-优快云博客

原创深入浅出理解 AI 生图模型 Stable Diffusion

用上述的数学方法，简单理解，当输入负向的 Prompt 的时候，也会生成一张噪声图 B2，但此时我们会用正向的 Prompt 生成的噪声图 B1 减去 B2 再减去 C 得出 D，那就意味着最终生成的图片会更加远离 B2，因为减掉了更多与 B2 相关的噪声。所以如果你用同样是 Diffusion Model 搭建的 Midjourney 话，你会看到如下的过程，首先是一张模糊甚至黑色的图片，然后图片会一步步变得越来越清晰，这就是我前面所说的「降噪」或者「雕刻」的过程。反之越远，则越不相关。

2024-06-25 16:50:29 1255

原创 OPENCV基础

OpenCV提供了VideoCapture类和VideoWriter类来支持各种格式的视频流，支持的格式类型会因系统的不同而有所变化，但基本上都是支持avi格式的，且对于视频文件和摄像头画面的读写所用到的接口基本上都相同，因此，我们把它们放在一起来讲了。注意这个是对视频文件才有意义，对于摄像头是没意义的，且以上获取到的返回信息均是浮点型的，注意转换为整型。获取到的帧率对于摄像头设备来说，如果所使用的终端不支持查询，那么将会返回0值，且该值也不是非常精确的。

2024-05-08 09:45:16 913 1

原创 TensorRT部署

前段时间用 TensorRT 部署了一套模型，速度相比 Python 实现的版本快了 20 多倍，中间踩了许多坑，但是最后发现流程其实相当简单，特此记录一下踩坑过程。顺便推荐一下深蓝学院的CUDA课程，如果想深入了解CUDA和TensorRT相关知识和运用的朋友可以关注一下。

2024-04-07 16:08:48 619

原创 yolov5解读

feature vector是由feature maps展开的，因此常规做法是在输入数据做文章，即对图像进行裁剪和变形操作。但是这两种方式可能会出现不同的问题，1）裁剪的区域可能没法包含物体的整体；2）变形操作造成目标无用的几何失真。而SPP是在feature maps展开为feature vector时做文章的，即。

2024-04-01 12:04:24 2089

原创 VSCode远程连接服务器：远程主机密钥已更改，端口转发已禁用

删除对应服务器地址的密钥信息，重新连接服务器，按照vscode的提示依次进行即可。触发情形：之前用本机远程连接过该。，但服务器的密码之后更改过。解决方法：打开本机存储。

2024-03-26 15:49:50 1400 1

原创深度学习中的epoch与batch_size关系

总之，epoch 控制了整个训练的迭代次数，而 batch size 决定了每次迭代中处理的样本数量。在每个 epoch 开始时，数据集会被随机划分为多个 batch，然后模型使用这些 batch 逐一进行前向传播和反向传播，从而更新权重。一次 epoch 完成后，数据集会被重新随机划分为新的 batch，这个过程会重复多次，直到完成指定数量的 epoch 或达到停止条件。在训练过程中，每个 epoch 包含多个 batch，而 batch size 决定了每个 batch 中包含多少样本。

2023-12-05 22:12:44 1588 1

原创 Python使用cv2读取图片时报错

A：OpenCV 库是在 C++ 写的，而在较早版本的 C++ 标准中并未提供直接的 Unicode 或者多字节字符编码支持。所以，OpenCV 在面对中文路径时，可能解析出现问题，因此最好使用 contains only ASCII 的字符路径。这个问题不只存在于Python中，其他使用 OpenCV 的语言，如 C++，也会遇到。一般使用的imread和imwrite文件路径是不能有中文的，但我们可以用其他方法代替。cv2读取图片时，图片的路径不能包含有中文或者空格，只能为英文或者数字否则报错！

2023-11-24 11:59:41 6109 3

weixin_48477590的博客