- 博客(7)
- 收藏
- 关注
原创 深入浅出理解 AI 生图模型 Stable Diffusion
用上述的数学方法,简单理解,当输入负向的 Prompt 的时候,也会生成一张噪声图 B2,但此时我们会用正向的 Prompt 生成的噪声图 B1 减去 B2 再减去 C 得出 D,那就意味着最终生成的图片会更加远离 B2,因为减掉了更多与 B2 相关的噪声。所以如果你用同样是 Diffusion Model 搭建的 Midjourney 话,你会看到如下的过程,首先是一张模糊甚至黑色的图片,然后图片会一步步变得越来越清晰,这就是我前面所说的「降噪」或者「雕刻」的过程。反之越远,则越不相关。
2024-06-25 16:50:29
1056
原创 OPENCV基础
OpenCV提供了VideoCapture类和VideoWriter类来支持各种格式的视频流,支持的格式类型会因系统的不同而有所变化,但基本上都是支持avi格式的,且对于视频文件和摄像头画面的读写所用到的接口基本上都相同,因此,我们把它们放在一起来讲了。注意这个是对视频文件才有意义,对于摄像头是没意义的,且以上获取到的返回信息均是浮点型的,注意转换为整型。获取到的帧率对于摄像头设备来说,如果所使用的终端不支持查询,那么将会返回0值,且该值也不是非常精确的。
2024-05-08 09:45:16
732
1
原创 TensorRT部署
前段时间用 TensorRT 部署了一套模型,速度相比 Python 实现的版本快了 20 多倍,中间踩了许多坑,但是最后发现流程其实相当简单,特此记录一下踩坑过程。顺便推荐一下深蓝学院的CUDA课程,如果想深入了解CUDA和TensorRT相关知识和运用的朋友可以关注一下。
2024-04-07 16:08:48
500
原创 yolov5解读
feature vector是由feature maps展开的,因此常规做法是在输入数据做文章,即对图像进行裁剪和变形操作。但是这两种方式可能会出现不同的问题,1)裁剪的区域可能没法包含物体的整体;2)变形操作造成目标无用的几何失真。而SPP是在feature maps展开为feature vector时做文章的,即。
2024-04-01 12:04:24
1964
原创 VSCode远程连接服务器:远程主机密钥已更改,端口转发已禁用
删除对应服务器地址的密钥信息,重新连接服务器,按照vscode的提示依次进行即可。触发情形:之前用本机远程连接过该。,但服务器的密码之后更改过。解决方法:打开本机存储。
2024-03-26 15:49:50
1112
1
原创 深度学习中的epoch与batch_size关系
总之,epoch 控制了整个训练的迭代次数,而 batch size 决定了每次迭代中处理的样本数量。在每个 epoch 开始时,数据集会被随机划分为多个 batch,然后模型使用这些 batch 逐一进行前向传播和反向传播,从而更新权重。一次 epoch 完成后,数据集会被重新随机划分为新的 batch,这个过程会重复多次,直到完成指定数量的 epoch 或达到停止条件。在训练过程中,每个 epoch 包含多个 batch,而 batch size 决定了每个 batch 中包含多少样本。
2023-12-05 22:12:44
1380
1
原创 Python使用cv2读取图片时报错
A:OpenCV 库是在 C++ 写的,而在较早版本的 C++ 标准中并未提供直接的 Unicode 或者多字节字符编码支持。所以,OpenCV 在面对中文路径时,可能解析出现问题,因此最好使用 contains only ASCII 的字符路径。这个问题不只存在于Python中,其他使用 OpenCV 的语言,如 C++,也会遇到。一般使用的imread和imwrite文件路径是不能有中文的,但我们可以用其他方法代替。cv2读取图片时,图片的路径不能包含有中文或者空格,只能为英文或者数字否则报错!
2023-11-24 11:59:41
5806
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人