rf-detr-base.pth
rf-detr-base 模型,不能上外网的可以下载
泊松融合实例2025源代码
网上给的泊松融合例子,代码不够简洁明了,花了很长时间验证,现在整理了一下,
代码和示例图都已配齐,只管执行就好,效果还是不错的。
本博客直接给出来最好的效果和源代码
博客地址:
https://blog.youkuaiyun.com/jacke121/article/details/144937827
tiny-cuda-cnn.zip
tiny-cuda-cnn库,linux安装编译
official repo: https://github.com/NVlabs/tiny-cuda-nn
该包可以显著提高NeRF训练速度,是Instant-NGP、Threestudio和NeRFstudio等框架中,必须使用的。
本文提供tiny-cuda-nn可以安装的完整包的下载链接
分享下载成功概率高的一套流程:【先下载pytorch3d,再下载tiny-cuda-nn】
conda install pytorch==2.0.0 torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia -y
# FORCE_CUDA=1 pip install "git+https://github.com/facebookresearch/pytorch3d.git" #
conda install -c fvcore -c iopath
cd tiny-cuda-nn/bindings/torch
python setup.py install
nvdiffrast frpc-linux-amd64
nvdiffrast 包下载,
测试linu可以用,安装方法:python setup.py install
frpc_linux_amd64 包,下载好的
直线检测分割网络源代码
直线检测cnn网络, 包含训练代码,推理代码
用分割网络来实现直线检测,需要标注。精度比较好,速度也很快,包含旋转,裁剪,翻转等数据增强。
'代码路径
train_daoge_line2.py
' 推理
daoge_fenge_line2.py
yolov8 训练源代码,无缝支持labelme标注
yolov8最新源码版,原版只支持标注格式为txt格式,笔者以前训练yolo用labelme的json格式标注,统一格式,数据管理,可视化,查badcase更方便。
修改了数据格式,增加支持labelmejson独立格式标注
标注样例:
{
"version": "5.3.1",
"flags": {},
"shapes": [
{
"label": "dao",
"points": [
[
1990.9259259259259,
322.3395061728395
],
[
53.75,
689.5000000000001
]
预测发现还是会有重叠框,加上nms过滤重叠框,效果会更好
本预测代码已经加上nms机制
训练代码:train_det_new.py
保存模型会保存精度,免得best.pt 会过拟合。
yolov8 华为昇腾适配
yolov8 华为昇腾适配源代码和模型
在人工智能飞速发展的当下,目标检测算法一直备受瞩目,而 YOLOv8 更是其中的佼佼者,凭借其出色的精度与检测速度收获了大量开发者与研究团队的青睐。华为昇腾作为业内领先的人工智能计算平台,有着强大的算力支撑以及高效的运算架构,为诸多前沿算法的落地应用提供了绝佳土壤。适配 YOLOv8 与华为昇腾平台,不仅极具技术挑战,更是有着重大意义。适配工作需要深入挖掘 YOLOv8 的源代码架构,精准剖析每一个模块、每一行关键代码,从数据加载、模型构建,到推理计算、后处理等诸多环节,都要依据华为昇腾的硬件特性、指令集规范进行细致入微的调整与优化;与此同时,适配的模型也不能马虎,要结合昇腾独有的 AI Core 架构,对 YOLOv8 原本的模型权重进行适配性转化,充分挖掘昇腾在并行计算、张量加速等方面的优势,让经过适配后的模型在昇腾硬件上得以高效运行,全方位释放其强大性能,大幅提升目标检测效率,从而为安防监控、自动驾驶、工业质检等众多依赖目标检测技术的领域,
pt转昇腾 om格式:
pt2om2.py
包括推理代码:
yolov8_om_infer.py
转场分割代码封装源代码
本算法根据TransNetV2-SBD 做了代码封装,可以直接用来进行转场判断,也支持直接把mp4视频根据转场分割
平台是基于TensorFlow的,执行入口transnetv2_demo.py
TensorFlow gpu和cpu都支持:
tensorflow 2.12.0
tensorflow-estimator 2.12.0
tensorflow-gpu 2.8.0
tensorflow-intel 2.12.0
tensorflow-io-gcs-filesystem 0.31.0
termcolor 2.3.0
opencv 中文 字体库
opencv 中文 字体库
自研人脸关键点,轻量级高精度人脸关键点
自研人脸关键点,轻量级高精度人脸关键点98个点,模型大小700多kb
低头,抬头,侧脸,都可准确识别,
可以转ncnn,mnn在手机上cpu到3毫秒以内
带人脸跟踪算法;
包含训练代码:
train_lbg_box_new.py
推理代码
demo_v5_face.py
人脸检测、人脸关键点综合示例代码;
demo_v5_nopad_last.py
yolov5 face onnx转ncnn代码:
Peppa-Facial-Landmark-kuoda\deploy\onnx_2_ncnn_yolov5.py
人脸关键点onnx转ncnn:
onnx_2_ncnn_mark.py
yolov10最新源码版,训练支持labelme标注
yolov10最新源码版,原版只支持标注格式为txt格式,笔者以前训练yolo用labelme的json格式标注,统一格式,数据管理,可视化,查badcase更方便。
修改了数据格式,增加支持labelmejson独立格式标注
标注样例:
{
"version": "5.3.1",
"flags": {},
"shapes": [
{
"label": "dao",
"points": [
[
1990.9259259259259,
322.3395061728395
],
[
53.75,
689.5000000000001
]
预测发现还是会有重叠框,加上nms过滤重叠框,效果会更好
本预测代码已经加上nms机制
pyqt opengl 3d渲染源码 正交投影,透视投影
pyqt opengl 3d渲染源码
支持格式,3d画线,立方体(也可以进行扩展二次开发),可以旋转,平移,缩放
支持鼠标点选提示,鼠标和立方体交点3d坐标,
代码经过反复优化,测试,效果比较稳定。
最新代码:
widget_opengl_change1.py
通过圆柱组合形成立方体,支持正交投影,透视投影无缝切换,
左下角显示3d坐标。
其他代码也有学习和参考价值
rk3588 麒麟系统硬解码 硬编码源代码
rk3588 麒麟系统硬解码h264 硬编码264源代码
qt c++ 项目, 亲测成功
项目带有librockchip-mpp安装文件,
librockchip-mpp-dev_1.5.0-1rk4_arm64.deb
安装rockchip-mpp deb
sudo dpkg -i librockchip-mpp-dev_1.5.0-1rk4_arm64.deb
使用终端命令和apt工具:打开终端,使用以下命令安装deb文件并解决依赖关系:
sudo apt install ./librockchip-mpp-dev_1.5.0-1rk4_arm64.deb
需要提前安装ffmpeg库,main.cpp中有回调函数,mpp_decoder_frame_callback,用来接收解码后的frame,
经过测试,效率挺高的,可以达到30帧以内。
qt c++ http-server 多线程源代码
qt c++ 实现 http_server 在子线程启动,收到消息后,更新主线程的ui显示,不卡顿
本人亲测成功,希望给大家提供便利。
跨平台的,Windows,linux,arm,麒麟系统都能用
网络流量异常检测系统源代码
网络流量异常检测系统
基于Network-anomaly-detection-with-deep-learning-along-with-UI 做的改进
改进1
抓包工具更新 Npcap下载:
https://npcap.com/#download
改进2,原来代码用了多线程,在Windows系统运行会导致死机,本次针对死机做了改进
改进2,源代码对pandas 的dataframe操作导致频繁报警,改进之后频繁报警没有了。
麒麟3588系统语音播报源代码
麒麟3588系统语音播报源代码
麒麟arm系统qt c++文本生成播报系统源代码
可以定制播报人性别,多款播报人可供选择,支持中英文,c++ qt示例源代码,亲测成功。
QListWidget 自定义样式,解决QPixmap不能读取图片的问题。
qt c++ sqlite 封装
qt c++ sqlite 封装
自研扩散模型高光谱修复网络
自研扩散模型高光谱修复网络
基于MST_Plus_Plus 网络改造。
试验数据
扩散模型loss初步测试降到了0.005,比不加扩散loss小了20倍,
训练入口
train_cos_img.py
bvh最新播放器 python源代码
bvh最新播放器
可以显示骨骼名称,旋转角度,自适应大小,支持3维npz数据可视化
python实现,提供源代码,修改和完善很方便。
根据3维npz生成bvh
bvh最新播放器 python源代码
详细介绍:
https://blog.youkuaiyun.com/jacke121/article/details/138809268
opengl 安装包下载;
支持python3.9 3.10
https://download.youkuaiyun.com/download/jacke121/88840304
rknn 麒麟系统adb驱动安装
rknn 麒麟系统adb驱动安装
BIWI vocaset模板
BIWI vocaset模板
包括FLAME_sample.ply
FLAME_masks.pkl
BIWI/templates.pkl
BIWI/F1.obj
BIWI.ply
rknn yolov5 rtsp
rknn yolov5的官方网站
https://github.com/airockchip/rknn-toolkit2
里面有rk3588 yolov5的推理示例程序,也包括Android推理实例程序,但是Android平台不支持rstp实时推理
本项目用ffmpeg拉流,mpp硬解码,然后rknn yolov5推理跑通,
调用代码在MainActivity,识别结果mpp硬编码保存为264视频文件。
本项目也支持264裸流视频文件推理。
问财选股导出excel pythony源代码
python问财选股导出excel功能开发,导出csv格式,带界面,也可以基于这个做二次开发或者改进
依赖项pandas,pyqt5
自研lstm多目标跟踪,DanceTrack验证集精度98%
多目标跟踪这几年一直是算法难题,用过传统跟踪算法,fairmot、bytetrack,效果不是特别理想,自己思考研究了一种基于lstm和多头注意力机制的多目标跟踪算法,支持gru,tcn,TimeSeriesTransformer,lstm和多头注意力机制效果最好,在DanceTrack数据集验证集精度99%,其他算法精度也在98以上, 1060显卡每帧平均推理速度2ms。
本算法是多目标跟踪算法,算法不含检测,检测算法可以用任意检测算法对接。
生成训练数据:
get_track_data_new.py
可视化数据标签:
data/view_track.py
训练入口:
train_cos_lstm.py
可视化测试入口:
demo_track.py
测试准确率:
demo_track_cls.py
本算法算是在多目标跟踪算法的一种思考,抛转引玉,欢迎有志之士一起交流分享。
强大好用的人体关键点标注工具
之前想研发一款好的人体关键点识别算法,发现网上竟然没有一款好用的人体关键点标注工具,labelme标注时各个关节点是断开的,不能联动,然后自己就开发了一款人体关键点标注工具,关节点直接可以联动,还有关节点放大特效,方便标注。
实际效果演示网址:
https://www.bilibili.com/video/BV18A4m1G73y/?vd_source=2cd2b3646627adc5dc5f2bf8b7fac8fd
https://blog.youkuaiyun.com/jacke121/article/details/135849963
pyopengl windows x64 whl安装包
pyopengl windows x64 whl安装包
本资源提供了python3.9和3.10版本,x64位安装包。
官方的下载地址已经失效
http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyopengl
mmpose 预测转json标注
mmpose 预测的2d点转成json文件,方便labelme标注
背景:mmpose或者其他2d关键点,bad case标注是个难题,这个脚本可以把mmpose预测的关键点,转为json文件,方便进行二次标注或修改。
3d-nms cuda代码
3d_nms c++代码和 cuda cu代码,win11编译成功,linux也可以用
python setup.py build
python setup.py install
MobileViT v3 pytorch代码
MobileViT v3 pytorch代码,几乎都不能加载官方的预训练模型,本人经过调整修改,
可以加载官方预训练模型,原创不易,希望多多支持
OpenPCDet ingroup-inds库 windows编译
OpenPCDet ingroup_inds库 windows编译
原版是linux代码,在Windows上编译失败,本人经过修改,可以编译成功。
Ultra-Fast-Lane-Detection-v2 pytorch版
Ultra-Fast-Lane-Detection-v2 pytorch版
Ultra-Fast-Lane-Detection-v2官方原版数据加载用的nvidia.dali.pipeline
Windows没有nvidia库,所以无法训练,数据增强也不方便,特地实现了pytorch的dataset版,可以训练,推理预测
训练收敛更快
可以在这个基础上改进,很方便。
insightface/alignment 人脸关键点的pytorch版本
landmark 106个点,很强大的算法,算法介绍;
https://blog.youkuaiyun.com/jacke121/article/details/116605765
模型4.8m,
gpu测试13ms左右,分辨率192*192
入口代码:
demo_v5_face.py
学习研究比较合适
yolov5 face onnx推理代码
yolov5 face onnx推理,支持原版yolov5 face 导出的onnx,亲测成功
支持yolov5 face m模型,也支持yolov5 blazeface 。
yolov7 分割 tensorrt 推理源代码
yolov7 mask分割 tensorrt 推理源代码,网上没有人实现,和大佬一起熬了好几个通宵研发出来,支持tensorrt8,win10平台,亲测成功,可运行
linux也支持,可自行跨平台适配。
labelme-5.1.1
labelme-5.1.1,设置了自动保存,标签不保存图片,自定义标签颜色,亲测成功,
博客地址:
https://blog.youkuaiyun.com/jacke121/article/details/112288397
3DDFA-V2.5-opencv-yolov5face
3DDFA_V2.5原本人脸检测器是facebox,
facebox在脸部超过一半被遮挡时效果较差,
人脸检测器换成yolov5-face,yolov5-face在脸遮挡超过一半时关键点不太准确。
图片处理是imageio,换成opencv。
demo_cam_v5face.py
yolov5-face 依赖项:
models,加载模型用
yolov5_face,人脸检测器。
yolov7训练 json标注格式代码
yolov7训练只支持txt格式,自己添加了json标注格式解析和支持。
yolov7_mask_ncnn win10版
yolov7 mask ncnn c++ win10版,亲测成功。
tensorrt c++ 推理项目
tensorrt c++ 推理示例项目,支持分类网络,比如alexnet,mobileone,skipnet等轻量级网络。
环境:win10 vs2017环境,cuda11.0,亲测成功。
tensorrt库版本:
TensorRT-8.2.1.8.Windows10.x86_64.cuda-11.4.cudnn8.2
转换流程:pytorch转onnx,onnx转tensorrt引擎
python生成tensorrt引擎步骤,可以查看我的博客:
https://blog.youkuaiyun.com/jacke121/article/details/125382721
yolov5 openvino2022版本
yolov5 openvino 2022版本,win10系统vs2019,摄像头实时预览版本,亲测调试成功,特此给广大学友们分享