- 博客(154)
- 资源 (3)
- 收藏
- 关注
原创 【代码详解】大模型微调入门:SFT Qwen2-7B,基于 Hugging Face Transformers库
【代码详解】大模型微调入门:SFT Qwen2-7B,基于 Hugging Face Transformers库
2024-09-04 18:22:59
4438
原创 解决 kill -9 PID 无法杀死 python 进程的问题:杀死 defunct 进程
解决 kill -9 PID 无法杀死 python 进程的问题:杀死 defunct 进程
2024-08-20 12:06:34
1009
原创 Chain of Thought (CoT) 系列论文:大模型思维链,提升 LLM 的推理能力
Chain of Thought (CoT) 系列论文:大模型思维链,提升 LLM 的推理能力
2024-08-18 01:08:25
1870
原创 Outlines:用于指令生成和格式化输出的大模型 LLM Python 库
Outlines:用于指令生成和格式化输出的大模型 LLM Python 库
2024-08-13 17:51:09
1567
原创 Python str.format() 函数在 LLM prompt 生成中的使用(微调、刷库等)
Python str.format() 函数在 LLM prompt 生成中的使用
2024-08-06 17:55:22
238
原创 LLM推理入门实践:基于 Hugging Face Transformers 和 vLLM
LLM推理入门实践:基于 Hugging Face Transformers 和 Qwen2模型 进行文本问答
2024-08-05 19:58:52
3151
原创 Shell 踩坑:直接在 Shell 中直接执行 python 脚本需要使用 python -c 命令
直接在 Shell 中直接执行 python 脚本需要使用 python -c 命令
2024-07-30 17:15:44
634
原创 Shell 踩坑:Shell 脚本中激活 conda 环境,在命令行中是看不到的。
Shell 脚本中激活 conda 环境,在命令行中是看不到的。
2024-07-30 16:56:47
518
原创 为什么Linux系统重启后激活anaconda需要执行 “source anaconda3/bin/activate” 命令?
Linux系统重启后激活anaconda需要执行 “source anaconda3/bin/activate” 命令
2024-07-29 15:45:39
691
原创 Pytorch DataLoader 提高模型训练时的 Volatile Gpu-Util(GPU利用率)
Pytorch DataLoader 函数,提高模型训练时的 GPU利用率 Volatile Gpu-Util
2024-03-19 15:37:20
2666
原创 模型评估指标详解:ROC 曲线和 AUC 的计算方法
机器学习模型评估指标详解:ROC 曲线和 AUC 的计算方法,AUC 的物理意义,根据物理意义计算 AUC
2024-01-21 14:09:27
8670
原创 PP-OCR 论文解读:百度 PaddleOCR 通用中英文 3.5M 超轻量 OCR 模型
Paddle OCR 论文《PP-OCR: A Practical Ultra Lightweight OCR System》
2024-01-03 10:14:25
3173
原创 安装 labelme 报错:urllib3 v2.0 only supports OpenSSL 1.1.1+, currently the ‘ssl‘ module is OpenSSL 1.1.0
安装 labelme 报错:ImportError: urllib3 v2.0 only supports OpenSSL 1.1.1+, currently the 'ssl' module is compiled with 'OpenSSL 1.1.0i 14 Aug 2018'. See: https://github.com/urllib3/urllib3/issues/2168
2023-11-29 19:57:06
1062
原创 Dif-Fusion:第一个基于扩散模型实现的红外光与可见光图像融合的论文
第一个基于扩散模型实现的红外光与可见光图像融合的论文。Dif-Fusion: Towards High Color Fidelity in Infrared and Visible Image Fusion with Diffusion Models
2023-11-14 14:47:24
3566
8
原创 FusionDiff:第一个基于扩散模型实现的多聚焦图像融合的论文
FusionDiff:第一个基于扩散模型实现的多聚焦图像融合的论文。FusionDiff: Multi-focus image fusion using denoising diffusion probabilistic models
2023-11-14 10:29:36
3222
13
原创 深度学习中的数据类型介绍:FP32, FP16, TF32, BF16, Int16, Int8 ...
深度学习中的数据类型介绍:FP32, FP16, TF32, BF16, Int16, Int8 ...
2023-11-06 11:01:57
25321
2
原创 【目标跟踪】ECO算法论文阅读:ECO: Efficient Convolution Operators for Tracking
这里所指的训练集是指保存了每一帧的跟踪结果的训练集,也就是说,每一次进行model update的时候,要用在这一帧之前所有跟踪到的样本。那么随着视频越来越长,这个训练集就会越来越大。因为当目标被遮挡或者丢失的时候,比较新的这些样本本身就是错的,那么模型很容易有model drift,就是被背景或者错误的目标污染,导致跟踪结果出错。如下图所示,Baseline是传统的训练集,每更新一帧就加一个进来,那么连续的数帧后训练集里面的样本都是高度相似的,即容易遗忘前面的样本,且容易对最近的若干帧样本过拟合。
2023-10-25 14:36:48
1659
1
原创 【AutoML--模型搜索】论文阅读:Once-for-All: Train One Network and Specialize it for Efficient Deployment
论文阅读笔记:Once-for-All: Train One Network and Specialize it for Efficient Deployment
2023-09-05 18:28:29
216
原创 AIGC书籍推荐:《生成式深度学习的数学原理》
AIGC书籍推荐:《生成式深度学习的数学原理》。本书对当前主流的三大深度生成模型(变分自编码器 VAE,生成对抗网络 GAN,扩散模型 Diffusion Models)的数学原理进行了详细推导,旨在帮助读者从原理上深入理解它们。
2023-07-25 14:39:55
1799
原创 Python bisect库的用法:用于有序序列的插入和非逆序系列的二分查找
Python bisect库的用法:用于有序序列的插入和非逆序系列的二分查找
2023-07-09 20:29:28
1142
1
原创 【PyTorch API】 nn.RNN 和 nn.LSTM 介绍和代码详解
PyTorch API 之 nn.RNN 和 nn.LSTM 介绍和代码详解
2023-07-06 15:09:21
6256
原创 C++ 使用一维数组和二维数组给 std::vector<cv::Point2d> 赋值的方法
C++ 使用一维数组和二维数组给 std::vector 赋值的方法
2023-06-08 16:58:57
2660
原创 DPCNN:深度金字塔 CNN 文本分类网络
DPCNN(Deep Pyramid CNN),是2017年腾讯AI-Lab提出的一种用于文本分类的网络,可以称之为"深度金字塔卷积神经网络"。
2023-06-02 10:10:59
953
【CUDA编程】opencv4 + CUDA 并行图像处理:图像均值滤波和图像反色
2022-08-12
【FastDup】可以查找重复、相似、异常的图像的python库
2022-07-08
C++ Eigen库的下载配置和使用
2022-03-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人