- 博客(8)
- 收藏
- 关注
原创 二、在线量化算法QAT
PTQ离线量化算法,是训练后进行的量化算法,不依赖源代码,只需要少量的无标签数据就可以完成QAT在线量化算法是依赖训练的量化算法,需要对源代码进行修改再进行训练。可以直接从头训练,也可以预训练的模型上进行finetune微调。
2025-11-03 00:07:18
368
原创 AutoDL配置Tensorrt环境踩坑记录(pycuda安装失败、pylance崩溃、python中tensorrt包无自动补全和提示)
时隔很长时间再次tensorrt配置环境,基本上可以被同样的问题绊倒两次,所以养成好习惯,记录下来最好(wsl内搞镜像各种问题所以也没有配置一个好的镜像文件)想在AutoDL上部署Tensorrt环境,选择好环境,pytorch或者tensorrt的都可以pytorch 2.1.2 tensorrt 8.6.1 cuda11.8,只是选一个基础环境。进入之后先使用 nvcc -V测试cuda是否正常安装,一般是好的,没有的话可以直接换一个基础环境。
2025-10-28 22:50:34
253
原创 一、量化算法随笔心得(PTQ)
摘要:量化通过降低模型精度(如FP32到int8)优化性能,减少显存占用4倍并提升计算速度,适用于边缘设备、隐私保护和功耗优化。量化面临精度损失、数据分布异常等挑战,分对称/非对称、静态/动态等类型。PTQ流程包括校准数据选择、量化模式确定等步骤,算法涵盖minmax、KL散度等。当PTQ精度不足时,需采用量化感知训练(QAT)进行微调,但成本较高。量化技术平衡速度、精度与资源,是模型部署的关键环节。
2025-10-20 00:08:38
287
原创 使用线程的场景 - 线程并发安全的产生原因以及解决方法
1、多任务模式一个会议软件进程中可以视频,可以打字,可以画图。2、同时处理多个相同的任务当一个线程顺序执行多次轮寻画图的任务,每次轮训需要执行画图的任务越多,耗时越长。开启多线程后,单个线程只运行某一部分,这样多个线程同时开工就会快。3、流水线模式完成一个完整的任务链,单个线程只负责一部分任务。任务A完成,才能完成任务B,任务B完成才能执行任务C。总结起来就是多任务(不管相同还是不同)、流水线。如果考虑并发安全的问题,那么就要在平衡资源了,毕竟加锁也会有所消耗。.........
2022-07-25 21:39:31
257
原创 java中的list: ArrayList、LinkedList 以及简单实现LinkedList
ArrayList是基于动态数组实现的,在初始容量不够的时候会扩展位为原容量的1.5倍。所有数据都是按顺序存储在内存中。所以查找操作的时间复杂度为O(1),正常插入的时间复杂度为O(1),当需要进行扩容的时候时间复杂度变为O(N)。插入,删除的时间复杂度都为O(N)...
2022-07-24 14:19:55
428
原创 Java 中的HashMap(默认大小、扩容机制、哈希算法)
哈希表是一个散列表,存储着Key-Value键值对,插入和查找的复杂度均为O(1)。java中在创建哈希表时会创建一个默认大小的数组。插入一个键值对时,利用一个哈希算法确定key存储在数组的哪个位置,这时可能会出现哈希冲突问题,即不同key生成同样的hashcode。此时利用链地址法,将每个位置创建一个链表来解决该问题,可将键值对插入到链表尾部,当链表长度大于8时转化为红黑树,当长度小与6时会将红黑树转化为链表。在java中当实际负载因子大于默认的负载因子(0.75)时会触发扩容机制,变为原来的两倍。
2022-07-24 12:57:21
1271
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅