
日常踩坑记录
文章平均质量分 52
记录一下日常学习工作中遇到的报错以及解决办法。
J心流
github:https://github.com/xinliu9451
邮箱:xinliu94561@gmail.com
展开
-
celery进程卡死解决办法
今天在用celery做消息队列管理的时候出现了进程卡死的现象,具体表现为 celery 的 inference_task 函数接收到app 传来的请求,inference_task 在执行的时候直接卡在 model_pipeline 的地方不动了。另外,如果直接在 tasks.py 中加载模型,那么 app.py 引用 tasks.py 的时候也会导致重复加载,所以目前的办法就是 tasks.py 从其他脚本中导入加载好的模型,然后再延迟导入。原创 2025-03-19 13:43:03 · 233 阅读 · 0 评论 -
安装tensorrt_llm踩坑总结
这些警告信息表明在编译或链接过程中找不到某些共享库 (libopen-rte.so.40, libopen-pal.so.40, libm.so.6, libhwloc.so.15)。这些库是 OpenMPI(用于并行计算的消息传递接口)的依赖库。其实系统中是有这些文件的,只不过没有在指定的路径下,所以只需要找到这些文件,然后重新指定一下这些文件的路径。除了文件找不到,各种库的版本适配也是个大问题,因为这个框架一直在迭代,还不是很稳定,建议安装tensorrt_llm。原创 2024-07-26 15:07:25 · 2405 阅读 · 2 评论 -
Some tensors share memory, this will lead to duplicate memory on disk
报错的代码,在执行完这行代码后的到的 supported_classes 为 (PreTrainedModel,) ,这时保存checkpoint的逻辑又要经过多次判断才能保存,所以就出错了。报错发生在 trainer 保存 checkpoint 的时候,从源码来看,trainer 在保存 checkpoint 的时候会经过一系列的判断,然后选择合适的方法来保存。这种方法仅是为了解决问题而提出的,感觉走的是歪路,但是经过验证保存的 checkpoint 是正常可用的。此外,这种方法不一定能适用各种场景。原创 2024-07-20 12:48:54 · 836 阅读 · 0 评论 -
Couldn‘t apply path mapping to the remote file. /home/anaconda/envs/whisper/lib/python3.10/
点击Path mappings右边的文件夹,点击左上方的加号,然后手动输入本地路径和远程路径,点击完成,问题解决。今天试着远程调试代码,配置好路径之后还是遇到了如题的报错,然后一顿鼓捣,最后通过以下方法解决问题。1、点击Edit Configurations。原创 2023-12-05 11:05:52 · 1364 阅读 · 0 评论 -
whl is not a supported wheel on this platform报错处理
安装pytorch的时候一直报错whl is not a supported wheel on this platform,搞了很久一直没有解决,后来发现是自己安装的anaconda是32位的,真的是绝望,耽误事啊!一个小错,始终没有发现,记录下来,希望能帮到和我一样的人。原创 2023-10-12 23:44:15 · 5736 阅读 · 0 评论 -
条件debug的设置
以上就是全部的内容了,常见的注意点也提了一嘴,希望能帮到像我一样的小白。原创 2023-04-10 10:06:46 · 485 阅读 · 0 评论 -
服务器中下载特定版本的安装包
以上方法虽然能在低版本python下安装高版本的安装包,但是因为python版本较低的原因还是会出现报错,比如依赖包里需要的某些函数可能会缺失。以上就是全部内容了,虽然是比较笨的方法,但也是自己慢慢摸索出来的,记录下来作为小白成长日记的一部分。原创 2023-04-07 09:36:21 · 466 阅读 · 1 评论