
大模型
文章平均质量分 74
多喝开水少熬夜
这个作者很懒,什么都没留下…
展开
-
Position Embedding Transformation for Multi-View 3D Object Detection PETR模型训练过程
环境:Linux, Python=3.6.8, CUDA = 11.1, pytorch = 1.9.0, mmdet3d = 0.17.1。下载nuScenes数据集:需注册并下载nuScenes数据集,放置到data/nuscenes目录,我用的是mini进行测试。修改config文件的data路径,例如:·data_root = ‘xxxx/PETR/data/nuscenes/’·可以下载官方训练好的权重选择正确的config文件进行推理:epoch_24.pth。的时候有什么库没安装上就用。原创 2025-03-06 22:41:17 · 291 阅读 · 0 评论 -
CO-DETR追踪损失函数情况
参考之前的博客,记录co-detr训练推理过程将自己的数据集转化为coco格式便于CO-DETR训练,现在因为训练后AP不高,需要找到loss函数,保存最好的pth文件,还可以做出loss函数和epoch的图像,观察loss函数是不是在稳定下降还是说波动比较剧烈。提示:以下是本篇文章正文内容,下面案例可供参考。原创 2024-09-29 17:13:32 · 515 阅读 · 0 评论 -
将自己的数据集转化为coco格式便于CO-DETR训练
参考上篇博客,记录co-detr训练推理过程,现在需要用其他的数据集进行训练,先要研究当前数据集的json文件格式,提取出这些内容进行填充"id": 1,},],"id": 246,],"bbox": [0,0,3840,],},],"id": 1,}]原创 2024-09-29 16:43:35 · 545 阅读 · 0 评论 -
CO-DETR利用coco数据集训练和推理过程
环境:PyTorch 1.11.0 Python 3.8(ubuntu20.04) Cuda 11.3先是在github上下载CO-DETR模型!然后加载所需库!安装mmcv等(注意mmcv应该是1.6.1版本及以上)!!!因为出现了mmdetection 报错 TypeError: FormatCode() got an unexpected keyword argument ‘verify‘问题,用一下方案解决: yapf版本过高,目前版本为 0.40.2,重装低版本yapf即可!!原创 2024-06-28 19:59:53 · 3739 阅读 · 7 评论 -
ChatGLM3-6B和langchain知识库阿里云部署
看了几天chatglm和langchain的部署,经过不断报错,终于试出了可以运行的方案,不过本地知识库搭建还有问题,要再看看。本文主要介绍ChatGLM3-6B的部署和实现效果,和Chatglm2-6b+langchain结合的实现效果。提示:以下是本篇文章正文内容,下面案例可供参考。原创 2023-12-10 14:34:01 · 7433 阅读 · 18 评论 -
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks - 翻译学习
大型预训练语言模型已被证明可以在其参数中存储事实知识,并在对下游NLP任务进行微调时获得最先进的结果。然而,他们访问和精确操作知识的能力仍然有限,因此在知识密集型任务中,他们的性能落后于特定任务的体系结构。此外,为他们的决定提供出处和更新他们的世界知识仍然是悬而未决的研究问题。具有对显式非参数记忆的可微访问机制的预训练模型可以克服这个问题,但迄今为止只针对提取下游任务进行了研究。微调方法——该模型结合了预先训练的参数和非参数记忆,用于语言生成。原创 2023-11-11 17:59:20 · 1915 阅读 · 0 评论 -
Benchmarking Large Language Models in Retrieval-Augmented Generation-学习翻译
检索增强生成(RAG)是一种很有前途的减轻大型语言模型(LLM)幻觉的方法。然而,现有的研究缺乏对检索增强生成对不同大型语言模型的影响的严格评估,这使得识别不同LLM的RAG能力的潜在瓶颈具有挑战性。在本文中,我们系统地研究了**检索增强生成对大型语言模型的影响**。我们分析了不同大型语言模型在RAG所需的4种基本能力方面的性能,包括**噪声鲁棒性、负抑制、信息集成和反事实鲁棒性**。为此,我们建立了检索增强生成基准(Retrieval-Augmented Genera-tion Benchmark RG原创 2023-11-08 21:29:58 · 1836 阅读 · 0 评论 -
A Survey on Retrieval-Augmented Text Generation翻译
近年来,检索增强文本生成引起了计算语言学界越来越多的关注。与传统的生成模型相比,检索增强文本生成具有显著的优势,尤其是在许多NLP任务中取得了最先进的性能。本文旨在对检索增强文本生成进行一项调查。**它首先强调了检索增强生成的一般范式,然后根据不同的任务,包括对话响应生成、机器翻译和其他生成任务**,回顾了值得注意的方法。最后,在总结现有方法的基础上,提出了一些有前景的研究方向,以利于今后的研究。原创 2023-11-05 22:53:21 · 242 阅读 · 0 评论