- 博客(52)
- 收藏
- 关注
原创 LangChain(二)——构建多轮对话
因此,不同线程间的对话是隔开的,同一线程的对话是能被记录的,因为上面设置状态流图的内存检查点是记忆函数。是一种与对话流和任务流设计相关的框架或工具,它被设计为一种能够管理和处理复杂任务流(Task Flow)和状态流(State Flow)的工具,通常与语言模型(如 GPT 系列)结合使用,用于构建动态多轮对话系统或复杂的流程自动化任务。来构建多轮对话时,每个对话轮次是一个节点(Node),代表需要完成的任务(例如调用大模型或调用工具链),节点可以是同步或异步的函数,任务的完成可能依赖于上一个节点的输出。
2024-12-27 12:14:52
2665
原创 Agent、AIworker和AGI的关系
区分了Agent、AI worker和AGI的关系。Agent是一个总体的、范围大的概念,AI worker是一个在特定任务上的Agent,是Agent的子集;AGI是Agent要实现的高级目标,相比于AI worker具备通用性,更强大,但依然属于Agent。
2024-12-26 09:33:50
681
原创 【大模型报错】RuntimeError: CUDA error: no kernel image is available for execution on the device
pytorch版本为2.1.2,大模型一直强调是xformer不支持,于是降低pytorch版本(其本质也是降低xformer版本)。在网上搜了很多博客,也问了chatgpt,基本可以确定是显卡版本、CUDA版本、pytorch版本有地方不兼容。之前调用大模型一直用的vllm,网上搜了下,可以确定P40显卡缺少一些算子,不支持vllm调用大模型。:将qwen大模型部署到新的服务器上,之前服务器显卡是4090,新的服务器显卡是P40。cuda版本为11.8,也不是最新的,P40是支持的。
2024-12-02 11:44:37
708
1
原创 大模型微调2——使用LLaMA-Factory微调qwen模型优化推理效果
使用LLaMA-Factory框架微调qwen大模型,介绍了LLaMA-Factory和微调流程
2024-10-12 16:47:28
2173
原创 大模型微调1——使用LoRA微调qwen模型优化推理效果
使用LoRA微调技术微调qwen大模型,优化大模型在逻辑推理上的回答效果。分析了其步骤,给出了其代码块。
2024-10-12 12:22:34
1732
原创 大模型2-初试大模型+RAG
初步将大模型与检索增强生成(RAG)技术结合起来,使用yuan和qwen两种大模型进行试验,对比添加RAG前后的结果
2024-10-08 16:13:04
1337
原创 “AutoModelForCausalLM.from_pretrained“参数说明
AutoModelForCausalLM.from_pretrained参数说明
2024-10-08 12:44:31
9190
原创 YOLOv3详解
YOLOv3在之前网络的基础上完善了主干网络;使用了三种大小的特征图进行融合,使得特征提取的细粒度更好;每个网格赋予了9个锚框,共三种尺度,有利于锚框与目标大小的吻合。YOLOv3的该进虽然很少,但却是很有效。...
2022-07-16 18:59:38
957
翻译 YOLOv3论文中英文对照翻译
我们提出了对YOLO的一些更新!我们做了一些小的设计改动,使其变得更好。我们还训练了这个新的网络,这个网络非常棒。它比上次大了一点,但更准确。不过它仍然很快,不用担心。在320×320的情况下,YOLOv3在28.2mAP的情况下运行22毫秒,与SSD一样准确,但速度快三倍。当我们看一下旧的0.5IOUmAP检测指标时,YOLOv3是相当好的。在TitanX上,它在51毫秒内实现了57.9个AP50,而RetinaNet在198毫秒内实现了57.5个AP50,性能相似但快3.8倍。...
2022-07-16 16:38:49
1676
原创 YOLOv2详解
1、YOLOv2比YOLOv1检测性能更强,速度更快,并且可以在各种图像尺寸下运行,在速度和准确性之间提供了平稳的权衡(因为小尺寸图片检测的更快)2、YOLOv2可以识别超过9000个类别。
2022-07-16 16:16:29
1361
翻译 YOLOv2论文中英文对照翻译
我们介绍了YOLO9000,一个最先进的实时目标检测系统,可以检测超过9000个目标类别。首先,我们提出了对YOLO检测方法的各种改进,这些改进既是新的,也是来自先前的工作。改进后的模型YOLOv2在标准检测任务上是最先进的,如PASCALVOC和COCO。使用一种新的、多尺度的训练方法,同一个YOLOv2模型可以在不同的规模下运行,在速度和准确性之间提供了一个简单的权衡。在67FPS时,YOLOv2在VOC2007上得到76.8mAP。......
2022-07-16 16:04:06
2504
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人