
大模型
永远的HelloWorld
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
知识评估基准(打榜)和Dify平台
知识评估基准(打榜)和Dify平台原创 2024-08-19 22:44:53 · 191 阅读 · 0 评论 -
LangChain、LangServe、LangSmith 和 LangGraph区分
LangChain 提供了一种模块化的方法来组合不同的组件,如提示工程、文档检索、API 调用等,以创建复杂的自然语言处理应用。LangSmith 是一个用于测试、评估和监控语言模型的平台。LangGraph 是一种技术栈或框架,用于构建和查询基于图的语言处理应用。LangChain、LangServe、LangSmith 和 LangGraph 分别代表了不同的概念和技术,它们在自然语言处理(NLP)和人工智能领域各有侧重。LangServe 可能是指一种服务或框架,用于部署语言模型的API接口。原创 2024-08-18 20:15:48 · 1464 阅读 · 0 评论 -
transformer中的两种架构
transformer中的两种架构原创 2024-08-18 17:03:10 · 430 阅读 · 0 评论 -
模型的微调考虑
模型的微调考虑原创 2024-08-18 16:31:43 · 260 阅读 · 0 评论 -
提示词工程
1.需求分析,采用5w2h的法则,what(是什么),who(谁),why(为什么),when(何时),where(在哪里),how(怎么做),how much(需要多少成本)当前角色按照什么的步骤与用户进行交互,并如何按照顺序完成明确的任务。和用户的开场白,或者强调需要按照上述的哪些元素开始执行提示词。背景信息,与问题相关的事实、情境描述、问题的背景等信息。Description:基本描述。# Profile:基本信息。# Role:角色定义。Language:语言。Version:版本。原创 2024-08-05 22:22:39 · 489 阅读 · 0 评论 -
知识库、微调、AI Agent
Agent执行工作的过程是需要大模型来配合的,大模型充当一个大脑,给Agent下达指令。Agent当接收到这个指令的时候,然后去执行。大模型参数的数量直接影响大模型的生成能力和推理能力,也直接影响了大模型的使用效果。参数越多,模型的存储和学习能力也就越强。提示词起到清洗和筛选的作用,大模型可以更直接更确定的命中我们需要的内容。原创 2024-08-04 23:19:47 · 505 阅读 · 0 评论 -
RAG(检索增强生成)
RAG技术结合了大型语言模型的强大生成能力和检索系统的准确性。它允许模型在生成文本时,从外部知识库中检索相关信息,从而提高生成内容的准确性、相关性和时效性。这种方法不仅增强了模型的回答能力,还减少了生成错误信息的风险。原创 2024-05-01 14:20:15 · 400 阅读 · 0 评论 -
yolo系列(之一)
堆叠小的卷积核所需的参数更少一些,并且卷积过程越多,特征提取也会越细,加入的非线性变换也随着增多,还不会增大权重参数个数,这就是VGG网络的基本出发点,用小的卷积核来完成体特征提取操作。(2)IOU :真实值和预测值之间的关系。two-stage (两阶段) : Faster-rcnn Mask-Rcnn系列 (输入图像---》CNN特征---》预选框---》输出结果)two-stage的特点:(1)速度通常慢(5FPS),但是效果通常是不错的(2)非常实用的通用框架Mask-Rcnn。原创 2024-04-14 21:58:08 · 281 阅读 · 0 评论 -
LangChain的总结和项目中知识分片的总结
LangChain的总结和项目中知识分片的总结原创 2024-02-20 18:23:55 · 568 阅读 · 0 评论 -
大模型相关(CPU与GPU和模型的蒸馏)
大模型相关(模型的蒸馏和GPU、CPU)原创 2024-02-20 18:21:05 · 772 阅读 · 0 评论 -
RAG和Embedding
RAG和Embedding原创 2024-02-19 21:18:54 · 564 阅读 · 0 评论 -
AI大模型中的Bert
AI大模型中的Bert原创 2024-01-21 16:12:32 · 1200 阅读 · 0 评论 -
AI大模型中的编码和解码
AI大模型中的编码和解码原创 2024-01-21 14:38:02 · 1104 阅读 · 0 评论 -
AI 大模型
AI 大模型原创 2024-01-21 14:23:27 · 420 阅读 · 0 评论 -
大模型微调产生的原因
大模型微调产生的原因原创 2024-01-21 10:56:38 · 577 阅读 · 0 评论 -
大模型的4种技术架构
大模型的4种技术架构原创 2024-01-20 10:24:47 · 1471 阅读 · 0 评论 -
Instruction-Tuning 与 Prompt-Tuning
Instruction-Tuning 与 与 Prompt-Tuning原创 2023-12-29 18:53:39 · 1229 阅读 · 0 评论 -
大模型中的Chat Completion模型和参数
大模型中的Chat Completion模型和参数原创 2023-12-26 21:11:18 · 1556 阅读 · 0 评论 -
GPU的并行方式
每个GPU都加载模型参数,被称为“工作节点(workers)”,为每个GPU分配分配不同的 数据子集同时进行处理,分别求解梯度,然后求解所有节点的平均梯度,每个节点各自 进行反向传播。矩阵乘法可以看作是若干对行和列的点积:可以在不同的 GPU 上计算独立的点积,也可 以在不同的 GPU 上计算每个点积的一部分,然后相加得到结果。无论采用哪种策略,都可以将权重矩阵切分为大小均匀的“shards”,不同的GPU负责 不同的部分,要得到完整矩阵的结果,需要进行通信将不同部分的结果进行整合。原创 2023-12-25 15:45:53 · 800 阅读 · 0 评论 -
大模型开发之CUDA
大模型开发之CUDA原创 2023-12-25 14:13:42 · 637 阅读 · 0 评论 -
Pytorch项目肺癌检测项目之七 (总结)
Pytorch项目肺癌检测项目之七 (总结)原创 2023-12-25 10:55:10 · 1152 阅读 · 1 评论 -
Pytorch项目(结节分割),肺癌检测项目之六
Pytorch项目(结节分割),肺癌检测项目之六原创 2023-12-24 20:26:57 · 900 阅读 · 0 评论 -
Pytorch项目(模型训练与优化),肺癌检测项目之六
Pytorch项目(模型训练与优化),肺癌检测项目之六原创 2023-12-24 12:39:26 · 470 阅读 · 0 评论 -
Pytorch项目(模型训练与优化),肺癌检测项目之五
Pytorch项目(模型训练与优化),肺癌检测项目之五原创 2023-12-24 09:49:36 · 441 阅读 · 0 评论 -
Pytorch项目,肺癌检测项目之四
Pytorch项目,肺癌检测项目之四原创 2023-12-23 17:12:58 · 948 阅读 · 0 评论 -
Pytorch项目,肺癌检测项目之三
Pytorch项目,肺癌检测项目之三原创 2023-12-23 13:21:40 · 940 阅读 · 0 评论 -
Pytorch项目,肺癌检测项目之二
Pytorch项目,肺癌检测项目之二原创 2023-12-23 09:05:49 · 914 阅读 · 0 评论 -
Pytorch项目,肺癌检测项目之一
Pytorch项目,肺癌检测项目原创 2023-12-21 07:41:04 · 562 阅读 · 0 评论 -
PyTorch自动梯度计算(注意点)
PyTorch自动梯度计算(注意点)原创 2023-12-17 21:49:47 · 740 阅读 · 0 评论