大模型
文章平均质量分 90
atwdy
大数据开发、数据挖掘。
https://leetcode.cn/u/atwdy/
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于embedding进行语义相似度检索全流程实践
本次测试目标为跑通基于embedding的文本语义匹配的基本流程,测试流程主要分为:=> 1)通过预训练模型生成embedding=> 2)保存embedding到文件=> 3)基于embedding文件构建faiss索引并持久化保存=> 4)加载faiss索引进行语义化检索匹配。原创 2025-04-03 19:05:34 · 1307 阅读 · 0 评论 -
基于Qwen2.5-7B-Instruct进行LoRA微调推理全流程探索
ms-swift是一个针对大模型微调的高层封装框架,旨在简化训练流程、统一接口并集成多种微调技术,如 LoRA、QLoRA、Prefix Tuning等。通过ms-swift实现LoRA微调,仅需配置参数,无需关心底层实现。使用ms-swift,通过lora方式微调下载的基座模型,产出微调的权重文件。使用下载的基座模型,先测试一下推理效果作为合并LoRA后推理效果的对照,参考。本次测试目的为跑通模型部署,微调及推理全流程,首先下载模型到本地,参考。圈起来的就是最终的微调结果,在推理时加载改结果就可以了。原创 2025-03-27 20:50:06 · 1672 阅读 · 0 评论 -
基于阿里云调用deepseek大模型
每个模型的详细信息中会有API示例(),需要做的就是申请自己的API key就行了,过程中可能需要。。原创 2025-02-18 18:12:15 · 1292 阅读 · 0 评论
分享