
大模型学习
文章平均质量分 83
从零开始学习大模型
暗夜猎手-大魔王
热爱运动,喜欢跑步
展开
-
大语言模型学习--向量数据库基础知识
向量数据库。原创 2025-03-07 22:33:21 · 337 阅读 · 0 评论 -
大模型学习--微调
模型微调是一种在已有预训练模型的基础上,通过使用特定任务的数据集进行进一步训练的技术。这种方法允许模型在保持其在大规模数据集上学到的通用知识的同时,适应特定任务的细微差别。原创 2025-03-04 22:17:25 · 851 阅读 · 0 评论 -
大语言模型学习--LangChain
LangChain作为一个脚手架 能够快速集成大模型以及实现一些其他格式化功能,本质是为了能够更好的调用相关大模型API以及进行业务逻辑处理。首先要申请API-key 然后本地python调用一下。下面使用Langchain来集成阿里的通义千问。API-Key申请参考链接。LangChain官网地址。LangChain具体能力。langchain依赖关系。原创 2025-03-02 21:31:21 · 594 阅读 · 0 评论 -
大语言模型学习
训练新任务会损害原有任务性能,且在推理阶段无法记忆历史数据或场景(如自动驾驶需反复重新计算路况)23。大模型训练需消耗海量多模态数据及算力,万亿级参数规模导致资源投入呈指数级增长12。在处理需逻辑推理、数值计算的复杂问题时表现较差,尤其在多步骤推理场景中准确率显著下降23。例如20步推理后准确率可能低于36%4。大模型知识库仅覆盖训练数据截止时间点内容,无法实时更新5。训练数据隐含社会偏见可能被放大,人工标注错误易导致模型认知偏差6。通用基础大模型 行业垂直型基础大模型 业务垂直基础大模型。原创 2025-03-02 19:34:37 · 1207 阅读 · 0 评论 -
大语言模型学习--本地部署DeepSeek
本地部署一个DeepSeek大语言模型 研究学习一下。本地快速部署大模型的一个工具 先根据操作系统版本下载Ollama客户端ollama是一个开源的大型语言模型(LLM)本地化部署与管理工具,旨在简化在本地计算机上运行和管理大语言模型的流程。它支持多种主流开源模型(如Llama、Mistral、DeepSeek、Qwen等),并通过命令行工具、API接口及丰富的社区生态,为开发者、研究人员和爱好者提供了高效、灵活的本地AI应用开发环境。下载地址官网地址下载较慢 可以使用以下地址github地址。原创 2025-03-03 22:30:27 · 1969 阅读 · 0 评论 -
大模型学习路线以及资料--更新中
总结了一下大模型学习路线和基本学习资料,后续会不断更新。从零开始学习吧,不然的话很可能被这个时代抛弃。原创 2025-03-02 16:22:42 · 1038 阅读 · 0 评论