自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(793)
  • 收藏
  • 关注

原创 Qwen2.5 全链路模型体验、下载、推理、微调、部署实战!

通义千问团队开源Qwen2.5系列语言模型,包含基础版、编程专用版和数学专用版,提供从5亿到720亿参数的多种规模选择。新模型在18T tokens数据集上训练,知识储备(MMLU 85+)、编程(HumanEval 85+)和数学能力(MATH 80+)显著提升,支持128K上下文和29种语言。专业模型Qwen2.5-Coder在5.5T编程数据上训练,Qwen2.5-Math整合多种推理方法。性能测试显示,72B版本超越主流开源模型,小参数模型也展现竞争力。模型采用Apache 2.0许可证,开发者可通

2025-07-26 12:00:00 523

原创 【DeepSeek】在本地计算机上部署DeepSeek-R1大模型实战(完整版)

摘要 本文详细介绍了如何在个人计算机上本地部署DeepSeek R1大模型。作为一款2025年初发布的轻量级AI模型,DeepSeek R1突破了传统大模型对高性能硬件的依赖,仅需8GB内存和30GB磁盘空间即可运行。文章从数据隐私保护、定制化需求等角度阐述了本地部署的优势,并提供了完整的部署流程指南,包括Ollama安装、模型下载、Python环境配置等关键步骤。特别针对Windows10用户,作者验证了在普通笔记本电脑上运行该模型的可行性,强调整个过程无需专业编程知识,只需按照指导操作即可完成。通过这种

2025-07-26 11:15:00 416

原创 GPT-4o mini:AI技术的平民化革命

GPT-4o mini 是 OpenAI 推出的一款小型智能模型,它是 GPT-4o 的简化版本,具有更小的参数量和更高的性价比。这款模型在功能上非常强大,性能接近原版 GPT-4,同时成本相比 GPT-3.5 Turbo 降低了超过 60%。GPT-4o mini 支持多达 50 种不同语言,能够处理大量的上下文信息,支持文本和视觉输入输出,未来还计划扩展到图像、视频和音频的

2025-07-25 11:09:35 545

原创 OmniSteward:LLM Agent 赋能,语音文字随心控,智能家居与电脑的超级管家

OmniSteward:基于大语言模型的全能AI管家系统 OmniSteward是一款正在开发中的智能管家系统,通过大语言模型实现语音/文字交互,支持智能家居控制、电脑程序管理、在线检索等功能。系统采用Qwen2.5等AI模型,结合Flask框架和Selenium等技术构建,具备多模态交互、多轮对话和高度可扩展性。安装需Python 3.8+和Chrome浏览器,支持Windows平台,提供命令行和Web两种使用模式。该项目由ElliottZheng维护,遵循MIT开源协议,致力于打造便捷的智能生活体验。

2025-07-25 11:08:04 463

原创 【RAG检索增强生成】MaxKB:构建企业级知识库问答系统(Ollama+Qwen2)

MaxKB是一个开源AI知识库问答系统,支持文档上传、自动爬取和智能问答。文章介绍了如何基于MaxKB+Ollama+Qwen2搭建本地知识库,包括环境准备、MaxKB部署、Ollama安装、Qwen2模型运行以及知识库配置步骤。系统支持多格式文档处理,提供智能问答功能,可无缝嵌入第三方业务系统。通过Docker容器化部署,简化了安装流程,为构建企业级知识库提供了完整解决方案。

2025-07-24 10:28:42 363

原创 视频生成新纪元:震撼开源的智谱AI CogVideoX模型深度解析

智谱AI开源视频生成模型CogVideoX,基于3D Causal VAE压缩技术和专家Transformer架构,支持高效显存利用(FP-16推理仅需18GB)和720x480分辨率视频生成。其开源资源包括代码库、模型和技术报告,为创作者和企业提供从个人到商业应用的支持。该技术通过高质量数据筛选和动态光流计算优化视频质量,在教育、影视和广告领域具有广阔应用前景。部署简单,支持单显卡运行,为AI视频生成技术带来突破。

2025-07-24 10:27:26 243

原创 Dify智能体开发:RAG 技术深度解析与知识库实战指南

摘要: 检索增强生成(RAG)技术通过动态检索外部知识库与智能生成结合,解决了大模型的时效性不足和幻觉问题,显著提升回答准确性。其核心包括智能检索(语义向量匹配)、文档处理(分层分割与元数据管理)和生成优化(Prompt工程与幻觉抑制)。RAG在企业知识库、医疗问诊、法律咨询和智能客服等场景中实现90%以上的准确率提升,如金融政策查询和多轮对话优化。未来趋势包括多模态融合、自治式检索及与Agent技术结合,但需解决长上下文检索、多文档整合等挑战。

2025-07-23 13:49:12 729

原创 Deepseek-R1大模型在银行系统的微调落地方案

摘要 本项目旨在通过微调Deepseek-R1大模型提升银行系统的智能化水平,应对金融科技快速发展背景下的银行业务挑战。项目聚焦于客户服务自动化、风险管理、业务流程优化三大核心场景,通过数据收集与预处理、模型微调与优化、系统集成与测试、持续监控与迭代四个阶段实施。微调后的模型将显著提升银行在自然语言处理、风险预测、欺诈检测等方面的能力,预计客户服务推荐准确率提升14%,风险控制预警准确率提升11%。该解决方案不仅能提高银行运营效率和服务质量,还将为数字化转型提供关键技术支撑,帮助银行在市场竞争中保持优势地位

2025-07-23 11:35:40 609

原创 大模型学习路径之多模态模型学习路线分享,很强很全!

本文介绍了多模态学习领域的主流模型CLIP、BLIP、BLIP2及其应用实践。文章首先概述了CLIP通过对比学习对齐图像和文本特征的原理,以及BLIP系列模型通过多模态混合架构实现视觉-语言理解与生成的技术路线。随后以CLIP和VisualGLM为例展示了多模态模型的实际应用,并简要提及了LLaVA、miniGPT4等同类模型。文章为读者提供了多模态学习的基础理论框架和实践案例,可作为该领域的入门参考资料。

2025-07-22 14:47:30 603

原创 2025年最新AI大模型学习路线(非常详细)从入门到精通!学完即就业!

摘要:本文介绍了2025最新版的大模型学习路线,分为L1-L4四个阶段:L1学习大模型基础知识和提示工程;L2掌握RAG应用开发;L3进阶Agent应用架构;L4深入微调与私有化部署。通过理论+实战的方式,帮助新人系统学习大模型技术,并提供配套教程资料。

2025-07-22 14:24:53 871

原创 Adam优化算法在大规模分布式模型训练中的应用:模型整合与性能提升

本文探讨了Adam优化算法在大规模分布式模型训练中的应用,重点分析了其模型整合与性能提升能力。文章首先介绍了深度学习模型训练面临的挑战以及Adam算法的优势,随后详细阐述了Adam算法的核心原理、数学公式及与其他优化算法的比较。在实现部分,提供了从环境配置到核心模块实现的完整流程,包括单机训练和分布式训练的代码示例。最后,针对分布式训练场景,讨论了Adam算法的优化方向,包括训练速度、准确性和安全性改进。本文面向深度学习从业者和对优化算法感兴趣的读者,为大规模分布式模型训练提供了实用的技术参考。

2025-07-21 12:02:04 984

原创 【小白】一文读懂CLIP图文多模态模型

CLIP(Contrastive Language-Image Pre-Training)模型是一种多模态预训练神经网络,由OpenAI在2021年发布,是从自然语言监督中学习的一种有效且可扩展的方法。CLIP在预训练期间学习执行广泛的任务,包括OCR,地理...

2025-07-21 11:44:48 826

原创 大模型RAG入门到实战基础教程(非常详细),大模型RAG入门到精通,收藏这一篇就够了!

本文介绍了检索增强生成(RAG)技术如何解决大模型(LLM)在实际应用中的关键问题,包括幻觉问题、时效性不足和数据安全风险。RAG通过结合外部知识检索与生成过程,有效提升模型输出的准确性和时效性,同时保障企业数据安全。文章详细分析了RAG的技术架构优势,并提供了一个基于LangChain的实践示例,展示了如何加载本地文本数据构建RAG系统。该技术为行业应用大模型提供了经济高效的开箱即用解决方案,特别适合专业场景和隐私敏感领域。

2025-07-18 11:38:09 907

原创 【AI大模型应用开发】1.1 Prompt Engineering(提示词工程)- 用OpenAI API实战,优化方法论总结

本文介绍了AI大模型提示词工程(Prompt Engineering)的实战技巧。主要内容包括:1. 封装通用OpenAI对话函数,测试temperature参数对回答随机性的影响;2. 通过添加System Prompt定义模型角色,提升回答质量;3. 提供Prompt优化方法论,如使用分隔符、角色扮演、输出约束等技巧;4. 介绍进阶优化方法如少样本提示。文章通过代码示例展示了如何从简单Prompt开始,逐步优化提示词,从而获得更精准的大模型回答。

2025-07-18 11:01:59 343

原创 读懂RAG这一篇就够了,一文讲明白所有RAG概念!附带完整RAG实践过程!

本文介绍了检索增强生成(RAG)技术及其在医疗智能问诊中的应用。RAG通过结合大规模语言模型(LLM)与外部知识检索,有效解决LLM的知识局限和幻觉问题,提升问答系统的准确性和专业性。文章详细阐述了RAG的分类(Naive RAG、Modular RAG、Agentic RAG)及其发展历程,并解析了RAG的基本流程:构建文本库、生成向量表征、建立索引、检索匹配和模型生成答案。最后,以医院智能问诊场景为例,展示了RAG如何整合静态医学知识和动态患者病历数据,通过意图分析、信息检索和上下文交互,实现精准的医疗

2025-07-17 15:16:54 737

原创 DeepSeek大模型优化实践:从数据处理到模型部署的高效策略

摘要: 本文系统介绍了DeepSeek大模型在数据处理、训练优化及部署应用中的关键技术。通过数据清洗、特征提取和增强,训练效率提升30%;结合超参数优化与分布式训练,GPU利用率提升至89%;模型压缩与异步处理使推理速度提升300%。案例显示,电商推荐响应时间缩短至200毫秒,金融风控准确率达95%。文末提供AI大模型学习资料,涵盖提示词工程、RAG系统及智能体开发,助力从入门到实战的全链路技能提升。

2025-07-17 14:47:07 560

原创 AI大模型知识点大梳理

AI大模型是指具有数十亿甚至数万亿参数的深度学习模型,在自然语言处理、计算机视觉等领域取得重要突破。文章介绍了AI大模型的发展历程,从ChatGPT到GPT-4,国内外企业纷纷布局;阐述了其底层原理,包括数据预处理、神经网络构建、训练优化等步骤;分析了AI大模型在自然语言处理、计算机视觉、人脸识别等领域的应用。文章还讨论了大模型的优缺点及其广泛影响,指出大模型虽性能强大但也面临计算资源消耗大等问题。最后分享了对AI大模型未来发展的个人观点。

2025-07-16 11:47:22 1017

原创 AI大模型赋能中医药产业发展分析

以大模型为代表的人工智能技术正在加速改变世界,成为引领新一轮科技革命和产业变革的关键驱动。近年来,在数据、算法和算力等关键要素的快速迭代下,AI大模型迅速发展,应用领域不断拓宽,正在与中医诊疗、中药研发等深度融合,带来了众多创新与突破。中医药模型如同一位博学的古代名医,穿越时空,与现代科技携手,共同守护着人类的健康。

2025-07-15 10:51:30 921

原创 【AIGC】大模型在金融行业的应用场景和落地路径

当前,金融科技已经从“立柱架梁”迈入了“积厚成势”新阶段,越来越多的金融机构积极使用数字技术来为金融血脉注入全新能量。人工智能技术正加速与金融产业深度融合,以 ChatGPT 为代表的大模型技术不断进化,为金融业带来深刻变革,驱动金融服务更加高效、便捷、有温度。ChatGPT 拥有持续的多轮对话能力,并具备一定逻辑推理能力,在生成文章、生成代码、翻译等方面展现出令人惊叹的水平。ChatGPT 的问世,意味着人工智能从 1.0 时代迈入了 2.0 时代。ChatGPT 背后的 GPT 大模型技术是下一代

2025-07-15 10:25:30 874

原创 一文掌握大模型数据准备、模型微调、部署使用全流程

距离ChatGPT已经发布1年半了,距离我们训练出自己的大模型也已经1周年了。目前仍然有很多同学在咨询如何训练自己的大模型。这个东西和男/女朋友一样。当你不认识TA,距离TA很远,不敢接触TA的时候,TA就是很神秘,也很难接触。但是一旦当你愈发了解TA的时候,你就知道其实上手也很容易。之前我已经撰写了一个简单的训练大模型的代码,用于阐述大模型训练其实和原来的训练没什么两样。但是随着大模型深入到了每一个研究者的手上,这时候,训练部署的代码框架就更为重要了。

2025-07-12 15:47:54 802

原创 AI模型大杀器----Amazon SageMaker 实现高精度猫狗分类

Amazon SageMaker是一个完全托管的机器学习平台,能够帮助开发者和数据科学家快速构建、训练和部署ML模型。它提供端到端的机器学习工具,包括数据预处理、算法设计、模型训练和部署,同时支持高性能计算资源。用户无需管理底层基础设施,只需通过Jupyter Notebook界面即可完成开发工作。本文以猫狗分类为例,展示了如何创建SageMaker笔记本实例、配置环境并启动Jupyter Notebook进行模型开发。SageMaker简化了机器学习流程,让开发者可以专注于算法实现而非运维工作。

2025-07-12 15:08:24 379

原创 【大模型系列——解读RAG】_大模型rag是什么意思

RAG 是2023年最流行的基于 LLM 的应用系统架构。有许多产品几乎完全建立在 RAG 之上,覆盖了结合网络搜索引擎和 LLM 的问答服务,到成千上万个数据聊天的应用程序。很多人将RAG和Agent 作为大模型应用的两种主流架构,但什么是RAG呢?RAG又涉及了哪些具体的技术呢?1. 什么是RAGRAG即检索增强生成,为 LLM 提供了从某些数据源检索到的信息,并基于此修正生成的答案。RAG 基本上是 Search + LLM 提示,可以通过大模型回答查询,并将搜索算法所找到的信息作为大模型的上下

2025-07-11 15:10:22 656

原创 全网最全RAG评估指南:全面解析RAG评估指标并提供代码示例

本文探讨了RAG(检索增强生成)系统的痛点及优化策略。关键痛点包括数据处理、chunk大小设置、embedding模型选择、prompt设计、topN检索参数调整及LLM模型选择等。优化建议包括:数据清洗与合理分段(100-300词)、选用BERT等成熟embedding模型、设计清晰prompt、调整topN值(3-10)、结合GPT等大语言模型,并建议通过尝试更大模型来提升生成效果。文中还提供了具体代码示例,展示数据预处理和embedding的实现方法。

2025-07-11 14:13:52 415

原创 AI大模型赋能电商行业:引领数字化转型与创新变革

AI大模型赋能电商行业变革 摘要:AI大模型(如GPT、BERT)正深刻改变电商行业,通过个性化推荐、智能客服、供应链优化等八大核心场景驱动变革。关键技术应用包括:1)基于用户行为的精准商品推荐与广告投放;2)24小时NLP智能客服系统;3)需求预测与动态定价的库存管理;4)语义理解和AR技术提升搜索体验;5)自动化内容生成与营销文案优化。这些技术使电商平台转化率平均提升30%,库存周转率提高25%,同时通过反欺诈系统增强安全性。随着AI技术发展,电商行业将加速向智能化、个性化生态演进。

2025-07-08 11:04:16 948

原创 大语言模型 - 提示词(Prompt)工程入门

摘要:本文系统介绍了提示词工程(Prompt Engineering)的核心内容,包括基本原则、结构设计、优化技巧和框架技术。重点阐述了编写清晰指令、结构化输出、分阶段思考等五大优化策略,以及Co-STAR、RISEN等Prompt框架和零样本提示、思维链等14项关键技术。文章还列举了大语言模型在周报生成、数据分析等8个常见场景的应用方案,为开发者提供了从理论到实践的完整Prompt设计指南。

2025-07-07 17:27:45 696

原创 LLMs之Law:大语言模型纵向赋能场景—垂直行业场景应用之大模型法律行业的简介、主流LLMs(PowerLawGLM/ChatLaw)、经典应用之详细攻略

摘要: 法律行业大模型通过垂直领域优化解决通用大模型的法律知识缺陷。清华大学开发的PowerLawGLM基于GLM-130B,通过三阶段训练(法律语料收集、对话对齐微调、工程优化)提升合同生成、法律问答等专业能力;北大ChatLaw则基于Ziya-LLaMA-13B,整合外部知识库增强准确性。两者均针对通用模型易产生的虚假案例引用等问题,提供更可靠的法律服务,推动AI在法律咨询、文书生成等场景的应用。

2025-07-04 12:01:13 822

原创 国产AI大模型在医疗行业的应用:10大场景典型案例全解析!

人工智能技术的浪潮正席卷全球,AI大模型以其卓越的数据处理能力和深度学习能力,正在成为医疗健康领域变革的关键力量。本文将深入探讨AI大模型在医疗十大场景中的创新实践,展示其提升医疗服务效率、赋能临床决策、推动行业智能化转型的广阔前景。

2025-07-04 11:27:14 882

原创 从0到1开发AI Agent(智能体)(六)| 智能体1 :通过LangChain中的ReAct框架实现自动定价

摘要: 本文介绍了如何利用ReAct框架构建智能体(Agent)来解决鲜花店定价问题。ReAct框架通过协同推理(Reasoning)和行动(Acting),使大模型能够动态决策并调用外部工具。文章详细阐述了ReAct框架的四个核心要素:大模型(LLM)、提示词(prompt)、外部工具(如搜索引擎)和Agent执行器。通过Python代码示例,展示了如何实现一个根据天气和交通状况自动调整鲜花价格的智能体,并利用LangChain工具链完成推理-行动循环。该方案模拟了人类定价的决策过程,体现了AI智能体在业

2025-07-03 14:30:00 784

原创 【玩转 TableAgent 数据智能分析】股票交易数据分析+预测

TableAgent是一款基于Alaya大模型的智能数据分析工具,由九章云极DataCanvas公司开发。它通过AI技术实现自动化数据处理与分析,用户只需输入分析目标,TableAgent即可自动完成数据筛选、格式转换、模型选择、代码生成、运行分析并输出报告,全程无需编码。该工具支持会话式交互、领域微调、私有化部署,适用于企业级数据分析。本文以建设银行股票数据为例,演示了TableAgent的注册、数据准备及分析流程,验证其自动化分析能力,帮助用户理解大模型驱动的分析工具如何提升工作效率。

2025-07-03 11:59:30 968

原创 LangChain实战 | Tool Calling :让AI真正动起来的关键技术

摘要 本文介绍了大模型通过Tool Calling调用外部工具的方法,重点讲解了LangChain框架下的工具定义与调用流程。主要内容包括:1) 工具的定义方式,通过@tool装饰器创建工具,可自定义名称、描述和参数;2) 工具与大模型的绑定过程;3) 大模型Tool Calling的工作原理,模型仅生成调用参数而不直接执行;4) 完整的调用示例,展示从工具定义到最终执行的四个步骤。文章强调Tool Calling能力使大模型从单纯的语言生成工具升级为任务执行引擎,解决了静态知识局限和执行能力缺失等问题。

2025-07-03 10:30:00 871

原创 一文说清楚什么是AI大模型

本文系统介绍了大语言模型(LLM)的核心概念与技术特性。主要内容包括:1)LLM的定义,强调其基于Transformer架构、超大规模参数和通用任务处理能力;2)核心技术解析,重点说明注意力机制、并行计算和编码器-解码器结构的工作原理;3)探讨"大模型"特指语言模型的原因,包括技术突破、应用广泛性和商业价值;4)区分"大模型"与"小模型"的差异,指出参数规模、训练数据和计算资源的不同;5)列举典型小模型案例及其轻量化优势。文章通过班级管理比喻生动阐

2025-07-02 11:40:26 971

原创 一文说清楚什么是AI Agent(智能体)

在人工智能的浪潮中,AI Agent作为新一代的技术革命,正逐渐走进我们的视野。AI Agent不仅仅是工具,更是连接复杂任务的关键纽带,它们能够理解自然语言、生成响应以及执行具体行动。什么是AI Agent?AI Agent,即人工智能代理,一般直接叫做智能体。它是一种能够感知环境、做出决策并采取行动的系统。这些系统能够执行被动的任务,也能够主动寻找解决问题的方法,适应环境的变化,并在没****有人类直接干预的情况下做出决策。

2025-07-02 11:39:24 593

原创 【万字长文】DeepSeek+RAG本地化知识库实战续——分布式+多线程提升海量数据处理性能(附代码)

本文介绍了基于DeepSeek+RAG的本地知识库分布式优化方案,重点针对学术论文批量处理场景。通过HDFS存储论文、PyMuPDF解析文档、BGE-M3模型生成向量,并采用Spark分布式架构实现高效处理。技术方案包含三个核心阶段:1)将论文批量上传至HDFS并建立MySQL元数据索引;2)分布式解析PDF文档,按章节分块并提取图片存储至OSS;3)使用BGE-M3模型生成文本向量存入ChromaDB。文章提供了完整的配置说明和核心代码实现,包括环境准备、HDFS文件操作、PDF解析和向量生成等关键模块的

2025-07-01 15:00:00 893

原创 【万字长文】如何用DeepSeek+RAG进行本地化知识库搭建实战(附代码)

本文提出了一套基于DeepSeek大模型的私有化论文知识库构建方案。系统采用BGE-M3嵌入模型和ChromaDB向量数据库,通过pdfPlumber/PyPDF2处理PDF文献,实现结构化知识提取与存储。方案包含完整的数据处理流程:从PDF文本提取、清洗分块,到向量化存储与检索。重点探讨了文本分块策略、元数据标签设计及向量数据库优化方法,并提供了可扩展的文件存储、图片处理等增强功能。通过合理的提示词工程,系统能够基于论文知识库生成结构化回答,为学术研究提供智能化的文献知识管理解决方案。

2025-07-01 10:51:45 666

原创 【AIGC】解锁AI创造力:掌握Prompt提示词的高效提问策略

AI提示词工程:内容创作的核心技术 提示词工程是AI内容创作的关键技术,通过精心设计的关键词组合引导AI生成高质量内容。本文系统介绍了提示词的基本原理、书写技巧和常用框架(CO-STAR、BORKE、结构化提示词),分析了提示词工程师的职业前景,并分享了逆向工程、Coze工具等实用技巧。还推荐了AI Short、提示精灵等提示词聚合网站,探讨了提示词在AIGC领域的广泛应用。提示词作为人机交互的桥梁,其精准度直接影响AI输出的专业性和准确性,掌握提示词工程将大幅提升内容创作效率。

2025-06-30 17:44:06 658

原创 一文弄懂 Transformer模型(详解)

Transformer如何革新自然语言处理? Transformer模型通过自注意力机制和位置编码两大创新,彻底改变了自然语言处理领域。自注意力机制通过查询-键-值三元组计算词间关联,实现远距离依赖捕捉;位置编码则弥补了模型对词序信息的缺失。模型处理流程包括:数据预处理(Token化、Embedding)、编码器(多头自注意力+前馈网络)、解码器(带掩码的自注意力)及最后的线性层和Softmax层输出。相比传统RNN,Transformer具有并行计算优势,能更高效地处理长序列。当前Transformer已

2025-06-30 17:04:43 949

原创 一文彻底搞懂大模型 - RAG(检索、增强、生成)

摘要: RAG(检索增强生成)是结合信息检索与生成式大模型的技术框架,通过从外部知识库检索相关信息增强LLM的生成能力,解决知识时效性和幻觉问题。其核心流程包括:1)检索模块将查询向量化并匹配相关知识;2)生成模块融合检索结果与查询,输出更准确的回答。RAG广泛应用于问答、摘要等场景,构建时需完成数据准备、向量索引、提示增强等步骤。该技术由FAIR团队2020年提出,现成为大模型应用的关键方案,可显著提升生成内容的准确性和专业性。

2025-06-28 15:21:50 770

原创 神仙级AI大模型入门教程(非常详细),从零基础入门到精通,从看这篇开始!

在学习大模型之前,你不必担心自己缺乏相关知识或认为这太难。我坚信,只要你有学习的意愿并付出努力,你就能够掌握大模型,并能够用它们完成许多有意义的事情。在这个快速变化的时代,虽然新技术和概念不断涌现,但希望你能静下心来,踏实地学习。一旦你精通了某项技术,你就能够用它来实现自己的目标,甚至可能找到理想的工作或完成具有挑战性的项目。

2025-06-28 14:10:50 789

原创 从零开始的DeepSeek微调训练实战(SFT)

本文重点介绍使用微调框架unsloth,围绕DeepSeek R1 Distill 7B模型进行高效微调,并介绍用于推理大模型高效微调的COT数据集的创建和使用方法,并在一个medical-o1-reasoning-SFT数据集上完成高效微调实战,并最终达到问答风格优化&知识灌注目的。

2025-06-27 15:31:09 685

原创 AI浪潮来袭!这份终极职业升级路线图,让你少走 90% 的弯路!

在朋友圈转发着大佬观点,心中却一片茫然的“看客”?是收藏了无数G的教程,却始终停在 Hello World 的“伪信徒”?还是在日复一日的重复工作中,眼睁睁看着时代列车呼啸而过,内心充满无力感的“局外人”?每一次变革都伴随着巨大的机遇,和同等量级的焦虑。AI 这波浪潮,比以往任何一次都更猛烈,更彻底。它不再是程序员的专利,而是渗透到各行各业的“新水电煤”。披萨店老板可以用它预测销量,减少备货浪费;金融分析师可以用它识别欺诈,保护资产安全;你我这样的普通职场人,也注定要与它共舞。问题是,舞步该怎么迈?

2025-06-27 14:16:52 535

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除