自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(972)
  • 收藏
  • 关注

原创 coze功能详解!AI保姆级入门教程!

本地文档包含三种:1、文本格式:word, pdf, txt2、表格格式:excel, csv3、照片类型以上传本地文档为例,上传后,选择自动分段与清洗,coze会自动对数据进行处理上传后,我们在bot或工作流中,就能使用该知识库。

2025-01-04 17:32:07 12590 2

原创 没钱买GPU!本地还想跑大模型的终极工具Ollama!

Ollama 是一个开源平台,它允许我们在本地机器上轻松设置和运行 LLM。它简化了下载、安装和与 LLM 交互的过程。至少应该有 8 GB内存 的 Intel i5处理器才能运行7B型号,如果需要运行13B 的型号CPU起码得至少需要16 GB 的是i5。以此类推32 GB 的 RAM 来运行 33B 型号。

2024-11-22 17:30:34 9521

原创 大模型训练(超全面!超详细!)收藏这一篇就够了!

大模型训练被分解成了预训练,监督调优,对齐等阶段。先看预训练,预训练,即Pre-training。预训练的目的是让模型学习语言的特性,主要是学习语言表达的流畅性和规则。至于具体的语言任务,比如对话,角色扮演,信息抽取,翻译,阅读理解,问答等,则需要放到监督调优。预训练是大模型的基础和核心,预训练阶段决定了模型的基础能力和上限。

2024-09-23 15:27:15 4955

原创 一键部署本地私人专属知识库,开源免费!可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型,零代码集成。

今天跟大家分享的内容是,如何在本地搭建自己的本地知识库问答系统MaxKB,与其他问答知识库相比,他真正做到了开箱即用,零代码集成,支持ChatGPT、百度千帆、Lama2、Lama3,通义千问等几十种大语言模型,操作界面简介,小白也能快速上手。【注意在正式搭建知识库问答系统之前,请确保你的Windows系统已经升级到了专业版本,同时拥有一张独立的显卡!!】

2024-06-13 17:24:12 4870 1

原创 AI大模型:国内外大模型发展情况梳理

随即引爆社交网络,大模型行业进入加速发展阶段。国外基础模型实力强劲、不断精 进,开源模型打造庞大应用生态,端侧模型小而美。国内大模型也进入加速成长期,在过去一年中取得了实质性突破。百度文心一言、 讯飞星火、清华智谱、商汤“日日新”整体表现逼近,开源模型快速进步,文生视频、文生音乐等多模态 也取得突破。国内大模型网页流量和应用下载量节节攀升,大模型已经成为日常生活中的重要助手。。国外大模型主要分为三个层级:性能强劲的闭源模型,具备生态优势的开源模 型,以及专注端侧应用的轻量模型。

2024-05-17 15:01:07 6365 1

原创 什么是大模型?一文读懂大模型的基本概念

什么是大模型?一文读懂大模型的基本概念

2024-04-18 09:57:13 5703

原创 作为普通程序员,我们该如何学习大模型(LLM),学习路线和知识体系

原谅我的后知后觉,才开始从头写,我是已经上了一阶段大模型的课,也搜集了些资料,并自己做了小部分实践,回过头来,才想开始整理些文章。起初,大家都在写,都在发,我那会在焦虑。自chatgpt爆火以来,AI技术又被广泛关注,国内外各大厂商也纷纷布局,作为我们每一个普通人,也无不时刻感受着AI一波又一波的冲击。尤其是作为程序员的我,相信绝大多数程序员也有和我一样的感受,从一开始的新奇,到焦虑,到试图去了解他,到去尝试,并致力于应用。

2024-04-12 11:19:13 8499

原创 大模型部署工具 llama.cpp 介绍与安装使用

另外一个是量化,量化是通过牺牲模型参数的精度,来换取模型的推理速度。llama.cpp 提供了大模型量化的工具,可以将模型参数从 32 位浮点数转换为 16 位浮点数,甚至是 8、4 位整数。训练的过程,实际上就是在寻找模型参数,使得模型的损失函数最小化,推理结果最优化的过程。训练完成之后,模型的参数就固定了,这时候就可以使用模型进行推理,对外提供服务。大模型时代,企业对人才的需求变了,AIGC相关岗位人才难求,薪资持续走高,AI运营薪资平均值约。llama.cpp 提供了模型量化的工具。

2024-04-07 18:31:27 10436

原创 2025年全球AI大模型,deepseek居然排第二

技术方向:模型趋向多模态、低成本(如DeepSeek-V3)与垂直领域深化(如盘古3.0)。竞争焦点:OpenAI通过免费策略扩大生态,DeepSeek以开源高性价比吸引企业用户。风险与挑战:伦理问题(GPT-5的滥用风险)、数据安全(开源模型的可控性)及算力门槛(如文心一言依赖本土硬件)。未来,AI大模型将更加注重安全性、可控性和用户体验,同时与行业应用深度融合,推动人工智能技术的普惠化发展。

2025-04-03 10:40:38 681

原创 AI大模型·白皮书 | 中山大学-从技术突破到场景落地:大模型发展图谱与DeepSeek创新应用

2025年初,DeepSeek-R1的横空出世引爆全球AI热潮。这场由大模型掀起的变革浪潮,正以前所未有的速度重塑技术边界与产业生态。在这场变革中,如何把握趋势、抢占先机?该材料将以DeepSeek为锚点,解码大模型发展图谱,剖析核心价值与未来方向。

2025-04-03 10:16:18 69

原创 多模态RAG架构:融合文本、图像与音频以提升AI生成能力

随着大模型在文本生成任务中取得显著成果,企业和研究者逐渐将目光转向更复杂的多模态任务场景,如图文问答、语音搜索、视频分析等,传统基于文本的检索增强生成(RAG)系统已经无法满足这些多样化需求,因此为了实现对图像、音频等非结构化数据的统一理解与利用,多模态RAG应运而生。RAG将检索器与生成器组合起来:在文本领域,RAG有效缓解了大模型的“幻觉”(Hallucination)问题,弥补了模型内部知识更新的不足,但在更复杂的实际业务中,用户提出的问题可能涉及图像内容、语音输入等,仅依赖文本检索已难以胜任,因此引

2025-04-02 14:02:10 760

原创 【教程】用DeepSeek搭建AI Agent

是一本简单易学、注重实践的学习指南。它用精炼的篇幅清晰地阐述了每个开发者都应该掌握的DeepSeek高级使用方法,帮助我们用DeepSeek搭建智能体和个人知识库,通过API调用进行AI编程,从而在编程之路上实现质的飞跃。我的DeepSeek部署资料已打包好(自取↓)

2025-04-02 13:54:38 952

原创 探索AI+k8s:如何使用Deepseek大模型增强k8s-dashboard

是一款集 AI 与 Kubernetes 于一体的轻量级控制台工具,专为简化集群管理设计。基于 AMIS 构建,并通过 kom 作为 Kubernetes API 客户端,

2025-04-01 13:55:11 569

原创 大模型究竟是什么?

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。所以我综合了大模型的所有知识点,给大家带来一套。我们这套大模型资料呢,会从。

2025-04-01 11:15:55 615

原创 主流RAG 框架深度分析:Dify、FastGPT、RAGFlow、LangChain,哪个更适合你?

RAG 框架是大语言模型落地的重要支柱,而 Dify、FastGPT、RAGFlow 和 LangChain 在功能和场景上各有专长。初学者可从 Dify 或 FastGPT 起步,快速体验 RAG;文档密集型需求选 RAGFlow;技术团队则可挑战 LangChain。

2025-03-31 15:16:13 726

原创 太疯狂了!用Deepseek+即梦AI,做治愈型短视频,获赞12w,新手3步就能完成(内附详细提示词)

最近我发现了一个超火的风口,治愈型短视频可火了!很多人通过Deepseek和即梦AI做出的治愈型短视频,在抖音上轻松获赞12w,不仅流量爆棚,收入也相当可观。Deepseek和即梦AI的组合简直就是视频创作的“王炸”。这可把我给馋坏了,我研究了一番,发现这背后的操作简直不要太简单。今天就来给大家揭秘,新手也能轻松搞定!

2025-03-31 15:10:43 341

原创 5分钟读懂LLM:DeepSeek、ChatGPT背后的核心技术

LLM是一种参数规模庞大(通常包含数亿至数万亿参数)的生成式模型,通过预训练和微调两大阶段学习语言规律。其训练数据涵盖互联网文本、书籍、对话记录等,能够捕捉词语间的复杂关系,生成符合上下文语境的文本。

2025-03-29 11:18:12 521

原创 一文看懂:阿里开源首个全模态大模型Qwen2.5-Omni!

Qwen 团队最近(2025 年 3 月)发布了一款统一多模态大模型 Qwen2.5-Omni,开放了 7B 版本的权重。能够同时处理文本、图像、音频和视频输入,并以流式方式生成文本和语音响应。核心创新包括

2025-03-29 11:09:53 895

原创 一文读懂大模型AGI定义、应用及就业前景

定义大模型AGI(通用人工智能大模型)是指通过大规模参数(如千亿级)和深度学习技术构建的模型,旨在模拟人类智能的广泛认知能力,包括推理、学习、跨领域任务处理等。当前主流观点认为,大模型虽在特定任务上表现优异(如文本生成、图像识别),但距离真正的AGI(能够自主设定目标、适应复杂环境)仍有差距,更多被视为一种“文化和社会技术”,类似于历史上的印刷术或互联网,核心功能是高效整合与传播信息。作用大模型AGI的核心价值在于提升信息处理效率、赋能多领域智能化转型。信息整合。

2025-03-28 14:04:28 592

原创 DeepSeek本地部署+WebUI可视化+数据投喂训练AI之新手保姆级教程,建议收藏

最近国产大模型DeepSeek特别火,以至于频繁出现反应迟缓甚至宕机的情况,和两年多之前ChatGPT的遭遇颇为相似。万幸,DeepSeek是一个开源模型,我们大可以通过本地部署,在自己的终端上随时使用!

2025-03-28 13:55:05 750

原创 面试必问:部署LLM需要多少资源

这不是一个随意的问题——它是衡量你是否真正理解这些强大模型在生产环境中部署和可扩展性的关键指标。当我们处理像 GPT、LLaMA 或其他任何 LLM 这样的模型时,了解如何估算所需的 GPU 内存至关重要。无论你正在处理的是一个拥有 70 亿参数的模型,还是一个规模大得多的模型,正确配置硬件以部署这些模型是至关重要的。让我们深入研究一下帮助你有效部署这些模型所需的 GPU 内存的数学公式。这代表你的模型的大小。

2025-03-27 10:58:47 302

原创 AI Agent篇——小白的入门指南

近段时间,AI智能体(AI Agent)发展迅猛,有不少人疑惑,在大模型已然强大的当下,为何还需要 AI Agent 呢?本文就用简单的语言带大家快速认识AI Agent ,了解大模型与智能体的区别,并从0到1搭建一个你自己的Agent。

2025-03-27 10:54:03 624

原创 Agent在实践:多工具协作与微服务集成

AI Agent在企业中的价值远超单一任务自动化,它正成为连接多工具和微服务的智能核心;

2025-03-26 10:50:54 918

原创 DeepSeek-V3/R1推理系统:技术革新与商业闭环的双重突破

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。天道酬勤,你越努力,就会成为越优秀的自己。

2025-03-26 09:54:20 938

原创 18种RAG技术大比拼:谁才是检索增强生成的最佳选择?

在当今信息爆炸的时代,如何从海量数据中快速准确地获取所需信息,是人工智能领域的一大挑战。Retrieval-Augmented Generation(RAG,检索增强生成)技术应运而生,它结合了检索和生成的优势,通过从大量文档中检索相关信息,再利用这些信息生成高质量的回答。然而,RAG 的实现方式多种多样,不同的技术路径有着不同的优势和局限。今天,我们就来深入探讨一下这些 RAG 技术,看看谁才是真正的“最佳选手”。在探索各种复杂的 RAG 技术之前,我们先从最简单的 RAG 方法说起。

2025-03-25 10:50:39 892

原创 教师必看!DeepSeek赋能教学超全使用指南

在人工智能技术飞速发展的今天,教育领域正经历着前所未有的变革。DeepSeek作为新一代人工智能技术,凭借其强大的数据处理能力和深度学习算法,正在重塑教师的备课模式。这项技术不仅能够提升备课效率,更能为教师提供精准的教学支持,使备课工作更加科学化和智能化。

2025-03-25 10:36:49 643

原创 DeepSeek三分钟本地部署(亲测有效)

DeepSeek(深度求索)是一家专注于实现AGI(通用人工智能)的中国公司,致力于探索AGI技术的前沿,尤其在。

2025-03-24 14:07:15 973

原创 RAG经验分享:如何选对Embedding模型?

MTEB : Massive Text Embedding BenchmarkMTEB 是一个包含广泛文本嵌入(Text Embedding)的基准测试,它提供了多种语言的数十个数据集,用于各种 NLP 任务,例如文本分类、聚类、检索和文本相似性。MTEB 提供了一个公共排行榜,允许研究人员提交他们的结果并跟踪他们的进展。MTEB 还提供了一个简单的 API,允许研究人员轻松地将他们的模型与基准测试进行比较。MTEB 包含以下 8 种任务类型:有两个榜单MTEB地址:下面我们以旧版本为例(其中有中文等语言的

2025-03-24 14:02:19 750

原创 AI大模型·白皮书 | DeepSeek行业应用案例集:解锁智能变革密码-浙江大学(153页)(附DeepSeek自学手册)

在数字化浪潮汹涌澎湃的当下,DeepSeek以其强大的技术实力,如同一股创新的洪流,席卷众多行业,为各领域带来了前所未有的变革与突破。本案例集初步收录了40多个来自农业、制造业、汽车行业、手机行业、智能家居、物流、云服务、办公网络安全、金融、医疗、教育等多个关键行业的应用案例。这些案例多方位多角度展示DeepSeek在不同行业的落地实践与显著成效,为各行业从业者提供了宝贵的参考与借鉴,引领大家一同探索智能时代的无限可能,见证DeepSeek如何成为推动各行业迈向智能未来的核心驱动力。

2025-03-22 17:02:49 399

原创 AI大模型·白皮书 | 2025年DeepSeek金融审计应用场景1000问-124页

本手册基于金融审计实践,创新性地构建“场景-方法-示例-案例”的闭环框架。针对金融审计智能化转型的时代趋势,基于DeepSeek重点提供风险建模、文本分析、流程自动化等技术,提供 Prompt 设计与调优策略的思路,并以案例方式详解大数据分析技术等在合同审查、关联交易识别、风险揭示等场景中的具体应用,让使用者更好地在沉浸式体验金融审计案例中解锁DeepSeek新知识。在数字经济与智能技术深度融合的当下,金融及金融审计行业变革加速。本报告围绕金融审计场景,深度挖掘大语言模型应用,为行业提供全面指引。

2025-03-22 16:00:42 329

原创 国内AI大模型已近168个,哪个更有前途?

训练数据量大的模型必然碾压小数据集模型吗?支持多模态的模型必定比单一模态模型更具竞争力吗?‌推理速度快的模型就比精度优先的模型更实用吗?通用型大模型必然优于垂直领域专用模型吗?能通过图灵测试的模型就代表商业价值更高吗?‌具备情感交互能力的模型比纯功能型模型更有发展空间吗?‌获得资本追捧的项目必然代表技术先进性吗?绑定头部企业的技术路线就比独立开发者生态更可靠吗?‌符合当前监管框架的模型架构就代表长期合规性吗?

2025-03-22 14:43:09 571

原创 DeepSeek-V3 和 DeepSeek-R1的差异

本文是关于 DeepSeek-V3和 DeepSeek-R1 的详细对比分析,涵盖技术架构、训练范式、性能表现、应用场景及部署策略等核心维度。

2025-03-22 11:23:31 972

原创 不懂RAG?看这一篇万字长文就够了!

传统的语言模型,比如 GPT-3,虽然在生成文本方面表现出色,但它们有一个显著的局限性:它们依赖于预训练的参数,无法动态访问外部知识。这意味着这些模型在处理实时信息、领域特定知识或罕见实体时表现不佳。举个例子,在问答任务中,模型可能会生成不准确或过时的答案,因为它无法访问最新的数据。就像你问一个朋友“今天天气怎么样?”,但他只能告诉你去年的天气情况,显然这样的信息对你来说毫无用处。这种局限性在需要精确答案的场景中尤为明显。

2025-03-22 11:14:15 827

原创 通过知识图谱可视化增强 LLM 开发与调试

知识图谱在 AI 驱动的应用,尤其是基于大语言模型(LLM)的聊天机器人中扮演着至关重要的角色。这些图谱可以组织海量数据,加快信息检索,提高检索精准度,从而打造更高效、具备上下文理解能力的 AI 响应。数据框架如[1] 充当 LLM 与存储相关信息的数据结构之间的桥梁,使开发者能够更轻松地构建 AI 驱动的应用,例如利用[2]。为了向 LLM 提供必要的上下文信息,AI 应用通常集成采用图检索增强生成(Graph Retrieval-Augmented Generation,RAG)方法。

2025-03-21 11:59:16 572

原创 DeepSeek VS ChatGPT, 智商几何?

炙手可热的AI,中国科技界的AI才俊DeepSeek一经面世,就令世人震惊。那么DeepSeek VS ChatGPT,究竟智商几何呢?全球AI模型的排名和发展不断变化,但根据当前的技术能力和广泛应用,以下是全球排名前十的AI语言模型(截至2025年):1.GPT-4(OpenAI):作为多模态模型,能够处理文本和图像输入,具有最强的生成、推理和理解能力。2.PaLM 2(Google DeepMind):在推理能力、常识推理和多任务处理方面表现出色,特别是在自然语言处理和代码生成任务上具有很强的优势。3.

2025-03-21 10:03:33 730

原创 DeepSeek系列:掌握这九个DeepSeek对话技巧,解锁AI高效能助手

掌握以上九个提问技巧,你将能够充分利用DeepSeek的强大功能,在学习、工作甚至副业赚钱的道路上走得更远。AI不仅能为你提供高效的工作支持,还能帮助你快速学习新技能,提升个人竞争力。通过精准提问、结构化描述、专业术语运用、分步提问等技巧,你可以让DeepSeek成为提高生产力、节省时间、增加收入的得力助手。我的DeepSeek部署资料已打包好(自取↓)但如果你想知道这个工具为什么能“听懂人话”、写出代码 甚至预测市场趋势——答案就藏在大模型技术里!❗️为什么你必须了解大模型?

2025-03-20 13:49:59 959

原创 Manus爆火出圈,一文厘清AI Agent产业链

AI Agent,即人工智能代理(Artificial Intelligence Agent),是以大语言模型为大脑驱动的系统,具备自主理解、感知、规划、记忆和使用工具的能力,能够自动化执行完成复杂任务的系统。大模型是AI Agent实现的前提和基础,为AI Agent提供了强大的知识和语言理解能力,但它们两者又存在着明显的区别。其中,大模型与人类之间的交互是通过提示词(Prompt)实现的,用户给的提示词是否清晰明确会直接影响大模型回答的效果。

2025-03-20 13:44:46 943

原创 厦大团队:大模型概念、技术与应用实践(140页PPT读懂大模型)

大模型概念、技术与应用实践》将深入剖析大模型的核心概念、原理特点以及丰富多元的应用实践案例,旨在让大家全面了解大模型这一前沿技术,明晰其在当下及未来发展中的重要地位与深远影响 ,共同探索如何借助大模型的力量推动社会各项事业迈向新的高度。我的DeepSeek部署资料已打包好(自取↓)但如果你想知道这个工具为什么能“听懂人话”、写出代码 甚至预测市场趋势——答案就藏在大模型技术里!❗️为什么你必须了解大模型?1️⃣ 薪资爆炸:应届大模型工程师年薪40万起步,懂“Prompt调教”的带货主播收入翻3倍。

2025-03-19 14:36:52 535

原创 大语言模型(LLM)到底是个啥

很多人觉得LLM像人一样具备智慧,能够思考,但事实并非如此,LLM本质上只是一个基于神经元网络(Neural Network)构建的、能够模拟人类语言模式的的文本模拟器,其工作原理可以简单概括为:用户输入文本LLM将文本转换成Token(即模型可理解的编码形式)LLM根据输入的Token序列,预测下一个最有可能出现的Token,并重复此过程直至出现一段token序列LLM将预测结果转换成文本,并输出当LLM预测越精准,其输出的内容就越接近人类的回复,用户就越容易产生"LLM具备智慧"的错觉。

2025-03-19 14:34:01 563

原创 一文搞懂DeepSeek - DeepSeek-R1训练过程

DeepSeek-R1的亮点在于其出色的数学和逻辑推理能力,这使其区别于一般的通用大语言模型(LLM)。DeepSeek-R1的训练目标是达到与OpenAI o1相似的推理能力,但技术路线有所不同。R1并没有采用o1 test-time compute(测试时计算),而是注重通过强化学习(RL)和监督微调(SFT)的结合来提升模型的性能。DeepSeek-R1训练过程是一个复杂但高效的过程,旨在通过多个阶段的训练,提升模型的推理能力和对齐人类偏好。

2025-03-18 14:07:04 654

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除