自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(482)
  • 收藏
  • 关注

原创 别被 “一键部署” 骗了!使用Ollama本地部署DeepSeek 避坑指南

最近最火的莫过于DeepSeek,现在网上关于 AI 模型部署的文章一抓一大把,动不动就是 “一键部署,轻松上手”、“30 分钟搭好一个本地能跑起来的大模型”。可现实是,当你真上手用 Ollama 搭建 DeepSeek 模型时,那简直就是踩坑大冒险!今天咱就来好好唠唠那些坑,帮你顺利搭建属于自己的 DeepSeek。

2025-04-04 08:00:00 252

原创 Tokens 是什么,为什么大模型按Tokens 收费,和API调用收费的区别,看完这一篇你就理解了!!

大型语言模型(如 GPT-3、GPT-4)处理文本时,会将输入文本拆分成 tokens,然后逐个 token 进行处理。在大模型中,生成每个 token 都需要一定的计算资源和时间。根据模型的大小和复杂性,计算这些 tokens 需要的资源不同,因此,模型的计算和处理成本是与输入的 token 数量直接相关的。

2025-04-03 11:24:14 387

原创 100个AI Agent应用场景合集丨来看看Agent能在你的行业做什么

人工智能代理(AI Agent)的发展正在以前所未有的速度改变我们的生活和工作方式。从日常生活的小事到企业级的复杂决策,AI Agent 的应用场景广泛且多样。以下是 100 个 AI Agent 的创新应用场景,它们展示了 AI 技术如何渗透到我们生活的方方面面。

2025-04-03 11:00:34 554

原创 10W+下载,2025最新中文版《大模型基础》教程pdf免费分享

本书旨在为对大语言模型感兴趣的读者系统地讲解相关基础知识、介绍前沿技术。作者团队将认真听取开源社区以及广大专家学者的建议,持续进行月度更新,致力打造易读、严谨、有深度的大模型教材。并且,本书还将针对每章内容配备相关的Paper List,以跟踪相关技术的最新进展。

2025-04-02 15:07:44 267

原创 【AI大模型】Embedding模型选型思路:决定知识库与RAG的准确率上限!收藏这一篇就够了!!

作为AI领域的核心基础技术,嵌入模型通过将非结构化数据映射为低维稠密向量,实现语义特征的深度捕捉:文本嵌入:如将语句转换为1536维向量,使"机器学习"与"深度学习"的向量余弦相似度达0.92跨模态嵌入:支持图像与文本的联合向量空间映射,如CLIP模型实现文图互搜

2025-04-02 11:06:49 740

原创 LLM Agent在方法、应用和挑战全面综述!建议收藏起来慢慢学!!

近年来,以ChatGPT为代表的LLM不仅改变了人机交互方式,更催生了新一代「智能代理」(AI Agent)。它们不再是简单的问答机器,而是能主动规划、协作、甚至自我进化的「数字员工」。

2025-04-01 11:57:50 653

原创 比肩DeepSeek-R1的QwQ-32B,单卡击碎6710亿参数资源枷锁?本地部署+函数工具调用实战教程!小参数推理模型榜一!

在AI大模型军备竞赛中,阿里云近期推出的QwQ-32B推理模型引发了行业震动。这款仅320亿参数的稠密模型,在数学推理(AIME24)和代码能力(LiveCodeBench)等核心指标上,竟与6710亿参数的DeepSeek-R1不相伯仲。QwQ系列的诞生,不仅验证了大规模模型通过强化学习持续精进推理能力的可能性,更揭示了未来AI走向“工具化思考”(Tool-Aware Reasoning)的全新方向。

2025-04-01 10:29:41 957

原创 DeepSeek-R1 14b本地部署测试:详细系统概述与实时性能洞察

这篇文章测试14b模型,快速引导你完成在本地运行DeepSeek模型的安装过程,并分享一个在笔记本电脑上的性能测试供你参考。让我们开始吧。

2025-03-31 22:29:13 659

原创 2025风口指南:万字长文带你吃透大模型Agent,涵盖应用、场景与发展,收藏这一篇就够了!!

2025年,科技领域暗流涌动,一个神秘而又充满潜力的发力点正悄然崛起——Agent!如今,基础模型的能力正以惊人的速度进化,而今年的AI Agent也毫无悬念地成为了热门话题的“宠儿”。更令人瞩目的是,众多最新的学术研究都紧紧围绕着Agent展开,这背后究竟隐藏着怎样的科技密码和发展机遇?

2025-03-31 21:04:07 640

原创 DeepSeek本地部署+知识库+联网搜索,终极版方案,保姆级教程!

Docker的安装挡住了90%的人,本地部署不能联网搜索等等。今天就来解决这些问题,一个本地部署+私人知识库+联网搜索的终极方案。

2025-03-30 08:00:00 878

原创 基于AnythingLLM 与 本地DeepSeek大模型,零门槛构建企业级本地 AI 知识库

在数据隐私日益重要的今天,企业及开发者对本地化AI解决方案的需求激增。本文将手把手教你如何通过开源工具AnythingLLM与Ollama,无需云端依赖、完全免费地搭建基于DeepSeek大模型的本地知识库系统,实现数据100%自主掌控的智能化升级。 

2025-03-29 15:57:25 230

原创 关于智能体Agent的实现技术之思维链和函数调用(function call)的思考,看到就是赚到!!

“ 智能体是未来人工智能的一个重要应用技术,而其难点就在于怎么让大模型具备更好的独立思考和任务拆解与规划的能力。”Agent技术也被业界称为智能体技术,本质上是使得大模型具备独立思考和解决问题的能力;被广泛应用于各种应用场景,而且也被称为是实现通用人工智能的一种技术手段。但在此之前对于智能体的理解比较肤浅,而今天突然发现原来智能体没我们想象中的那么简单,也没想象中的那么复杂。今天我们就从Agent的两个实现技术之思维链和函数调用来重新理解智能体。

2025-03-29 10:06:54 628

原创 【AI大模型】什么是自然语言处理——NLP,其解决了什么问题?

“ 自然语言处理是一门让机器理解人类语言的技术,是人和机器交流的桥梁 ”自然语言处理(Natural Language Processing, NLP)是人工智能(AI)的一个分支,旨在让计算机能够理解、生成和处理人类的自然语言(如中文、英文)。NLP 的目标是让计算机能够像人类一样理解和使用语言,从而实现人机自然交互、自动化信息处理等功能。

2025-03-28 15:13:40 724

原创 企业级RAG全解析:实现精准、安全、高效智能客服,收藏这一篇就够了!!

随着金融行业数字化转型的加速,银行需要高效处理海量非结构化数据(如合同、政策文件、客户咨询记录等),同时确保服务的安全性、合规性与智能化。基于RAG技术构建的企业级系统,能够将传统检索与生成式AI结合,为银行提供精准、安全的智能服务。 以下结合银行业务场景,详解其核心流程与技术实现。

2025-03-28 10:56:15 637

原创 AI时代程序员何去何从?提升自我还是被淘汰出局!

AI 在编程界的使用变得越来越普遍了。随着 ChatGPT 的横空出世,各种大语言模型如雨后春笋不断出现。国外如谷歌 Bard、Anthropic 的 Claude,国内如Deep Seek、百度文心一言、阿里通义千问、讯飞星火认知大模型、昆仑万维天工大模型等。想想看,以前得花好几个小时,甚至好几天才能搞定的代码,现在 AI 分分钟就给你整出来。这事儿听起来像科幻小说里的场景,但实际上它就在我们眼前发生。当这些自动化工具能这么麻溜且高效地干我们的活儿时,你有没有想过,作为程序员的我们,究竟还有多少价

2025-03-27 11:52:03 763

原创 通过Agent智能体复现DeepResearch工作原理,收藏这一篇就够了!!

问题理解与规划:Agent首先理解用户提出的问题,然后规划出解决问题的步骤和需要使用的工具。信息收集:Agent使用搜索工具从网络上收集与问题相关的信息。数据处理与分析:Agent对收集到的信息进行处理和分析,提取关键内容和数据。报告生成:Agent根据分析结果生成报告,并嵌入图表和引用等。用户交互与反馈:Agent与用户进行交互,获取用户的反馈,并根据反馈调整工作流程。

2025-03-27 10:51:07 355

原创 30天如何成功转行成为AI产品经理?如果你也想转行到AI,赶紧进来抄作业!!!

随着AI技术的快速发展,AI产品经理成为了备受瞩目的职业。如果您也想抓住这个机遇,不妨跟随这份30天快速入门指南,开始您的AI产品经理转型之旅。

2025-03-26 18:32:46 686

原创 准确率90%+!聊聊RAG的取代技术KAG,收藏这一篇就够了!!

现阶段做AI应用来说,想解决不光是模型问题,还想让AI回答得更好,而回答得更好,就需要借助外部知识库,从而诞生了RAG这个技术。RAG是一个融合了基于检索和基于生成模型优势的框架。它会从知识库中检索相关的外部信息(通常是文档或段落),并依据这些信息,组装提示词,而后模型会针对用户的查询生成更精准、上下文更丰富的回答。

2025-03-26 10:25:45 882

原创 大模型面试遇到RLHF,说明已成功一半!

本文基于 huggingface 源码,对 RLHF 的实现过程做一个比较通俗的讲解。我将尽量避免使用过多的强化学习专业术语,重点在于解析如何实现一个 PPO 算法。

2025-03-25 15:13:03 544

原创 DeepSeek+RagFlow搭建企业级知识库:Docker镜像构建基础篇

随着AI技术的火热发展,企业和个人用户需要搭建知识库的需求越来越迫切。如果自己动手搭建一个功能强大的知识库对于非专业技术人员来说可能面临挑战,更别说那些非专业人士了。我在网上看了大量相关的教程,大多数都是搬砖,偶尔看到一些非搬砖大佬写的教程,总会省略一些细节,导致很多人就算面对教程也是各种踩坑,折腾很久最后也都放弃了。

2025-03-25 11:24:57 1134

原创 AI大模型时代,大龄程序员如何转型突破,抢占技术高地?

在信息技术迅速发展的今天,程序员作为技术的创造者和实践者,面临着前所未有的挑战。一方面,技术的迭代速度越来越快,传统项目的生命周期缩短,另一方面,随着人工智能(AI)尤其是大模型技术的兴起,许多程序员发现自己需要不断学习新的技能才能跟上时代的步伐。这种持续的技术更新换代给程序员带来了巨大的压力,甚至有人担心自己会在35岁前面临职业的“毕业”。

2025-03-24 14:20:18 842

原创 为什么说Agentic RAG是RAG领域的王者?看完这一篇你就懂了!!

虽然传统RAG系统在知识检索和生成方面表现出色,但是在实际应用场景中我们已经不满足于只是生成对应的简单回答,而是期待大模型能够在处理动态、多步推理任务、适应性和复杂工作流的编排方面更好地应用于企业级场景。

2025-03-24 10:37:22 618

原创 【AI大模型】探索提升RAG系统问答质量的技术路线,收藏这一篇就够了!!

Query Translation 将用户的自然语言查询转换为更适合检索和生成的形式。在这个过程中,系统将原始查询转化成一种或多种可以提升信息检索效果的形式,确保系统能够更有效地从不同的数据源中提取相关信息。

2025-03-23 08:00:00 840

原创 【AI大模型面经】腾讯实习AI大模型岗位 (已offer),看完手撕面试官,非常详细收藏我这一篇就够了

学校情况:211本中9硕,本硕都是计算机科班,但研究方向并不是NLP,而是图表示学习论文情况:1A(NeurIPS)+1B(ICDM)已发表,另有1A刊在投,除此之外,还有1A会撰写中,所有论文均为一作实习情况:一段快手推荐算法实习奖学金情况:本硕国家奖学金

2025-03-22 15:21:58 840

原创 彻底搞懂大模型“预训练”和“微调”两个概念,建议收藏起来慢慢看!!!

预训练模型和模型微调是深度学习领域中两个重要的概念,它们在提升模型性能和适应新任务方面发挥着关键作用。今天把这2个基础概念用通俗易懂的和大家展开来介绍下。

2025-03-22 10:34:28 929

原创 GitHub标星破百万!AI大模型面试八股文(超详细)真的太强了!

众所周知AI大模型是现在乃至为了发展必不可少的关键,现在互联网公司不管大厂小厂都在大量招聘AI大模型工程师,而且给的薪资都非常高!

2025-03-21 13:57:58 713

原创 看完这一篇终于把 Transformer 中的注意力机制搞懂了!!建议收藏起来学!!

其核心思想是使用注意力机制来处理输入序列中的每个元素与其他元素之间的关系,从而捕捉全局的依赖关系。Transformer 中的注意力机制有几种形式,包括自注意力机制、多头自注意力机制、掩蔽自注意力机制和交叉(编码器-解码器)自注意力机制。

2025-03-21 10:24:23 932

原创 今年这情况,建议程序员都早做转行AI大模型的准备吧!

Salesforce老板豪言今年停招软件工程师,微软即将开启2025年裁员计划,Aqua Security计划裁掉数十人,Ally将裁减约500人,Altruist计划裁员37人……世界经济论坛最近的一份报告预计,未来5年内,全球约41%公司将因AI的兴起而缩减员工。去年12月,OpenAI公布了o3在代码方面的巨大进步。

2025-03-20 14:53:49 787

原创 本地部署DeepSeek+DiFy平台构建智能体应用,零基础小白收藏这一篇就够了!!

在大模型实际应用落地时候,利用智能体平台,构建本地的向量化知识库,基于RAG知识增强技术和大模型的推理能力,提升效率。本文简要介绍RAG、大模型微调和大模型蒸馏的特点,通用智能体平台,并在本地部署DiFy智能体平台,利用本地部署的DeepSeek模型和知识库构建智能体应用。

2025-03-20 10:27:14 934

原创 小白变大神!2025年AI大模型学习路线图,轻松从入门到高手!

随着人工智能技术的飞速发展,大模型如DeepSeek,GPT-4、Transformer-XL、T5等已经在自然语言处理、计算机视觉、语音识别等领域取得了显著成果。许多对AI充满热情的朋友都渴望进入这个领域,却因为零基础而感到迷茫。本文将为你提供一份2025年最新最全的大模型学习路线规划,帮助你从零基础入门到精通。

2025-03-19 13:55:24 444

原创 LLM大模型: RAG两大核心利器 — embedding和reranker模型微调fine-tune

要想RAG好,embedding和reranker必须给力!目前市面上流行的embedding和reranker使用的都是通用预料训练,并未针对安全这个细分领域定制,所以有必要使用安全领域的预料微调一下!目前所有的预料中,获取成本比较低、并且不需要专门投入人力标注的有两种:

2025-03-19 10:11:49 704

原创 Java程序员AI逆袭:不拼数学,照样玩转AI大模型!

java又怕被时代给淘汰掉。很多人都觉得转AI必须要去重学去死磕算法,就业的学历门槛也是高上的天其实根本就不是这么回事。搞AI工程化才是java程序员的优势。作AI不换语言。java就可以。现在的java生态完全能够撑得起。

2025-03-18 11:54:16 292

原创 三分钟让Dify接入Ollama部署的本地大模型!全程干货,零基础小白也能轻松掌握!!

Embedding 模型接入方式与 LLM 类似,只需将模型类型改为 Text Embedding 即可。2.2 使用 Ollama 模型进入需要配置的 App 提示词编排页面,选择 Ollama 供应商下的 llava 模型,配置模型参数后即可使用:

2025-03-18 10:41:53 1003

原创 完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!建议收藏起来慢慢看

关于本地部署,大多数人使用的是蒸馏后的 8B/32B/70B 版本,本质是微调后的 Llama 或 Qwen 模型,并不能完全发挥出 DeepSeek R1 的实力。然而,完整的 671B MoE 模型也可以通过针对性的量化技术压缩体积,从而大幅降低本地部署门槛,乃至在消费级硬件(如单台 Mac Studio)上运行。

2025-03-17 10:47:48 882

原创 RPA与生成式AI融合的三种方向|认识与探索大模型时代的RPA应用及进化 【下】

我们简单普及了RPA的概念与基础技术,并且基于开源框架构建了一个RPA机器人演示了RPA流程自动化的基本过程。虽然传统RPA仍然是一个以UI自动化为主的智能技术,但是随着深度学习等AI技术的不断发展,RPA也在不断尝试利用新的AI技术来弥补自身的不足,比如借助OCR技术的自动文档处理等。而随着生成式AI的火爆出圈(Gen-AI),RPA与基于大模型的生成式AI之间又会擦出怎样的火花呢?

2025-03-16 08:00:00 1008

原创 深度:认识与探索大模型时代的RPA应用及进化 【上】

必须说,AI Agent当前仍然处于技术爬坡与实验阶段,特别是在企业领域,真正的成熟应用还处于广泛探索与原型验证阶段,离成熟还尚待时日。而同时另外一种在最近几年广受欢迎的自动化解决方案-RPA(机器人流程自动化)也在LLM时代不断升级进化。本文将尝试结合理论与实例来梳理与探讨RPA在LLM影响下的应用与发展。

2025-03-15 08:00:00 957

原创 AI大模型大厂面经——LoRA面试题最全总结,看到就是赚到!!

大家的显卡都比较吃紧,LoRA家族越来越壮大,基于LoRA出现了各种各样的改进,最近比较火的一个改进版是dora,听大家反馈口碑也不错。基于PEFT的话用4090 24G显存也可以进行大模型的微调,所以LoRA家族这块还是很有研究和实际落地的潜力。

2025-03-14 15:06:38 931

原创 AI+医疗服务,能否进化出新形态?

在医疗服务领域,谈及科技革新就绕不开AI。2024年的全国两会上,《政府工作报告》提出,要深化大数据、人工智能等研发应用,开展“人工智能+”行动。从曾经的“互联网+”到现在的“人工智能+”,一个简单的词汇变化折射出数字技术浪潮的翻腾速度。

2025-03-14 10:18:37 852

原创 多跑一些AI产品经理面试,你就会发现......

现在AI产品经理面试还是挺水的,想要拿到offer是不难的。我也是0基础转AI产品经理的,之前差不多面试了七八家公司,问的问题基本都差不多,我朋友去面试的前就问了我,我给了她一些资料,面试了2.3家,每一家都收到了offer,给了自己挑选的空间。但是切记经验不够时不要去那种小公司,根本学不到什么东西的!其实很多公司的面试题都是一样的,今天也给大家整理了一份、AI产品经理高频面试题,有需要的宝快收藏起来,慢慢看!!

2025-03-13 16:09:31 503

原创 DeepSeek接入Manus,开发速度飞快,确实可以封神了!

近几天有读者问我Manus,比如Manus是比DeepSeek更好的AI吗?Manus到底有技术突破吗?今天这篇文章解答下大家普遍关心的Manus问题,会以一个生动的例子帮助大家更好理解。

2025-03-13 11:22:28 584

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除