自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1276)
  • 收藏
  • 关注

原创 手把手教你打造AI医疗大模型的微调实战指南

大型语言模型(LLMs)在医疗健康领域潜力巨大,但通用模型缺乏医疗专业知识,难以达到临床应用的严谨标准。本文将简明介绍如何通过微调技术,构建具备专业医生回复特征的大模型,为医疗机构和健康平台提供精准的智能问诊服务。一、为什么需要医生风格的大模型微调?❌ 专业术语理解不足:对医学术语、药物名称、疾病分类等专业知识掌握不全面❌ 回复风格不匹配:缺乏医生特有的专业、严谨且富有同理心的表达方式❌ 循证医学依据不足:回答可能缺乏最新临床指南和研究支持。

2025-03-31 21:19:16 727

原创 一种在本地部署Qwen通义千问大模型的超简单方法-兼容OpenAi接口

有很多开源大模型都可以本地部署,用于替代 chatGPT 实现本地执行各种任务,比如国内较好的全尺寸模型。在一般的翻译、文案创作、辅助编码等任务上,基本达到了ChatGPT3.5的水平。

2025-03-31 21:15:41 851

原创 太绝了!字节内疯传的380页《从零开始大模型开发与微调基于PyTorch与ChatGLM》大模型必备书籍!

大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch 2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。## 目录。

2025-03-28 11:41:46 1110

原创 DeepSeek+ragflow构建企业知识库之工作流,突然觉的dify又香了

我们按照下图的数据介绍组件。• ragflow的的官方文档相对来说还是比较欠缺的,特别是用户交互这块。• ragflow的ui使用成本相对比较高,组件不知道返回什么,只能根据示例或意图推断• 使用ragflow建议是有技术底子的• 英文文档的描述习惯和中文还是有很大的差别的说实话,用着有点崩溃,哈哈。

2025-03-28 11:40:51 1004

原创 DeepSeek(私有化)+IDEA+Dify+微信 搭建AI助手保姆级教程

1.点击Dify 平台首页左侧的"创建空白应用",选择"聊天助手"类型应用并进行简单的命名。1.选择 Ollama 框架内的。

2025-03-28 11:38:38 761

原创 我花了5分钟,成功部署阿里QwQ-32B,秒出的感觉太爽了

真的特别需要,尤其是对于我这种每天对接各种群各种需求消息回不完的人——仔细看一下这份**「群聊精华总结」,从今天早上 7 点半到 11 点半 family 群里一共有 111 条消息,讨论的热门话题**No.1 是「Qwen-32B 模型性能与推理特点」,No.2 是「Manus 模型评测和技术分析」。Manus 昨天平地一声雷炸的圈子里的好多人都头脑发热了,官方和一些带节奏的人估计都度过了难忘的一天。今天圈子终于开始有点回归理性了。其实昨天我们的文章里《

2025-03-26 15:54:02 830

原创 Word接入DeepSeek r1,轻松实现智能文本生成与润色

之前我曾利用Word的VBA宏接入ChatGPT 3.5的API。然而,由于OpenAI对中国大陆地区的限制,这一方案难以持续使用。随后出现的大型语言模型要么难以调用,要么收费昂贵。如今,随着DeepSeek的开源,结合Word这一办公常用场景,我决定将DeepSeek模型接入Word,实现文本生成和文本润色两大功能。通过VBA调用英伟达的API(具体获取方式之前已提到多次不再赘述),采用非流式生成方式。用户只需选中文字并点击模块名称,稍等片刻即可生成结果。该模块基于推理文本模型,并保留了模型的思考过程。

2025-03-26 15:45:50 998

原创 RAG中的5种文档切分策略:动态图示清晰解析

每种分块技术都有其自身的优点和权衡。在许多情况下,我发现语义分块的效果相当不错,但仍然需要实际测试。选择哪种策略取决于数据的特性、嵌入模型的能力、计算资源等因素。

2025-03-26 15:43:49 1065

原创 AI大模型神书安利:《多模态大模型:技术原理和实战》(免费附送PDF电子版)|大模型技术|LLM|多模态大模型|大模型实战

内容概述:引入多模态大模型的概念,探讨其技术挑战与解决方案。关键要点:多模态数据的表示、融合与对齐技术。内容概述:总结全书内容,提出对未来研究的建议与展望。这本大模型书籍PDF电子版我会免费分享出来,需要的小伙伴可以扫取。

2025-03-24 13:48:10 804

原创 手把手教你完成句子分类,最好上手的BERT初级使用指南

过去几年里,机器学习语言处理模型的发展十分迅速,已经不再局限于实验阶段,而是可以应用于某些先进的电子产品中。举个例子,最近谷歌官宣,称BERT模型已经成为其搜索产品背后的主要动力。谷歌认为,这一进展(即自然语言理解应用于搜索领域)是过去五年中机器学习领域的最大进步,也是搜索史上的最大进展之一。Jay Alammar小哥最近又发了一篇新文,简要介绍了如何使用BERT模型来完成句子分类任务,作为基础性入门教程,深入地展示了相关的核心概念。

2025-03-24 13:46:27 915

原创 10 分钟,使用 Langchain实现一个AI法律助手

是一个用于构建基于大语言模型 (LLM) 应用程序的开发框架,它提供了一系列功能模块,帮助开发者快速构建和部署复杂的自然语言处理应用。

2025-03-24 11:30:44 632

原创 RagFlow与DeepSeek R1本地知识库从0到1搭建指南

在某些情景下创建本地知识库有一些需求,现在以Deepseek R1与 RAGFlow搭档,组建一个本地企业级知识库。关于本地知识库和微调有一些区别,本地知识库操作起来更简单,但不如微调的效果好,成本比微调便宜。RAGFLow是一个可以构建知识库的应用,整体的流程是在docker中部署RAGFlow展开,配置嵌入模型,填加大语言模型,本地的ollama或者调用api,创建知识,再到具体应用。💡:Docker安装是基础步骤,如已安装可直接跳至第二部分。

2025-03-22 12:00:52 1299

原创 2024年中国AI大模型场景探索及产业应用调研报告|附47页PDF文件下载

四、未来发展趋势 报告预测了AI大模型技术的七大发展趋势,包括技术层面的预测和决策大模型的发展,竞争格局的变化,应用场景的多元化,以及金融、电商、教育和医疗等行业的深入应用。五、发展建议 报告提出了针对AI大模型行业的发展建议,包括加强安全监管、推动商业化应用、构建开源生态和加速人才培养等方面,旨在为行业创新和发展提供指导。是一份深入剖析中国人工智能大模型领域发展的综合性报告。综上所述,这份报告不仅为我们提供了中国AI大模型行业的最新动态和深入分析,也为未来的发展方向和政策制定提供了宝贵的参考。

2025-03-22 11:57:01 247

原创 使用 DeepSeek 和 Ollama 搭建一个本地知识库系统(文末包含完整代码)

用这个系统,你可以轻松地从 PDF 里提取信息,像跟人聊天一样问问题。赶紧试试吧,释放 AI 的潜力!完整版代码放在下方二维码↓↓↓。

2025-03-21 11:36:44 1377

原创 新手福音!Deepseek+ollama 超级简单的本地部署种草方案

目前本地部署的 Deepseek R1 的 1.5B 等小参数模型基本是将推理能力提炼到 Qwen 或 Llama 的蒸馏版本,性能是远远比不上官网的版本的,你可以根据你自身的情况判断是否需要本地部署。

2025-03-21 11:15:14 964

原创 《Manus没有秘密——70页PPT解读AI Agent》深度解析:当智能革命照进现实,附PDF免费下载!

真正推动进步的,不是已知领域的重复建设,而是对未知疆域的勇敢探索。——明浩在复盘AI Agent进化史时,如是说。保证100%免费👉 福利来袭👈当撰写《DeepSeek启示录》时,对Agent的认知仍停留在"空中楼阁"的想象中。直到Manus的出现,这场技术革命终于撕开了神秘的面纱。正如我在播客首章所言:“昨天的空泛,恰是今天的清醒。“2025年不是AI Agent元年,而是AI Agent的觉醒之年。

2025-03-21 11:12:44 847

原创 AI里的RAG到底是什么?如何低成本搭建企业AI智能体

AI大模型如deepseek本地部署的成本相对较低,如果要训练,微调大模型,则需要非常多的显卡,与很多时间,那一般企业无法投入那么多钱去买显卡,怎么办?通过RAG与本地部署来提升大模型的专业知识RAG(Retrieval-Augmented Generation,检索增强生成)是一种将与结合的AI技术范式,通过动态引入外部知识提升大模型输出的准确性和时效性。工作流程mermaid语义检索:将用户Query和知识库文档编码为向量,计算相似度(如余弦相似度)知识重排序。

2025-03-20 14:28:59 568

原创 文科生的我用 DeepSeek+AI 程序员半小时开发了一个小程序

有时候我突发奇想要做个小工具,但是碍于不会编程,没办法进行下去。但是学习编程要花很长时间,而且以我的水平,还不一定学得懂。我就在想,能不能通过 AI 生成一个网页、小程序或者 App 呢?经过实战手搓,发现真的可以!正好我看见了通义灵码的“AI 程序员”有了 DeepSeek 推理模型的加持,通义灵码在代码等方面就更强了!它自带两种模式,一个是智能问答模式,一个是“AI 程序员”模式,智能问答模式适合有一定编程基础的人员,“AI 程序员”模式适合什么都不会的小白。今天我就给大家演示一下,一个。

2025-03-20 14:26:26 1181

原创 RAG技术:20种方法源码解读与实践

检索增强生成(RAG)是一种结合信息检索与生成模型的混合方法。它通过引入外部知识来提升语言模型的性能,从而提高回答的准确性和事实正确性。与传统的固定长度分块方法不同,语义分块会根据句子之间的语义相似性来确定分块的边界。这种方法通过计算句子嵌入向量的相似度来确定分块。当句子之间的语义相似度低于某个阈值时,就会将文本划分为不同的块。例如,可以使用滑动窗口技术计算句子之间的语义相关性。CCH通过在每个分块的前面添加高级别的上下文信息(例如文档标题或章节标题),然后再对分块进行嵌入处理。

2025-03-20 14:20:42 866

原创 本地部署DeepSeek+DiFy平台构建智能体应用

*RAG(Retrieval-Augmented Generation)检索增强生成是一种将外部知识检索与大语言模型生成能力结合的混合架构。**其核心思想是通过检索外部知识库(如文档、数据库、网页等),弥补大模型静态训练数据的局限性;在生成答案时直接依赖检索到的证据,减少模型凭空编造内容的可能性,降低幻觉风险。RAG无需重新训练模型,仅需更新知识库即可适配不同专业领域(如医疗、法律)。类似将大模型视为一个“推理专家”,而RAG系统为其配备了一个“实时资料库助手”。

2025-03-18 16:22:15 963

原创 将自然语言转换为 SQL:在 5 个步骤中使用 crewai 构建强大的查询工具

在当今数据驱动的世界中,无需编写复杂 SQL 即可查询数据库的能力变得越来越有价值。想象一下,用简单的英语向数据库提问,然后获得格式化的结果。这正是我们将在本文中探讨的内容:使用 CrewAI 构建一个自然语言到 SQL 查询工具。CrewAI 是一个用于编排角色扮演自主 AI 代理的框架。它允许您创建一个由专业 AI 代理组成的团队,这些代理可以协同工作以完成复杂的任务。在我们的案例中,我们将创建一个代理团队,该团队可以将自然语言查询转换为 SQL,针对数据库执行它们,并以人类可读的格式返回结果。我们的应

2025-03-18 16:14:18 886

原创 大模型私人定制:5分钟教你不写一行代码微调构建属于你的大模型(使用llama-factory微调Qwen大模型)

训练时为保证大模型的通用能力会使用多类别数据,例如:数学类别,代码类别数据等等来训练。训练后的大模型是一个“博学家”,具备回答所有类别基础问题的能力,但是在面对更深度的专业领域问题时,大模型的表现往往一般。为了让大模型在某个专业领域具备突出能力,需要使用专业领域的数据集,对大模型进行进一步的参数微调(继续训练),提升它在专业领域方面的表现。大模型微调分为全参微调和高效微调,全参微调就是将大模型所有层的参数进行微调,优点是可以充分利用已有大模型的特征,缺点是调整全部参数需要消耗大量的计算资源。

2025-03-17 15:30:34 921

原创 DeepSeek+dify 本地知识库:高级应用Agent+工作流

工作流通过将复杂的任务分解成较小的步骤(节点)降低系统复杂度,减少了对提示词技术和模型推理能力的依赖,提高了 LLM 应用面向复杂任务的性能,提升了系统的可解释性、稳定性和容错性。一个完整的工作流,必须具备。

2025-03-17 15:27:50 2169

原创 Hugging Face核心团队亲自解密Transformer!建议想学习Transformer的每个人至少读一遍!

通过这些内容,读者不仅能够掌握 Transformer 模型的使用,还能理解如何在实际项目中有效地应用这些技术。总的来说,这本书是一本非常实用的资源,适合那些希望深入了解和应用 Transformer 模型的开发者和研究人员。此外,书中还提供了丰富的代码示例和实战案例,帮助读者理解和应用所学知识。此外,书中还提供了丰富的代码示例和实战案例,帮助读者理解和应用所学知识。通过本书,您将学习如何有效地应用这些技术,以提升您的NLP项目性能。除了技术细节,这本书还讨论了 NLP 中的一些挑战和最佳实践,如。

2025-03-12 11:05:47 875

原创 大神Karpathy亲授!最新LLM入门视频课!

最后,Karpathy 再次总结了整个视频的核心内容,回顾了 LLM 的训练流程 (预训练、SFT、RL),强调了 LLM 的本质是 token 序列生成器,以及其能力的局限性和“瑞士奶酪”特性。强调要将 LLMs 作为工具使用,谨慎对待其输出,并保持批判性思维。同时,也展望了 LLM 技术的未来发展,以及 RL 在推动 LLM 发展中的重要作用。

2025-03-12 11:03:21 713

原创 超三成AI岗位年薪超50万,这个行业开始抢人

一种神秘力量吸引着“顶级天才”的选择技术理想主义、组织文化、团队实力、资金等都是有关因素在DeepSeek掀起的国内AI热潮下,今年的春招刚启动,最具话题度的行业已经出现了。据智联招聘日前发布的《2025年春招市场行业周报(第一期)》,春招首周,人工智能行业求职人数同比增速达33.4%,位居行业第一;人工智能工程师的求职增速达69.6%,位居职业榜首,平均招聘月薪超过2万元。周盛是一名计算机专业的硕士生,即将在今年毕业。

2025-03-11 11:37:05 991

原创 医疗大模型:数据+知识双轮驱动实现医学推理、医患问答、病历自动生成、临床决策,为未来医疗服务提供全新可能性

目前大多数开源的ChatLLM项目使用的是其他模型(如:ChatGPT)生成的指令数据,其不可避免的存在数据幻想的问题,数据幻想问题将严重影响LLM在实际场景中的应用和拓展。

2025-03-11 11:32:32 1032

原创 2024年小结:从大模型算法工程师面试官的角度,聊聊今年就业情况

文章的原因。然而。

2025-03-10 11:32:03 919

原创 大模型中的提示词(prompt)压缩:让每个Token都物尽其用

提示词压缩(

2025-03-10 11:28:09 889

原创 大模型(LLM)工程师实战之路(含学习路线图、书籍、课程等免费资料推荐)大模型零基础到精通,看这篇就够了,赶紧收藏!!

新春佳节,蛇年大吉!愿您在新的一年里,生活如蛇行般灵动自如,事业似蛇舞般活力四射。蛇年,愿您福运缠身,财源广进,家庭和睦,幸福安康!

2025-03-10 11:26:12 994

原创 一分钟教会你将DeepSeek接入到微信(附DeepSeek使用教程)

可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。的爆火,远不止于此。

2025-03-08 11:45:29 1826

原创 2025最新最全大模型学习路线 | 自学大模型还来得及吗❓从零基础到精通,只看这一篇,速速收藏!!!

大模型学习路线保证100%免费👉 福利来袭👈✅第一阶段:理解大模型第二阶段:大模型提示工程✅✅6. LangChain开发实践2. Agents智能体架构7. 实战项目七:基于图片的智能信息检索问答8. 实战项目八:无人数字人直播机器人客服9. 实战项目九:基于Agents打造AI模拟面试机器人✅11. 开源模型与私有化模型12. 模型微调Fine-Tuning3. 实战:医疗领域智能医生私有模型13. 开源大模型微调14. 多模态6. 实战。

2025-03-08 11:42:29 920

原创 Agent四大范式 | 综述:全面理解Agent工作原理,零基础到精通,看这边就够了,赶紧收藏!!!

Autonomous agents 又被称为智能体Agent。能够通过感知周围环境、进行规划以及执行动作来完成既定任务。在这些能力中,规划尤为重要,它涉及到复杂的理解、推理和决策制定。大语言模型出现以前,我们一般通过规则的方法,或者强化学习的方法来实现。规则的方法是指把复杂的自然语言问题转化为规则符号,往往需要行业专家的介入,缺乏容错能力,小错误可能导致整个系统的失败。而强化学习一般是构建策略网络或奖励模型,但是一般需要大量样本进行训练,但是收集数据往往成本很高,所以这种方法可行性不大,很难推广开来。

2025-03-07 17:51:37 1535

原创 火爆中文圈的Manus 智能体到底是什么,它还能火多久?

我早上看到 manus 的消息,立刻去官网申请,目前还没拿到。全网媒体报道刷到很多,但少有AI 从业人士的专业评价。最早的媒体稿曾声称,manus 得到大量海外关注。实际在 X 上,manus 的传播声量并不大。仅有的消息和评论,基本都来自海外华人,或者出海国人。manus 号称在 GAIA 的测试中全面超过OpenAI,智慧程度达到目前智能体的顶峰。这套说辞马上就被善于抓热点的自媒体转化成“情绪点”,以“遥遥领先”的方式进行传播。

2025-03-07 17:46:19 900

原创 一文看懂Manus:实测体验+开源复刻方案,无需等待邀请码

很多朋友在问这个智能体产品的问题。用通俗的说法来理解:ChatGPT就像城市里的大型公共厨房,想做饭得去那里排队用他们的炉灶。而DeepSeek则像是家用电饭煲,公司能买得起,放在自己办公室就能用。Manus呢?过去用ChatGPT就像是你得手把手教厨师做菜:“先切菜,再放油,然后炒…”,每一步都得你指导。而Manus就像是升级版的私人厨师,你只需说:“我想吃红烧肉”,厨师自己就能完成从采购食材到烹饪再到摆盘的全过程,直接端出一盘香喷喷的成品。你完全不用管中间步骤,只管享用结果。

2025-03-07 17:44:06 1147

原创 一文读懂 Transformer,工作原理与实现全解析,从零基础到精通,只看这一篇,赶紧收藏!!!

循环神经网络和长短期记忆网络已经广泛应用于时序任务,比如文本预测、机器翻译、文章生成等。然而,它们面临的一大问题就是如何记录长期依赖。为了解决这个问题,一个名为 Transformer 的新架构应运而生。从那以后,Transformer 被应用到多个自然语言处理方向,到目前为止还未有新的架构能够将其替代。可以说,它的出现是自然语言处理领域的突破,并为新的革命性架构(BERT、GPT-3、T5等)打下了理论基础。Transformer 完全依赖于注意力机制,并摒弃了循环。

2025-03-06 18:07:48 967

原创 求职产品经理,该如何选择岗位和做准备?

或者说如何理解产品?(面试高频问题)

2025-03-05 11:26:52 1050

原创 最全梳理:一文搞懂RAG技术的5种范式!

高级 RAG 引入了具体的改进措施,以克服 Naive RAG 的局限性。为了提高检索质量,它采用了检索前和检索后策略。为了解决索引问题,高级 RAG 通过使用滑动窗口方法、细粒度分割和元数据的整合,改进了索引技术。此外,它还采用了多种优化方法来简化检索过程。模块化 RAG 架构超越了前两种 RAG 范式,具有更强的适应性和多功能性。它采用了多种策略来改进其组件,例如为相似性搜索添加搜索模块,以及通过微调完善检索器。为应对特定挑战,还引入了重组 RAG 模块和重排 RAG 管道等创新方法。

2025-03-05 11:24:38 1119

原创 没有大模型经验,可以搞大模型吗?当然可以!做大模型一年半,经历了无数场面试。

对于学生来说,首要的自然是学习。学校背景如何、专业课成绩如何、基础知识是否扎实?面试时遇到学生,经常碰到的尴尬场面是:问数学题(高数/线代/概统),答曰大一学的忘了;问编程题(leetcode easy/medium 难度),答曰没刷题写不了;问模型结构(指 LLaMA),答曰平常都是调 ChatGPT API,不清楚。相当一部分候选人是答不上来 transformer 模型结构的——一半人承认自己不清楚细节,另一半人里 90% 是自以为自己知道、但实际不知道。

2025-03-03 18:00:39 723

原创 大模型面经——整理RAG基础与实际应用中的痛点

谈到大模型在各垂直领域中的应用,一定离不开RAG,本系列开始分享一些RAG相关使用经验,可以帮助大家在效果不理想的时候找到方向排查或者优化。本系列以医疗领域为例,用面试题的形式讲解RAG相关知识,开始RAG系列的分享~本篇主要是理论知识与经验;后续会结合最新的优化方法给出详细的优化代码,和实践中衍生的思考。下面是本篇的快捷目录。\1. RAG思路\2. RAG中的prompt模板\3. 检索架构设计这里有一张经典的图:已知信息:{context}

2025-02-27 17:41:19 805

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除