- 博客(104)
- 资源 (1)
- 收藏
- 关注
原创 企业级大模型算法工程师培训
蔚 ❤ 15246115202 速来掌握大模型技术。大模型的稳定性直接影响企业应用的可靠性,需要。,优化业务流程,提高自动化能力。数据是大模型训练的基础,涉及。,可以提升准确性、降低幻觉。企业级大模型培训涉及。(适合企业内网环境)
2025-04-03 14:28:59
417
原创 结合知识图谱和社区检测的文档分割
引言文档分割是将文本划分成有意义且连贯的段落的任务,在众多自然语言处理(NLP)应用中起着至关重要的作用。这些应用包括通过允许在相关文档部分内进行聚焦搜索来提高信息检索系统的效率,通过识别关键主题单元来提高文本摘要的准确性,以及通过隔离文档内的不同主题来改进主题建模。传统的文档分割方法通常依赖于基于规则的方法或词频和分布等统计特征,但在捕捉文本内潜在的主题转变的更深层语义连贯性方面有时会不足。认识到这种局限性,人们越来越有兴趣利用更复杂的技术来实现更具语义信息的文档分割方法。本报告探讨了结合知识图谱和社区检
2025-03-31 14:44:51
357
原创 支持 MCP 协议的开源 AI Agent 项目
MCP 协议由 Anthropic 于 2024 年 11 月开源,旨在标准化大型语言模型(LLM)与外部数据源和工具的交互。它采用客户端-服务器架构,允许 AI 模型通过统一接口访问各种资源,如数据库、API 和本地文件。这种协议的开放性鼓励了开发者社区的创新,尤其是在构建自主 AI Agent 方面。
2025-03-28 16:51:55
1304
原创 【无标题】
总结一下,今天我们沿着Word2Vec、LSTM、Transformers、GPT、BERT、LLaMA到Grok的路线,看到了NLP从词到智能的演进。这些技术推动了智能体的发展,尤其在医疗领域。课程到此结束,有没有最后的问题?总结一下,今天我们追溯了智能体架构从经典反射到现代语言驱动的演进,看到了技术的积累与突破。这些架构支撑了医疗AI的发展。课程到此结束,有没有最后的问题?总结一下,今天我们探索了智能体与人类的交互演进,从命令到协作,在医疗中潜力巨大。未来,交互将更自然、更智能。
2025-03-26 14:46:09
557
原创 医疗大模型课程从ReAct机制到多智能体再到通用智能体
ReAct的全称是“Reasoning + Acting”,也就是推理加行动。它是一种AI代理的工作方式,要求代理在采取行动前先进行系统性思考。比如,假设我们要查询阿司匹林的副作用,ReAct代理不会直接调用搜索工具,而是先推理:“我需要哪些信息?药物副作用可能在医学文献中,我可以用PubMed查找。”然后再行动,调用API搜索。研究显示,这种方法能让AI的决策更透明、更可靠,尤其在医疗场景中。
2025-03-26 14:12:10
919
原创 一层一层的拆解openmanus 从 run_flow出发一步一步理解 代码设计理念
2025年3月21日 代码pull时间目前openmanus的更新迭代可以说是日新月异https://github.com/mannaandpoem/OpenManushttps://github.com/mannaandpoem/OpenManushttps://github.com/mannaandpoem/OpenManus首先是第一层代码 基于run_flow.py 写了一个run_flow_local.py 其实就是把命令行输入改成了代码进行任务输入。代码解读这段代码实现了一个异步运
2025-03-21 18:37:35
1138
原创 信息收集与问答系统流程分析与改进建议
这些改进将使系统从简单的线性问答流程转变为一个具有自适应性、可解释性和高效资源管理能力的综合智能系统。为当前问题类型排序策略。
2025-03-21 17:35:00
524
原创 参与 OpenManus 黑客松:打造基于本地知识图谱与在线推理的半离线平台
我的目标是基于 OpenManus 框架,设计一个“半离线”运行的智能平台。虽然无法本地部署大模型,但我可以通过本地存储知识图谱和缓存机制,减少对网络的依赖,同时利用在线 API 调用国内大模型,实现复杂推理任务。本地化适配:使用国内模型 API 和百度搜索,贴合中国用户习惯。半离线设计:本地构建知识图谱,缓存推理结果,优化运行效率。多层次推理:从知识图谱到因果理解,覆盖多种智能场景。实用应用:聚焦医疗诊断和金融决策,解决实际问题。
2025-03-20 18:50:09
984
原创 HippoRAG 2 的调研工作
HippoRAG 2 是一个为大型语言模型(LLM)设计的记忆框架,旨在增强它们识别和利用新知识连接的能力,类似于人类长期记忆。它通过改善关联性(多跳检索)和意义构建(整合大型复杂上下文)来提升 RAG 系统的性能,同时保持简单任务的效率。
2025-03-20 15:59:33
849
原创 具身智能 从纳米技术到星际航行
具身智能是一种强调身体与环境交互来实现智能的行为模式,广泛应用于机器人、AI 和认知科学等领域。用户询问从分子结构到宇宙维度的业务如何利用具身智能模式,我会基于当前研究和企业实践进行分析。具身智能(Embodied Intelligence)是指智能系统通过物理形态与环境互动,感知并执行任务。它在机器人学、AI 研究和认知科学有广泛应用,尤其是在需要跨尺度操作的场景中,如从分子级别的药物设计到宇宙尺度的空间探索。研究表明,具身智能强调身体与环境的交互在认知中的作用,挑战传统计算主义的观点(
2025-03-20 12:55:10
674
原创 推测未来Agentic形态:Dynamic Cognitive Contextual Agent with Reinforcement Learning (DCCA-RL)
在AI Agent设计模式领域,我们见证了从简单的ReAct到复杂的LATS的演进,这些模式通过反思、工具使用、规划和多代理协作,极大地提升了AI的自主性和智能性。然而,随着任务复杂度和动态性需求的增加,现有模式逐渐显现出局限性——多Agent协作带来的联合误差和单Agent设计的适应性不足。,即“动态认知上下文强化学习智能体”。本文将深入探讨DCCA-RL的设计理念、架构、功能和应用场景,展示其如何通过强化学习(RL)和生成式对抗网络(GAN)的联合优化,突破现有技术的边界。
2025-03-20 11:38:02
1445
原创 AI Agent设计模式 四种高层次模式以及更具体的九种模式
AI Agent设计模式是构建智能自主系统的核心框架,允许AI执行复杂任务如规划、推理和行动。之前的文章介绍了九种模式,但用户反馈内容“不够全面,不够丰富”。为此,我们将提供更深入的分析,包括更高层次的分类、实际应用和最新发展,并补充更多资源。
2025-03-20 11:17:50
1066
原创 Excel知识库与LLM结合的解决方案详细分析
pandas+pandasql结合LLM的解决方案为企业知识库构建提供了一种既实用又高效的方法。通过将Excel文件的结构信息纳入知识库,然后利用LLM生成SQL查询并通过pandas执行,最终将结构化数据查询与非结构化文本查询结果相结合,形成了一个强大的智能问答系统。降低实现门槛:利用现有的pandas和SQL技术栈,降低了开发难度提高查询精度:通过结构化查询提高了数据查询的准确性减轻LLM负担:避免将大量表格数据直接输入LLM,节省令牌消耗增强系统灵活性:易于与现有知识库系统集成提升用户体验。
2025-03-20 10:01:17
1031
原创 Excel知识库与LLM结合的解决方案分析
在数据分析和智能问答系统的构建过程中,如何有效地结合结构化数据(如Excel表格)与非结构化数据(如文本文档)成为一个关键挑战。近期接触到的pandas+pandasql解决方案为此提供了一种优雅的处理方式,下面我将对这一方案进行分析和总结。
2025-03-20 09:50:00
657
原创 OpenManus-RL 通过强化学习(RL)提升大型语言模型(LLM)代理的推理和决策能力
OpenManus-RL 是一个致力于通过强化学习技术优化 LLM 代理能力的开源项目。它的目标是增强代理在推理、工具使用和环境交互方面的表现,特别关注代理任务的复杂性。OpenManus-RL 项目采用多种后训练策略来提升 LLM 代理的表现。
2025-03-18 16:57:45
954
原创 openai 标准化协议 Structured Outputs 具体示例教程
"date": {"description": "支出日期,格式为 YYYY-MM-DD"},"description": "支出金额,单位为人民币(元)"},"enum": ["餐饮", "交通", "娱乐", "购物", "其他"],"description": "支出类别"},"note": {"description": "可选备注,若无则为 null"},设计要点date使用标准日期格式。amount为数字类型,确保精确。category使用枚举限制可选值。note。
2025-03-17 11:04:54
808
原创 openai 标准协议 Function Calling 全面教程
本教程将展示系统通过 Function Calling 实现的多领域能力,包括信息获取、通信、任务执行、数据分析、设备控制等,并提供具体代码示例。通过 Function Calling,系统可以实现从信息获取到设备控制的广泛能力。以下是系统通过 Function Calling 实现的多种能力,每项均附带具体代码示例。用户输入:“添加‘明天买牛奶’到我的待办事项。用户输入:“为我预订明天在巴黎的酒店。用户输入:“给我上个月的销售报告。用户输入:“写一首关于春天的短诗。用户输入:“打开客厅的灯。
2025-03-17 10:55:46
826
原创 OpenAI的Responses API与Chat Completions API对比
在OpenAI的生态系统中,开发者可以通过两种主要API与模型进行交互:Responses API和Chat Completions API。本教程将深入探讨这两者之间的区别、适用场景以及如何选择最适合您项目需求的API。定位:最新的核心API,是一个代理型API原语特点:结合了Chat Completions的简洁性与更多代理任务的能力推荐对象:新用户内置工具:网络搜索、文件搜索、计算机使用。
2025-03-17 10:24:11
889
原创 人生很无奈的故事 梦想的影子
我甚至偷偷打开电脑,写了几行代码,可没过多久就关掉,因为我知道,现实里没有时间也没有精力。后来学了点编程,我开始幻想:有一天,我要开发一款游戏,让玩家在我的世界里冒险。回来时,已经是半夜,看着屏幕上没保存的代码,我苦笑了一下,关了机。我低头看看自己的警棍和对讲机,突然觉得挺讽刺——我曾经也想成为那样的人,可现在,我只能站在这里,守护别人的生活。人生很无奈,就像一场游戏,我选错了关卡,走错了路,再也回不到起点。同事们说我踏实,家人说我靠谱,可没人知道,我心里藏着一个没实现的梦——做一款属于自己的游戏。
2025-03-13 14:22:34
255
原创 训练自己的数据分析模型 需要什么数据?
MCP 是一种协议,通过标准化方式让应用程序为 LLM 提供上下文,将上下文管理与 LLM 交互分离,从而提高效率和安全性。Python SDK 实现了完整的 MCP 规范,方便构建暴露资源、提示和工具的服务器,并处理协议消息和生命周期事件。通过标准化数据和功能暴露,它便于创建强大、安全的服务器,辅以全面的文档和社区参与。:一个更复杂的示例,集成数据库操作,将模式信息作为资源暴露,并通过工具允许 SQL 查询执行,展示实际应用。:一个简单服务器,展示资源、工具和提示,如通过资源和工具回显消息。
2025-03-13 14:13:17
712
原创 调查笔记:MCP Python SDK 详细分析
MCP Python SDK 是一个帮助大型语言模型(LLM)管理上下文的工具。它让开发者可以轻松地为 LLM 应用程序提供数据和功能,研究表明这通过标准化方式简化了开发过程。
2025-03-13 14:11:23
1091
原创 如何验证OpenManus智能体的能力?基于Python的测试用例设计
最近在研究一个叫OpenManus的智能体(全名),这是一个基于异步编程(asyncio)的模块,号称能处理任务规划、动态反馈和工具调用等功能。听起来很强大,但实际能力如何?今天我们就来设计一套测试用例,验证它的真实水平,顺便分享一下Python实现的代码,供大家参考。本文将基于一段测试代码,扩展出多个测试用例,覆盖任务解析、规划、工具调用等场景。如果你也在开发类似智能体,或者对异步编程感兴趣,不妨一起看看!通过这套测试用例,我们可以全面验证OpenManus的能力,从任务规划到工具调用,再到多语言支持。
2025-03-12 18:18:25
868
原创 验证通用智能:从理论到实践
定义:AGI指能够在任意任务中表现出类似人类的智能,而非局限于特定领域(如图像识别或语言生成)。特性:学习能力、推理能力、问题解决能力、跨领域适应性、自我改进。与大模型的关系:当前大模型(如Grok、GPT)是窄AI的代表,AGI是其潜在进化目标。多维度测试:语言、推理、创造力等。结合实际任务:如token管理,贴近应用。量化与定性结合:指标+人类评估。动态挑战:不断引入新任务。
2025-03-12 18:00:29
805
原创 超越限制:大模型token管理与优化实践
在大型语言模型(LLM)的应用中,token数量的管理是一个核心挑战。无论是模型的输入限制、计算资源的分配,还是成本的控制,token计数都至关重要。然而,当调用超过预期范围时,我们该如何应对?本书以一段简单的Python代码为起点,探索token管理的实用方法,帮助开发者从临时方案走向系统化解决方案。
2025-03-12 17:21:52
1141
原创 大模型助力自我提升:零基础实用指南
大模型”、“大语言模型”、“LLM”……这些术语可能让你感到困惑。不用担心,让我们用最简单的方式理解它:大模型就像一个超级聪明的朋友,它读过几乎整个互联网的内容,记住了大量的知识,并且能够用自然的方式与你交流。它能解释复杂的概念,回答各种问题,甚至可以为你写文章、代码或者创作故事。
2025-03-12 14:50:43
1106
原创 MCP(模型上下文协议)学习笔记
MCP(模型上下文协议)是AI领域的一个新兴标准,旨在让大型语言模型(LLMs)能够实时连接外部数据源和工具,而不仅仅依赖预训练知识。MCP是一个开放协议,定义了AI模型如何与外部资源(如数据库、API、文件系统和区块链)交互。它让AI能够动态获取最新信息、调用工具,甚至与其他系统协作完成任务。MCP是由Anthropic于2024年11月提出的开放标准,旨在解决AI模型与外部数据源和工具集成的问题。传统上,AI模型受限于预训练数据,难以实时访问外部信息,导致响应可能过时或不准确。
2025-03-12 14:28:27
1390
原创 随着生成式语言模型的进步 人应该如何利用大模型提升自己
大模型是一种基于深度学习的算法,能够识别、生成和处理文本,广泛应用于自然语言处理任务。它们通过训练海量数据集(如互联网文本)学习语言模式,能够执行翻译、文本生成、问题解答等多种任务。例如,指出,大模型通过预测下一个词的概率,掌握了语法、语义和上下文关系。
2025-03-12 14:26:19
640
原创 MCP(模型上下文协议)是一个开放标准,定义了AI模型如何与外部资源(如数据库、API、文件系统和区块链)交互。
MCP是Anthropic开发的一个开放标准,旨在让AI模型,特别是大型语言模型(LLMs),能够动态访问外部数据和工具,而不仅仅依赖预训练的静态知识。它就像为AI模型提供了一个“桥梁”,让它们可以实时查询天气、调用API,甚至与区块链系统交互,从而生成更准确、更相关的响应。MCP是由Anthropic于2024年11月提出的开放标准,旨在解决AI模型与外部数据源和工具集成的问题。传统上,AI模型受限于预训练数据,难以实时访问外部信息,导致响应可能过时或不准确。
2025-03-12 14:03:02
1314
原创 送给我亲爱的朋友小付,今天你的老师要写给你的是什么能真正的带一个人成长。
送给我亲爱的朋友小付,今天你的老师要写给你的是什么能真正的带一个人成长。“什么能真正带一个人成长”这个问题很深刻,答案因人而异,但从普遍经验和理性分析来看,有几个关键因素可以真正推动一个人的成长。我会尽量直白、深入地回答,不绕圈子。
2025-03-10 17:38:34
285
原创 如何增强机器学习基础,提升大模型面试通过概率
增强机器学习基础是提升大模型面试通过概率的必经之路。从数学到算法,再到神经网络和大模型的实践,结合调试经验和面试技巧,你将全面提升竞争力。从今天开始,每天投入2-3小时学习和实践,坚持3个月,面试成功率将显著提高!
2025-03-10 15:15:35
1657
原创 从多智能体变成一个具有通过场景生成多个决策路径 并在实施的过程中优化决策路径 openmanus 致敬开源精神中的每一个孤勇者
OpenManus 当前规划能力有限,但通过整合规划库或利用 LLM 生成和优化决策路径,可以实现用户的需求。这需要一定开发工作,但开源性质提供了灵活性。建议用户学习相关教程,尝试修改代码,或与社区合作推进功能开发。OpenManus 当前规划能力有限,但通过整合规划库或利用 LLM 生成和优化决策路径,可以实现用户的需求。这需要一定开发工作,但开源性质提供了灵活性。建议用户学习相关教程,尝试修改代码,或与社区合作推进功能开发。步骤描述理解架构研究 OpenManus 代码,识别任务逻辑设计规划模块。
2025-03-07 13:52:48
2123
1
原创 Agentic:基于DeepSeek V3与R1的智能代理技术深度解析
人工智能的快速发展正在重塑我们的技术世界,而智能代理(Agentic)作为AI领域的新兴分支,正以其自主性、适应性和智能化特性吸引着越来越多的关注。在这一领域,DeepSeek推出了两款强大的模型:生成式文本模型DeepSeek V3和推理生成式文本模型DeepSeek R1,二者为Agentic的实现提供了坚实的技术基础。文章以优快云社区的风格为蓝本,注重技术细节和实践洞察,去除代码示例,通过约1万字的文字描述为开发者、技术研究者和爱好者提供一份深入且实用的参考指南。决策是Agentic的核心。
2025-03-06 14:06:12
302
原创 Agentic系统:负载均衡与Redis缓存优化
本文在前文Agentic系统的基础上,新增负载均衡(动态调整线程数以避免API限流)和缓存机制(使用Redis存储搜索结果,减少API调用)。通过这些优化,系统在高并发场景下更加稳定高效。代码完整可运行,适合AI开发者和自动化工作流研究者参考。基于之前的Agentic系统,我们的目标是:无需额外安装,依赖Python内置模块。缓存机制:集成Redis实现思路使用Redis存储搜索结果,键为查询字符串,值为结果。在调用API前检查缓存,若命中则直接返回缓存结果。前提条件安装Redis:安
2025-03-06 11:09:13
842
原创 优化Agentic系统:错误处理、多线程与多数据源集成
本文在前文Agentic系统的基础上,新增错误处理(SerpAPI重试机制)、多线程加速(使用threading)和多数据源支持(集成Bing API)。通过这些优化,系统更加健壮、高效且信息来源丰富。代码完整可运行,适合AI开发者和自动化工作流研究者参考。
2025-03-06 11:08:11
583
原创 具有自主规划与决策能力的 RAG 工作全面解析
RAG(Retrieval-Augmented Generation,检索增强生成)是一种将信息检索与生成模型相结合的技术,广泛应用于需要外部知识支持的 AI 任务。近年来,随着自主 AI 代理(Agent)的引入,部分 RAG 系统进化出自主规划和决策能力,能够动态优化检索策略、迭代推理并处理复杂任务。本文将深入探讨这些 RAG 工作的技术原理、实现方式、工具支持以及在客户支持、医疗保健、金融、工业等领域的具体应用,旨在为开发者提供全面参考。
2025-03-05 15:39:30
796
原创 RAG 技术的落地路径:通过自我反馈机制提升复杂任务的自主规划与决策
本文基于当前 RAG 技术(包括 LLaMA、Qwen、DeepSeek 的核心原理,微调技术如 PEFT/CoT/DPO,及多模态技术如 CLIP/LLaVA),详细探讨其落地路径,提供具体实践步骤、工具选择、行业案例、优化建议和学习资源,帮助技术开发者、企业用户快速实现 RAG 的落地应用。然而,随着企业对复杂任务(如动态智能客服、实时金融风控、跨域企业知识管理)的需求增加,传统的 RAG 系统在适应性、效率、成本控制和实时性方面面临挑战。未来,RAG 的发展将通过。
2025-03-05 14:12:24
594
原创 RAG 学习必备,论文+实战+经验全收录!2025 大模型指令增强教程
本文将为你打造一站式 RAG 学习指南,并结合大模型指令增强(Prompt Engineering)的教程,帮助你快速掌握 RAG 技术,提升 AI 开发能力!通过本文提供的论文、实战和经验学习路径,你可以系统性地掌握 RAG 的理论、工具和优化技巧,并通过。:从论文摘要和简介入手,跳读核心方法和实验结果。:从免费资源(如 Hugging Face 模型、Google Colab)开始,逐步升级到本地或云端环境,记录学习笔记,积累经验。:从简单提示开始,测试不同模板的效果,记录生成结果和改进点。
2025-03-05 14:07:34
871
原创 大模型火爆 2025:LLaMA、Qwen、DeepSeek 核心原理+就业秘籍,快速入门 AI 工程师
这些是大型语言模型(LLMs)的核心技术,适合初学者逐步深入学习。微调是让大模型适应特定任务的关键技能,适合小白逐步掌握。
2025-03-05 13:56:48
676
原创 如何通过“大模型就业指导项目代练”实战大模型项目,拿到大模型工程师的机会?
大模型就业指导项目代练”本质是用实战带你入行,核心技术可能是“边生成边检索边规划”的组合拳。学下来,你能掌握生成、检索、规划三大能力,做出像 DeepSearch 那样高效的项目,拿到大模型工程师的机会绝对不是梦。关键是选对靠谱团队,然后全力投入。想试试的知友,不妨先从一个小项目开始,比如用 Python 调个模型玩玩,感受下大模型的魅力!有啥疑问欢迎留言,我随时聊~
2025-03-04 13:45:05
435
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人