人工智能培训咨询叶梓-优快云博客

原创大模型照亮人工智能医疗助手的发展之路

大模型在现代医疗领域的应用现状与发展趋势。首先介绍了通用大模型（如GPT-4）在医学考试、临床决策支持和远程医疗中的表现，以及专业医学大模型（如Med-PaLM）的开发进展。

2025-05-28 19:45:00 1216

原创大模型效率优化的解决方案系统研究

针对大语言模型(LLMs)面临的高计算资源消耗问题，多机构联合研究团队提出系统性解决方案，涵盖三大方向

2025-05-28 11:30:00 1299

原创大模型的检索增强生成综述研究

这篇综述论文探讨了检索增强生成（RAG）技术在提升大语言模型（LLMs）性能方面的研究进展。RAG通过整合外部知识库，解决了LLMs在特定领域任务中存在的幻觉、知识过时等问题。

2025-05-26 17:45:00 1627

中国科学技术大学与腾讯联合发表的论文系统梳理了MLLM最新进展。MLLM通过融合视觉编码器与大语言模型(LLM)，实现了文本与视觉的多模态理解与推理。研究详细分析了典型架构的三要素：模态编码器(如CLIP)、预训练LLM(如LLaMA)和模态接口，并阐述了预训练、指令微调和对齐优化的三阶段训练策略。论文还探讨了评估方法(闭集/开集)、扩展技术(上下文学习、链式推理)及当前挑战，包括多模态幻觉、长上下文处理和安全问题。这项工作为MLLM的发展提供了系统性的技术参考框架。

2025-05-26 13:18:38 1159

原创多模态和多智能体系统与理性的结合综述研究

尽管大模型（LLMs）在生成类人文本方面取得了显著成就，但它们在处理复杂情境时仍存在偏见、不一致性和理解困难等问题。例如框架效应、确定性效应、过度权重偏见和联合谬误等。这些偏见对LLMs在自然语言处理研究中的实用性构成了挑战，尤其是在医疗、金融和法律服务等对可靠性和一致性要求极高的领域。为了克服这些挑战，研究者们开始探索多模态和多智能体系统的潜力，以期通过合作提高决策的一致性和可靠性。

2025-05-14 17:00:00 824

原创大模型在智能规划中的应用研究

大模型不仅在语言理解方面表现出色，更在推理、规划和指令遵循等多个领域展现出显著的智能。为了系统性地探索LLMs在智能体规划中的应用，中国科学技术大学与华为诺亚方舟实验室的研究人员联合开展了一项全面的调查研究。这项研究首次对LLM在智能体规划领域的应用进行了分类和分析，涵盖了任务分解、计划选择、外部模块辅助规划、反思与完善以及记忆增强规划等多个方向。旨在揭示LLMs在智能体规划中的潜力与挑战，为未来的研究和应用提供指导。

2025-05-14 12:49:54 673

原创面向AI内容生成的检索增强生成全面调查

尽管AIGC取得了显著进展，但它仍然面临一些挑战，例如如何保持知识的更新、如何整合长尾知识、以及如何避免训练数据泄露等问题。这些问题促使研究者探索新的解决方案，以提高AIGC的性能和可靠性。

2025-04-30 19:30:00 1034

原创大模型与Agent工具使用全面调查

在自然语言处理领域，大模型（LLMs）如ChatGPT等已经展现出了处理多种语言任务的卓越能力。然而大模型在面对复杂问题时，往往受限于其固化的知识库，难以提供准确和及时的信息。为了突破这一局限，工具学习（Tool Learning）作为一种新兴的范式应运而生，它通过使LLMs能够动态地与外部工具互动，从而增强其解决问题的能力。

2025-04-30 15:11:26 893

原创个性化视觉指令调优：让多模态大模型“认脸”

多模态大模型存在一个明显的局限性：它们能够进行一般性的对话，但在针对特定个体的个性化对话中却表现不佳。这种“面孔失认症”限制了MLLMs在个性化场景中的应用，例如移动设备上的定制化视觉助手，或需要识别家庭成员的家庭机器人。

2025-04-15 16:15:00 1516

原创超越人类翻译：利用多代理协作翻译超长文学文本

文学作品通常包含复杂的语言、比喻表达和文化细微差别，这些特点使得机器翻译系统难以准确捕捉和再现原作的韵味。为了应对这一挑战，来自莫纳什大学、澳门大学和腾讯AI实验室的研究人员提出了一种新颖的多代理框架，用于文学翻译。这一框架基于大模型（LLMs），并通过一个名为TRANSAGENTS的虚拟翻译公司来实现，模拟了传统的翻译出版流程。

2025-04-15 10:25:29 760

原创 LLAMAFACTORY：一键优化大型语言模型微调的利器

模型适配到特定的下游任务，通常需要进行微调（fine-tuning），这一过程往往需要大量的计算资源。为了解决这一问题，来自北京航空航天大学和北京大学的研究人员共同开发了LLAMAFACTORY，这是一个统一的框架，集成了多种前沿的高效训练方法，使得用户可以灵活地自定义100多种大型语言模型的微调过程，而无需编写代码。

2025-04-02 13:00:00 894

原创大模型培训讲师叶梓分享前沿技术：多模态模型架构的演进

随着深度学习技术的发展，多模态模型在理解和处理跨领域数据方面表现出了显著的效能。来自普渡大学、混沌工业公司、斯坦福大学和亚马逊的研究人员共同撰写了一篇论文，题为《多模态模型架构的演进》（The Evolution of Multimodal Model Architectures），该论文系统地识别并描述了当代多模态领域中普遍存在的四种多模态模型架构模式。

2025-04-02 08:05:14 1157

原创人工智能长期记忆的新突破：HippoRAG的创新框架

大模型（LLMs）在预训练后，如何有效地整合大量新经验，同时避免灾难性遗忘，一直是人工智能领域的难题。尽管已有的检索增强生成（RAG）方法为LLMs提供了长期记忆的解决方案，但这些方法在处理需要跨段落整合新知识的复杂任务时仍然力不从心。图1通过一个例子说明，如果要找到一个既与斯坦福大学有关又研究阿尔茨海默病的教授，当前的RAG系统由于孤立地编码每个段落，很难找到这位教授，除非一个段落同时提到这两个特征。这与人类大脑的关联记忆能力形成对比，人类可以迅速通过海马体的索引结构（上图中的C形结构）回忆起这位教授。

2025-03-27 15:30:00 610

原创大模型讲师叶梓分享前沿技术 Lory: 推进大模型训练的新篇章

随着模型规模的增长，如何有效训练并利用这些模型成为了一个挑战。陈丹琦团队一项新的研究提出了一种创新的预训练方法——Lory，旨在解决大模型在混合专家（MoE）架构中的可微分性和计算效率问题。Lory通过专家合并技术，实现了模型的完全可微分，并通过因果段路由和基于相似性的数据批处理策略，显著提高了训练效率和模型性能。这项工作不仅推动了大模型的研究边界，也为未来更高效、更强大的AI系统的发展奠定了基础。

2025-03-27 10:01:04 1095

原创基于补全学习的时空数据自适应模型演化系统ComS2T

时空学习模型通过融合多种空间卷积和时间演化技术，有效捕捉城市数据的复杂异质性。然而，快速的城市化进程导致城市数据分布和结构频繁变动，这与现有模型假设训练和测试数据独立同分布的情况相悖。

2025-03-13 16:30:00 1528

原创人工智能培训讲师叶梓分享前沿论文：训练验证器解决数学应用题

数学问题解决不仅要求模型能够理解问题的语言表述，还要求其能够准确地执行一系列数学运算，每一步的准确性都至关重要。

2025-03-13 07:25:28 1099

原创人工智能大模型培训讲师叶梓分享多智能体协作新框架AGENTVERSE：探索协作行为与效率提升

人工智能咨询培训老师叶梓转载标明出处大模型（LLMs）赋予了自主智能体广泛的任务泛化能力，但现实任务往往需要团队合作来提升效率。尽管已有研究探索了智能体的合作潜力，但这些研究通常局限于特定任务，缺乏通用性，并且智能体的合作方式较为固定，缺乏适应性。针对这一挑战，来自清华大学计算机科学与技术系、北京邮电大学计算机科学学院以及腾讯公司微信AI团队的研究人员共同提出了一个名为AGENTVERSE的多智能体框架。

2025-03-05 18:30:00 1564

原创人工智能讲师叶梓分享自然语言任务规划的新篇章：AutoGPT+P的突破

更多分享，关注视频号：sphuYAMr0pGTk27 抖音号：44185842659尽管LLMs在自然语言处理（NLP）方面取得了显著进展，但它们在直接将自然语言指令转换为执行机器人任务的计划方面仍存在限制。这些限制主要源于LLMs在推理能力上的不足。

2025-03-05 14:07:26 984

原创如何利用大模型优化医学信息管理

一项新的研究提出了一种结合检索增强生成（Retrieval Augmented Generation, RAG）的方法，通过知识图谱来提供结构化推理和真理模型，与LLMs结合使用，以优化医学信息的组织和决策支持。尽管结合使用大模型和知识图谱可能会在自动化医疗信息任务时产生重要的不准确性，但这些技术的特性对于提高医生处理信息和做出医疗决策的能力至关重要。新方法利用大模型的文本处理能力来构建和丰富知识图谱。混合模型：大模型和知识图谱的某些部分可能被集成到一个统一的模型中，以提供更复杂的推理和决策支持。

2025-02-20 19:30:00 869

原创万知：告别繁琐，轻松办公

零一万物这位科技创新的弄潮儿，带着它的最新杰作——万知，闪亮登场。这不仅仅是一个产品，它是对传统工作方式的一次轻松挑战。作为一款一站式AI问答、阅读和创作平台，万知旨在为用户提供高效、便捷的工作体验。万知通过集成多种智能化工具，帮助用户在教育、企业、投资分析等领域提升工作效率和创作质量。

2025-02-20 15:11:26 549 1

原创视频理解新篇章：Mamba模型的探索与应用

人工智能咨询培训老师叶梓转载标明出处在计算机视觉领域，视频理解一直是一个核心研究方向，它要求算法能够捕捉视频中的时空动态以定位活动或推断其演变。随着深度学习技术的发展，研究者们探索了多种架构，如递归神经网络(RNN)、三维卷积神经网络(3D CNN)和Transformers，以期更好地理解视频内容。一种名为状态空间模型(State Space Model, SSM)的新架构引起了研究者的关注，尤其是Mamba模型，它在长序列建模方面展现出了巨大的潜力。

2025-02-12 19:30:00 780

原创 LARA：多语言多轮对话意图分类的新突破

人工智能咨询培训老师叶梓转载标明出处1小时实战课程，您将学习到如何轻松上手并有效利用 Llama Factory 来微调您的模型，以发挥其最大潜力。更多分享，关注视频号：sphuYAMr0pGTk27多轮对话意图分类面临的主要挑战在于对话的复杂性和上下文的不断变化。如图 1 所示。在多轮对话中，意图可能随着对话的进展而变化，这就需要注释者不仅要理解每条消息的内容，还要把握整个对话的上下文。由于意图种类繁多，且对话可能非常长，手动注释这样的数据集既耗时又容易出错，这对构建高质量的训练数据集构成了挑战。

2025-02-12 11:45:13 911

原创 DeepSeek培训AI讲师叶梓：大模型DeepSeek基础培训提纲

本次培训旨在系统地介绍AI与大模型的基础知识、工作原理、应用实践以及DeepSeek的相关内容，帮助学员全面了解并掌握这一前沿技术，提升其在实际工作中的应用能力。

2025-02-06 11:15:00 1442

原创大模型培训讲师老师叶梓分享：DeepSeek多模态大模型janus初探

Janus-Pro 是对之前发布的 Janus 模型的全面升级，采用了创新的自回归框架，通过将视觉编码过程解耦为独立路径，解决了传统框架中的局限性。它支持从文本生成图像（文生图）和从图像生成文本（图生文），在多个基准测试中超越了 Stable Diffusion 和 OpenAI 的 DALL-E 3。此外，Janus-Pro 提供了1B和7B两种参数规模的模型，适合不同的应用场景。以下视频内容为叶梓分享DeepSeek多模态大模型janus的部署，并验证其实际效果，包括图生文和文生图两部分。

2025-02-02 14:00:00 390

原创大模型驱动的自主智能体全面调研

人工智能咨询培训老师叶梓转载标明出处基于LLMs构建的自主智能体，有望实现类似人类的决策能力。图 1 展示了LLMs驱动的自主智能体领域的增长趋势。从2021年1月到2023年8月，不同颜色代表不同类别的智能体。例如，游戏智能体旨在模拟游戏玩家，而工具智能体主要关注工具使用。然而，目前对于如何构建和评估LLMs驱动的自主智能体的研究还比较分散，缺乏系统性的总结。为了弥补这一空白，来自中国中国人民大学高瓴人工智能学院的研究团队进行了一项全面的研究调查。系统地回顾了LLMs驱动的自主智能体的研究工作。

2025-01-23 18:30:00 980

数据挖掘算法概要说明

空空如也