- 博客(10)
- 收藏
- 关注
原创 Agent论文分享~07:NetSafe
大型语言模型 (LLM) 为多智能体网络中的节点赋予了智能,在学术界和工业界的应用日益广泛。然而,如何防止这些网络生成恶意信息仍未得到探索,因为之前对单个 LLM 安全性的研究很难转移。在本文中,我们从拓扑角度关注多智能体网络的安全性,研究哪些拓扑属性有助于网络更安全。为此,我们提出了一个名为 **NetSafe 的通用框架**,以及**一个迭代的 RelCom 交互**,以统一现有的基于 LLM 的各种智能体框架,为广义拓扑安全性研究奠定基础。当多智能体网络受到涉及**错误信息**、**偏见和有害信息的攻
2025-03-12 17:02:21
867
原创 Agent论文分享~06:Agent-SafetyBench
随着大型语言模型(LLMs)越来越多地被部署为智能体(agents),它们在交互环境中的整合及工具使用引入了新的安全挑战,这些挑战超出了模型本身固有的问题。然而,目前缺乏全面的基准测试来评估智能体的安全性,这成为有效评估和进一步改进的重要障碍。在本文中,我们提出了。
2025-03-11 18:19:40
1182
原创 Agent论文分享~05:AgentSafe
本文提出的AgentSafe框架在多Agent系统中展示了卓越的防御性能,特别是在多轮攻击和复杂环境下。其在内存信息保护、通信安全和系统扩展性方面的优势,展示了其在真实世界多Agent系统中的潜力。未来的研究可以进一步优化AgentSafe的部署方式,探索其在不同场景中的适应能力和防御效果。
2025-03-10 22:34:22
1194
原创 Agent论文分享~04:TRIAGEAGENT
全球急诊科患者访问量的增加对高效的临床管理,特别是临床分诊,提出了重大挑战。传统上由人类专业人员管理的临床分诊容易受到显著的变异性影响,并且工作负荷高。尽管大型语言模型(LLMs)展示了有前景的推理和理解能力,但由于临床分诊任务的。
2025-02-26 17:24:04
1178
原创 Agent论文分享~03:TrustAgent
基于LLM的代理的兴起展示了其在任务规划中具有巨大的革命潜力,引起了广泛关注。鉴于这些代理将被集成到高风险领域中,确保其可靠性和安全性至关重要。
2025-02-25 17:21:27
1084
原创 Agent论文分享~02:MALR法律应用相关论文
大型语言模型(LLMs)在完全理解法律理论和执行复杂法律推理任务时可能会遇到困难。在这项研究中,我们引入了一项具有挑战性的任务(混淆指控预测),以更好地评估LLMs对法律理论的理解和推理能力。我们还提出了一种新的框架:用于提升复杂法律推理能力的多智能体框架(MALR)。MALR采用非参数学习,鼓励LLMs自动分解复杂的法律任务,并模仿人类学习过程从法律规则中提取见解,帮助LLMs更好地理解法律理论并增强其法律推理能力。
2025-02-15 21:59:13
1349
2
原创 Agent论文分享~01:Improving Multi-Agent Debate with Sparse Communication Topology
多智能体辩论已被证明在提高大型语言模型的推理和事实准确性任务质量方面是有效的。尽管已经探索了多智能体辩论中的各种角色扮演策略,但在智能体之间的通信方面,现有方法采用了一种暴力算法——每个智能体可以与所有其他智能体通信。在本文中,我们系统地研究了多智能体系统中通信连接性的影响。我们在GPT和Mistral模型上的实验表明,利用稀疏通信拓扑结构的多智能体辩论能够实现相当甚至更优的性能,同时显著降低计算成本。此外,我们将多智能体辩论框架扩展到了多模态推理和对齐标注任务,展示了其广泛的应用性和有效性。
2025-02-12 00:17:08
451
垃圾分类yolo数据集,四分类 recyclable waste hazardous waste kitchen waste other waste
2025-02-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅