随着人工智能技术的迅速发展,大模型在处理各种复杂任务中展示出了卓越的能力。特别是在网络安全领域,大模型的应用潜力巨大,它们可以帮助自动化处理大量数据、识别潜在威胁和提供安全建议。然而,新型大模型层出不穷,要有效利用这些模型,首先必须验证它们在理解和处理网络安全相关问题上的能力。
4月19日凌晨,Meta开源了新一代 LLaMa-3模型。作为当前最受瞩目的大语言模型之一, LLaMa-3在网络安全领域的表现到底怎样?如何将 LLaMa-3这样的新型大模型快速应用到网络安全问题解决中?腾讯朱雀实验室和腾讯安全科恩实验室基于自研的网络安全大模型评测平台SecBench,对 LLaMa-3在网络安全领域的能力表现进行了全面评测。
SecBench——评测网络安全大模型的新基准
SecBench积累了行业独有的安全评测数据集,覆盖多题型、多任务,支持从能力、语言、领域、安全证书模拟考试等多个维度对大模型的网络安全能力进行评估。同时,SecBench构建了方便快捷的评测框架,支持不同数据、不同模型快速接入评测,输出评测结果。


最低0.47元/天 解锁文章
1569

被折叠的 条评论
为什么被折叠?



