一、大模型备案所需资料详解
1、大模型上线备案表
这是备案申请的核心材料,需详细填写大模型的基本情况、模型研制过程、服务内容、安全防范措施、安全评估结果及自愿承诺等信息。表格内容应真实、准确,无遗漏,为后续审核提供全面依据。
2、语料标注规则
语料标注是训练大模型的基础工作,其质量直接影响模型的准确性和可靠性。因此,提交语料标注规则时,需详细介绍标注团队的资质、标注细则、标注流程等,确保语料来源合法、标注过程规范、标注结果准确。
3、拦截关键词列表
为有效过滤有害信息,企业和开发者需准备一份详尽的拦截关键词列表,覆盖政治、色情、暴力、谣言等多种安全风险。列表应至少包含10000个关键词,并定期更新以适应新的风险态势。
4、评估测试题集
评估测试题集用于检验大模型在生成内容时的安全性能,包括生成内容的正面示例、应拒答的负面内容以及非拒答测试题库。测试题集应严格按照《生成式人工智能服务安全基本要求》编制,确保测试结果的客观性和准确性。
5、安全评估报告
安全评估报告需由专业机构或团队完成,全面评估大模型在语料处理、模型训练、服务提供等环节中的安全性。评估内容应包括但不限于数据隐私保护、算法偏见识别与纠正、有害信息过滤机制、应急响应预案等,确保大模型在提供服务时不会侵犯用户权益,不传播违法违规内容。
6、模型服务协议
模型服务协议是保障用户权益的重要法律文件,需明确服务范围、双方权利义务、数据使用与保护、违约责任等条款。法务团队应仔细审阅,确保协议内容合法