deepseek给AI火上浇油,公司领导不管三七二十一让我赶紧接入deepseek“赋能”业务。那么,接入AI模型更新一个版本就可以直接面向公众了吗?
答案是:NO,NO,NO
接入deepseek等 “生成式人工智能” 服务 和 网站备案 类似 需要在网信办 “上户口”。
- 针对直接接入已备案模型API服务的,需要进行 “大模型登记
- 针对自己在deepseek等开源模型基础上 “微调” 的,需要进行“大模型备案
当然啦,公司内部自己用用啥那是无所谓
未及时备案的后果
《生成式人工智能服务管理暂行办法》第21条的规定,未进行大模型备案或登记,相关主管部门会依照《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》《中华人民共和国科学技术进步法》等法律、行政法规的规定予以处罚。
那大模型备案和大模型登记的流程是怎么样的呢?
1.前期准备
首先,要主动与属地网信办取得联系,填写信息采集表,并前往线下领取一系列关键资料。这些资料包括上线备案申请表、安全评估报告、模型服务协议、语料标注规则、拦截关键词库、评估测试题集,如下图所示的文件:
重点:从0开始自己准备这些材料难度非常大!!!
以 生成式人工智能上线备案表 为例
需要填写内容和要点非常多,例如:需要填写的 适用人群 部分,必须要指明 针对未成年人采取的措施。
例如:模型安全评估部分,需要填写非常多的数据,多个文件之间的数据需要对应,各数据又有不同的要求,从0开始填写反复修改几个月就过去了。
此外,关键词列表 和 评估测试题 都需要提供excel表格。两个表的数量、类别都需要满足一定的要求。
A.1
a) 煽动 XXX ,推翻XXX
b) 危害国XXXX, 损害国XXX形象
…
h) 其他法律、法规禁止内容
关键词列表 需要符合下列要求:
针对A.1的各个子类别需要满足每个类别不少于200个的要求,针对A.2 的类别每个类别不少于100个。(实际上和省里沟通要求会更高)
评估测试题除需要满足上面A.1和A.2要求外,还需要满足下列类别:
A.3 商业违法违规
a)侵犯他人知识产权
b)违反商业道德
c)泄漏…
…
A.4 倾翻他人合法权益
a) 危害他人身心健康
…
g) 侵犯他人合法权益
(备案材料模版+测试题+关键词库添加wx 公众号 “大模型安全技术”获取)
2.属地初审
属地网信办会启动初审程序,这一环节涵盖了审查备案材料、进行技术安全评测、组织行业专家评审、征求主管部门意见等多个关键步骤。经过层层把关,属地网信办会形成一份详细的属地初审意见,为后续的中央终审奠定基础。
3.中央终审
中央网信终审环节同样严谨,包括审查备案材料、进行技术安全评测、征求六大部委意见等重要环节。只有当六大部委均无反对意见时,备案才算通过。最终,结果会反馈至中央网信,再由中央网信反馈至地方网信,完成公示上线备案流程。
二、大模型登记
大模型登记与大模型备案类似:
1.前期准备
同样先与属地网信办取得联系,填写信息采集表,并领取相关资料。需提交的材料包括登记备案申请表、调用模型证明材料、用户协议、隐私协议、内容安全管理制度、拦截关键词库、评估测试题库、测试账号及测试文档等。这些材料要真实反映模型使用第三方大模型的情况和自身的管理措施。
2.属地审查
属地网信办会进行审查备案材料、进行技术安全评测、征求主管部门意见等环节,形成属地审查意见,并完成公示上线备案。这一过程虽然相对备案流程略显简化,但同样重要,确保登记的AI产品符合监管要求。
三、备案的时间周期
大模型的备案和登记并非一蹴而就,整个过程因涉及到资料准备、测试以及与网信办多轮反馈交等,需要3~4个月左右的时间。每个省份有不同的计划,例如:北京是按照一批一批集中推送,一般一年2~4批,没有进入批次反馈会很慢,进入批次后反馈会非常快。
行业限制:医疗、健康、金融类型的企业,暂时无法办理大模型备案,但可以办理大模型登记。
关注公众号“大模型安全技术”,获取上述模版材料和关键词库。
获得更多大模型备案、登记、安全技术以及监管政策信息