大模型备案如何申请?AIGC大模型上线要求
一、大模型备案的定义与重要性
在当下人工智能蓬勃发展的时代,大模型在各个领域发挥着重要作用。大模型备案指的是大模型产品在面向公众开放并进行商业使用之前,必须经过国家互联网信息办公室等监管部门的备案审批流程。这一举措依据《生成式人工智能服务管理暂行办法》开展,其核心目的是加强生成式人工智能服务的合规管理,确保人工智能技术健康、有序发展,为公众构建一个安全、可靠的服务环境。
二、大模型备案与互联网算法备案(深度合成)的区别
(一)互联网算法备案(深度合成)
互联网算法备案(深度合成)主要涉及利用深度学习等生成合成类算法来制作网络信息的技术。它本质上是对已有数据进行组合拼接,适用对象为具有舆论属性或社会动员能力的深度合成服务提供者和技术支持者。
(二)大模型备案(生成式人工智能)
大模型备案(生成式人工智能)针对的是具有文本、图像等内容生成能力的模型及相关技术。其生成的内容具有新颖性和演绎创新能力,适用对象为提供具有舆论属性或社会动员能力的生成式人工智能服务的企业。
三、大模型备案的适用对象及例外情况
提供具有舆论属性或社会动员能力的生成式人工智能服务的企业,需要进行大模型备案和算法备案。尤其是特定类型的企业,建议优先开展大模型备案。也存在一些例外情况,非从事生成式人工智能大模型相关业务、不具备舆论属性或社会动员能力的服务,以及纯调用第三方API接口的情况,通常仅需进行算法备案。
四、大模型备案所需材料清单
企业申请大模型备案,一般需要准备以下材料:
《生成式人工智能(大语言模型)上线备案申请表》:详细填写大模型的基本信息、研制过程、服务内容、安全防范措施等内容,并附上安全评估结果和开发者承诺。
《安全自评估报告》:由机构或团队完成,全面评估大模型在语料处理、模型训练、服务提供等环节的安全性,包括语料安全、模型安全、安全措施等方面。
《模型服务协议》:规定服务提供者和用户的权利、义务和责任,包含服务范围、数据使用与保护、违约责任等关键条款。
《语料标注规则》:介绍标注团队资质、标注细则、流程、质量控制机制等,确保语料标注的高质量和合法性。
《关键词拦截列表》:至少包含10000个关键词,涵盖政治、色情、暴力等多种安全风险,且要定期更新。
《评估测试题集》:用于检验大模型生成内容的安全性能,包含正面示例、应拒答的负面内容以及非拒答测试题库。
部分省份可能还要求额外提交其他材料,企业需根据当地要求准备齐全。
五、大模型备案安全评估要点
(一)语料安全
语料安全包括来源安全,要确保语料来源合法合规;内容安全,避免包含有害信息;标注安全,保证标注过程准确、规范。
(二)模型安全
模型安全主要关注生成内容的安全性、准确性和可靠性,防止生成虚假、有害或误导性的信息。
(三)安全措施
涵盖模型适用性,确保模型适用于预期的应用场景;服务透明度,向用户清晰说明服务的使用方式和可能产生的影响;用户数据处理,保障用户数据的安全和隐私;用户管理,建立有效的用户管理机制;服务稳定性,确保服务的持续稳定运行。
(四)安全评估要求
安全评估要遵循严格的标准和规定,对各个环节进行全面、细致的评估,确保大模型符合相关安全要求。
六、大模型备案流程和时长
企业要向所在地省级互联网信息办公室进行报备,之后的备案流程如下:
企业自行开展评估并编写备案所需材料。
将编写好的材料递交至相关部门。
属地和中央网信办进行评审,并开展技术测试。
若评审和测试未通过,企业需要修改材料或调整模型能力,重新提交审核。
整个备案过程预计耗时4 - 7个月,快也需要3 - 4个月。企业需合理安排时间,确保备案工作顺利进行。
七、选择服务商的注意事项
由于大模型备案工作复杂且,对于缺乏经验的企业来说,可能会面临材料被打回或模型问题被拉黑等风险。企业在选择服务商时要格外谨慎,避免选择非技术服务的中介机构。这些中介机构可能会收取高额费用,但却无法保证顺利完成备案,甚至可能引发法律纠纷。企业应选择具有技术能力和丰富经验的服务商,以确保备案工作高效、合规地完成。
企业要顺利完成大模型备案并使AIGC大模型上线,需全面了解备案要求、准备好相关材料、严格遵循备案流程,并谨慎选择服务商。只有这样,才能在合规的前提下,充分发挥大模型的优势,推动企业的发展。