重磅!首个生成式AI安全指导性文件正式发布!
华体会体育ios
发布于:2024-03-15
3月1日,全国网络安全标准化技术委员会(TC260)发布了《生成式人工智能服务安全基本要求》(TC260-003),旨在确立生成式人工智能服务的安全标准。这些要求涵盖语料安全、模型安全、安全措施,并详细说明了安全评估的流程。文件的目标是指导服务提供者进行安全评估,提升安全管理水平,并为主管部门提供评估服务安全水平的参考。要点概览如下:
一、语料安全要求:服务提供者在采集和使用语料时,必须确保来源的安全性和合法性,并在采集前后进行安全评估,限制违法信息的比例不超过5%。语料来源应多样化且可追溯,包括开源语料、自采语料、商业语料及用户输入信息的合法授权。服务提供者还需通过技术手段和人工抽检确保语料内容的合规性,妥善管理知识产权,并在处理个人信息时遵守法律规定。此外,标注人员应接受安全培训,以确保标注内容的准确性和安全性。
二、模型安全要求:服务提供者使用第三方基础模型时,必须确保模型已获得主管部门备案。在模型训练过程中,内容安全性应作为主要评价指标,同时建立监测机制,及时处理安全问题,并通过技术手段优化模型。此外,应提高模型对用户输入意图的响应能力,确保内容的科学性和准确性,以及内容格式的合理性和有效性。
三、安全措施要求:服务提供者应确保其服务在适用性、安全性、透明度等方面符合规定要求。这包括确保服务适用于正确的人群和场合,提供必要的保护措施,公开服务信息,提供关闭个人信息用于训练的选项,满足国家规定和标准要求,评估供应链安全,提供多种投诉举报途径,防止违法信息的生成,设置监看人员,制定模型更新升级的安全管理策略,隔离训练和推理环境,防范恶意攻击,定期进行安全审计,以及建立备份和恢复策略。
四、其他要求:为确保网络安全和内容合规性,应建立全面且代表性的关键词库和测试题库,并定期更新。关键词库应覆盖各种安全风险,而测试题库应用于内容过滤和安全评估。
五、安全评估要求:评估可以自行进行或委托给第三方,应包含所有相关条款的评估结果。评估报告需包含证明材料,并由三名负责人签字。语料和生成内容的安全评估应通过抽检确保合格率达标,而问题拒答评估则确保模型正确拒答不当内容。
总结:文件的发布为生成式人工智能服务提供了一套全面的安全指南,涉及语料收集、模型使用、安全措施和评估流程,以确保服务的安全性和合规性,促进服务提供者提升安全水平,保护用户权益,并支持可持续发展。