AIGC安全方案

AIGC（AI Generated Content，人工智能生成内容）主要是基于生成对抗网络GAN、大型预训练模型等人工智能技术，自动生成图像、视频、文本、音频等作品。预计2023年，将有20%的内容被生成式AI所创建。在AIGC赋能千行百业加速业态创新的同时，需要保障AIGC业务应用的安全，同时满足国家和行业合规要求。

模型偏见

由于模型设计和训练数据的问题，导致训练后的模型生成的内容存在价值观和认知的偏见性。

数据泄露

由于模型训练所使用的数据包含敏感数据，导致模型在回答用户问题的时候，可能泄漏敏感信息。

模型被恶意利用

通过设计特定的问题，爬取同行业其他竞对模型的数据，用以训练和提高自身模型。

模型算力被窃取

挖矿程序入侵，占用模型算力，导致模型运行异常。

模型支撑的业务应用被入侵

模型支撑的行业应用，由于防护措施不足，系统被入侵，发生数据篡改、泄漏等安全事件。

模型应用业务违规

用户输入提示词和模型生成内容违规，缺乏用户身份认证导致的未成年人过度依赖或者沉迷，未按照监管要求履行等保合规义务。

《生成式人工智能服务管理暂行办法》

国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局七部门于2023年7月13日联合公布，自2023年8月15日起施行。《办法》既是促进生成式人工智能健康发展的重要要求，也是防范生成式人工智能服务风险的现实需要。

监管对象

向中国境内公众提供生成文本、图片、音频、视频等内容的服务。

要求简介

在模型设计、模型生成和优化、提供服务的过程中，对训练数据选择、生成内容合法合规方面做了明确规定。对于数据标注，应当开展数据标注质量评估，抽样核验标注内容的准确性，对标注人员进行必要培训。提供者发现违法内容的，应当及时采取停止生成、停止传输、消除等处置措施，采取模型优化训练等措施进行整改。提供具有舆论属性或者社会动员能力的生成式人工智能服务的，应当按照国家有关规定开展安全评估，并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。服务提供者应当采取有效措施防范未成年人用户过度依赖或者沉迷生成式人工智能服务。

AIGC安全开发运营参考框架

模型开发

模型/应用上线

模型运营

核心能力

模型训练数据违规审核

通过机器审核和人工审核，发现训练数据中的违规内容，同时降低个人敏感数据泄漏风险，对训练数据的真实性和客观性进行判断。

模型训练数据标注评价

对样本数据和标注结果进行审核，降低由于标注错误导致的模型异常。

AIGC安全方案

AIGC的安全风险

AIGC的合规要求

AIGC安全开发运营参考框架

AIGC安全方案

方案优势