东莞市信息与网络安全协会

地址:东莞市南城街道黄金路1号东莞天安数码城H1栋16楼

联系方式:郭女士 18948300986

邮箱: guoyuhua@dgicsa.cn

网站:www.dgicsa.cn

开放工程联盟推出针对LLM的安全性测试与认证计划

来源: 发布时间:2024-07-19 556 次浏览

日前,开放工程联盟MLCommons宣布推出一个完整的测评工具包—— AI Safety,用于对大型语言模型(LLM)进行安全性压力测试,以查看、评估其在实际应用时是否会产生不安全的响应,并对通过测试的模型进行安全评级认证,以便客户在选型时更好了解模型应用的安全风险性。

 

开放工程联盟MLCommons是一个全球性的AI技术应用联盟,主要成员包括谷歌、微软和 Meta等。联盟工程总监Kurt Bollacker表示,本次推出的测评工具包,是“抵御AI应用危害的一道护栏,可以拦截人工智能系统产生的不良影响”。AI Safety套件将向LLM提供诱导性提示,以判断是否会引出与仇恨言论、剥削、虐待儿童和性犯罪相关的危险回复。然后,这些反应被评定为安全或不安全。测试中还将识别与侵犯知识产权和诽谤相关的问题响应。

 

AI供应商可以在发布大型语言模型(LLM)之前运行这些基准测试,并将其提交给MLCommons进行安全评级,这些评级将对公众开放。