螞蟻集團(tuán)發(fā)布AI安全檢測平臺“蟻鑒2.0”,可一鍵識別生成式AI模型安全漏洞

來源:新浪科技


(資料圖)

新浪科技訊 7月7日下午消息,2023世界人工智能大會期間,在“聚焦·大模型時代AIGC新浪潮—可信AI”論壇上,螞蟻集團(tuán)聯(lián)合清華大學(xué)發(fā)布AI安全檢測平臺“蟻鑒2.0”。蟻鑒2.0可實現(xiàn)用生成式AI能力檢測生成式AI模型,可識別數(shù)據(jù)安全、內(nèi)容安全、科技倫理三大類的數(shù)百種風(fēng)險,覆蓋表格、文本、圖像等多種數(shù)據(jù)和任務(wù)類型,是業(yè)內(nèi)首個實現(xiàn)產(chǎn)業(yè)級應(yīng)用的全數(shù)據(jù)類型AI安全檢測平臺。

在該論壇上,螞蟻集團(tuán)同時宣布,“蟻鑒2.0”全面開放,面向全球開發(fā)者免費(fèi)提供AIGC安全性、AI可解釋性、AI魯棒性三項檢測工具,可服務(wù)于數(shù)字金融、教育、文化、醫(yī)療、電商等領(lǐng)域的大規(guī)模復(fù)雜業(yè)務(wù)場景。

螞蟻集團(tuán)大安全事業(yè)群技術(shù)部總裁李俊奎表示,“生成式大模型是一種‘深黑盒’技術(shù),‘蟻鑒2.0’通過智能博弈對抗技術(shù),模擬黑產(chǎn)以及自動化生成海量測試集,可實現(xiàn)‘生成式機(jī)器人’對‘AIGC生成式模型’的誘導(dǎo)式檢測計算,很像一個24小時不眠不休的‘安全黑客’在找茬大模型,從而找到大模型存在的弱點(diǎn)和安全問題所在?!?/p>

據(jù)了解,“蟻鑒2.0”集成了螞蟻近10年可信AI實踐、1000余項可信AI專利,支持零編碼測評。開發(fā)者通過API接口,將AI模型接入蟻鑒,就可以一鍵識別和挖掘模型漏洞。

此次論壇上,中國信通院、上海人工智能實驗室、武漢大學(xué)、螞蟻集團(tuán)等多家單位共同發(fā)起《AIGC可信倡議》,圍繞人工智能可能引發(fā)的經(jīng)濟(jì)、安全、隱私和數(shù)據(jù)治理等問題,提出構(gòu)建AIGC可信發(fā)展的全球治理合作框架,采用安全可信的數(shù)據(jù)資源、技術(shù)框架、計算方法和軟件平臺等全面提升AIGC可信工程化能力,最大限度確保生成式AI安全、透明、可釋。

標(biāo)簽:

推薦

財富更多》

動態(tài)更多》

熱點(diǎn)