恒腦智鑒技術(shù)支撐|《Top開源大模型安全測評報告(2024)》發(fā)布
近日,中國軟件評測中心(工業(yè)和信息化部軟件與集成電路促進中心)安全事業(yè)部聯(lián)合安恒信息、數(shù)據(jù)安全關(guān)鍵技術(shù)與產(chǎn)業(yè)應(yīng)用評價工業(yè)和信息化部重點實驗室、中國計算機行業(yè)協(xié)會數(shù)據(jù)安全專業(yè)委員會,共同開展國內(nèi)外開源大模型的安全性、公平性和可靠性研究,并發(fā)布《Top開源大模型安全測評報告(2024)》,為行業(yè)提供了寶貴的參考和指導(dǎo)。

詳見公眾號:中國數(shù)據(jù)安全產(chǎn)業(yè)網(wǎng)
本次測評從國家安全、道德倫理、公民權(quán)利、公共安全、歷史文化、醫(yī)療衛(wèi)生、隱私信息、不良信息、商業(yè)金融、基礎(chǔ)安全、網(wǎng)絡(luò)安全和模型濫用等12個方面,對典型的12家20款開源大模型展開深入安全測評,由安恒大模型風(fēng)險評估產(chǎn)品-恒腦智鑒提供技術(shù)支撐。
根據(jù)《Top開源大模型安全測評報告(2024)》表明,無論是國外還是國內(nèi),都面臨著較高的安全風(fēng)險,全球人工智能安全治理變得尤為迫切。在安全風(fēng)險類型上,國內(nèi)外開源大模型在公共安全、道德倫理、不良信息和網(wǎng)絡(luò)安全等方面測試通過率較低,顯示出在這些領(lǐng)域的安全防護能力不足。特別是在抵御特殊構(gòu)造指令攻擊方面,模型容易被誤導(dǎo),導(dǎo)致輸出有害內(nèi)容??傮w來看,國內(nèi)外開源大模型的安全風(fēng)險不容忽視,內(nèi)容安全防護能力較為薄弱,且在安全研究方面的投入相對較少。

安恒信息始終致力于推動AI技術(shù)的健康發(fā)展,旗下恒腦智鑒產(chǎn)品是一套專為評估和緩解大模型在數(shù)據(jù)處理、模型構(gòu)建和應(yīng)用部署中的風(fēng)險而設(shè)計的風(fēng)險管理平臺。結(jié)合先進的內(nèi)容檢測引擎,幫助客戶檢測大模型生成內(nèi)容風(fēng)險,保障信息輸出遵守法律法規(guī),維護企業(yè)品牌形象和避免法律風(fēng)險。此外,系統(tǒng)還深入評估AI基礎(chǔ)設(shè)施的網(wǎng)絡(luò)安全風(fēng)險,識別潛在威脅,加強客戶的大模型數(shù)據(jù)完整性和AI業(yè)務(wù)連續(xù)性。
恒腦智鑒不僅為本次評測提供了重要支撐,更為大模型的安全發(fā)展樹立了標(biāo)桿。安恒信息將繼續(xù)致力于AI大模型的安全研究,不斷探索新的安全技術(shù)和解決方案。我們期待與業(yè)界同仁一起,共同推動人工智能技術(shù)的健康發(fā)展,為構(gòu)建一個更加安全、智能的世界貢獻力量。

掃一掃下載報告原文
相關(guān)推薦
- 解讀丨構(gòu)建新型韌性網(wǎng)絡(luò) 助力打造韌性城市
- 且看安恒零信任如何攜手釘釘,成為客戶最佳拍檔
- 歡迎申報!教育部第四期供需對接就業(yè)育人項目——安恒信息項目申報指南發(fā)布
- 深圳市大鵬新區(qū)政數(shù)局與安恒信息簽約共建數(shù)據(jù)要素創(chuàng)新安全實驗室
- 安恒信息深度參與:網(wǎng)絡(luò)安全產(chǎn)品互聯(lián)互通首項國標(biāo)發(fā)布
- 守護能源基石:安恒信息煤礦行業(yè)工業(yè)網(wǎng)絡(luò)安全建設(shè)案例
- 唯一入選安全垂域大模型|恒腦入選工信部先進計算賦能新質(zhì)生產(chǎn)力典型應(yīng)用案例