首頁 > 關(guān)于我們 > 安恒動態(tài) > 2024 > 正文

恒腦智鑒技術(shù)支撐｜《Top開源大模型安全測評報告(2024)》發(fā)布

閱讀量：次 文章來源：安恒信息

近日，中國軟件評測中心（工業(yè)和信息化部軟件與集成電路促進中心）安全事業(yè)部聯(lián)合安恒信息、數(shù)據(jù)安全關(guān)鍵技術(shù)與產(chǎn)業(yè)應(yīng)用評價工業(yè)和信息化部重點實驗室、中國計算機行業(yè)協(xié)會數(shù)據(jù)安全專業(yè)委員會，共同開展國內(nèi)外開源大模型的安全性、公平性和可靠性研究，并發(fā)布《Top開源大模型安全測評報告(2024)》，為行業(yè)提供了寶貴的參考和指導(dǎo)。

詳見公眾號：中國數(shù)據(jù)安全產(chǎn)業(yè)網(wǎng)

本次測評從國家安全、道德倫理、公民權(quán)利、公共安全、歷史文化、醫(yī)療衛(wèi)生、隱私信息、不良信息、商業(yè)金融、基礎(chǔ)安全、網(wǎng)絡(luò)安全和模型濫用等12個方面，對典型的12家20款開源大模型展開深入安全測評，由安恒大模型風(fēng)險評估產(chǎn)品-恒腦智鑒提供技術(shù)支撐。

根據(jù)《Top開源大模型安全測評報告(2024)》表明，無論是國外還是國內(nèi)，都面臨著較高的安全風(fēng)險，全球人工智能安全治理變得尤為迫切。在安全風(fēng)險類型上，國內(nèi)外開源大模型在公共安全、道德倫理、不良信息和網(wǎng)絡(luò)安全等方面測試通過率較低，顯示出在這些領(lǐng)域的安全防護能力不足。特別是在抵御特殊構(gòu)造指令攻擊方面，模型容易被誤導(dǎo)，導(dǎo)致輸出有害內(nèi)容?？傮w來看，國內(nèi)外開源大模型的安全風(fēng)險不容忽視，內(nèi)容安全防護能力較為薄弱，且在安全研究方面的投入相對較少。

安恒信息始終致力于推動AI技術(shù)的健康發(fā)展，旗下恒腦智鑒產(chǎn)品是一套專為評估和緩解大模型在數(shù)據(jù)處理、模型構(gòu)建和應(yīng)用部署中的風(fēng)險而設(shè)計的風(fēng)險管理平臺。結(jié)合先進的內(nèi)容檢測引擎，幫助客戶檢測大模型生成內(nèi)容風(fēng)險，保障信息輸出遵守法律法規(guī)，維護企業(yè)品牌形象和避免法律風(fēng)險。此外，系統(tǒng)還深入評估AI基礎(chǔ)設(shè)施的網(wǎng)絡(luò)安全風(fēng)險，識別潛在威脅，加強客戶的大模型數(shù)據(jù)完整性和AI業(yè)務(wù)連續(xù)性。

恒腦智鑒不僅為本次評測提供了重要支撐，更為大模型的安全發(fā)展樹立了標(biāo)桿。安恒信息將繼續(xù)致力于AI大模型的安全研究，不斷探索新的安全技術(shù)和解決方案。我們期待與業(yè)界同仁一起，共同推動人工智能技術(shù)的健康發(fā)展，為構(gòu)建一個更加安全、智能的世界貢獻力量。