360智腦張向征:共建可信可控AI生態(tài) 應(yīng)對(duì)大模型安全挑戰(zhàn)
【環(huán)球科技網(wǎng)】人工智能的加速發(fā)展,有力推動(dòng)了社會(huì)的數(shù)智化轉(zhuǎn)型;與此同時(shí),帶來(lái)的相關(guān)安全風(fēng)險(xiǎn)也日益凸顯。近日,在北京市舉辦的通明湖人工智能開發(fā)與應(yīng)用大會(huì)上,360智腦總裁張向征以“大模型安全研究與實(shí)踐”為主題,向業(yè)界分享了大模型安全領(lǐng)域的最新研究成果和實(shí)踐經(jīng)驗(yàn)。

張向征表示,大模型是數(shù)智化時(shí)代的重要基礎(chǔ)設(shè)施,其應(yīng)用貫穿眾多行業(yè)和領(lǐng)域,但伴隨而來(lái)的安全挑戰(zhàn)同樣不容忽視。大模型的開發(fā)、訓(xùn)練、推理和應(yīng)用涉及復(fù)雜的軟件生態(tài)系統(tǒng),這一過(guò)程中,數(shù)據(jù)泄露、模型投毒、提示注入攻擊、幻覺問題等安全隱患貫穿始終。張向征強(qiáng)調(diào),保障大模型安全,不僅是維護(hù)企業(yè)利益的關(guān)鍵,更是確保社會(huì)公共安全的必要舉措。
張向征提出,大模型安全面臨四大核心挑戰(zhàn):大模型軟件生態(tài)系統(tǒng)安全、內(nèi)容安全、幻覺問題和Agent流程可控。針對(duì)這些挑戰(zhàn),360智腦團(tuán)隊(duì)基于多年安全研究積累,提出了一套完整的安全防護(hù)體系,包括全鏈路檢測(cè)、防護(hù)、攻擊與測(cè)評(píng)的閉環(huán)流程。
在大模型軟件生態(tài)系統(tǒng)安全方面,360智腦通過(guò)自主研發(fā)的檢測(cè)工具與多層次安全評(píng)估方法,可及時(shí)發(fā)現(xiàn)和修復(fù)潛在漏洞,為開發(fā)者和用戶提供全面的技術(shù)支持。此外,針對(duì)提示注入攻擊、持久性提示劫持、記憶投毒等新型安全威脅,團(tuán)隊(duì)研發(fā)了精準(zhǔn)識(shí)別與多重防御機(jī)制,顯著提升了模型對(duì)惡意行為的抗干擾能力。
內(nèi)容安全方面,張向征分享了360智腦的實(shí)踐經(jīng)驗(yàn)。團(tuán)隊(duì)通過(guò)持續(xù)預(yù)訓(xùn)練、安全微調(diào)和安全強(qiáng)化對(duì)齊等手段,結(jié)合國(guó)標(biāo)TC260的要求,構(gòu)建了“大模型原生安全增強(qiáng)”“內(nèi)容安全護(hù)欄”兩大防護(hù)方案,有效減少模型輸出中可能涉及的歧視偏見、違禁內(nèi)容和其他不良信息。在實(shí)際應(yīng)用中,這些措施幫助大模型在金融、醫(yī)療和教育等行業(yè)更安全、更高效地提供服務(wù)。
針對(duì)備受關(guān)注的大模型幻覺問題,360智腦創(chuàng)新性地引入幻覺檢測(cè)Agent技術(shù),能夠?qū)δP偷妮敵鲞M(jìn)行實(shí)時(shí)評(píng)估與修正。通過(guò)結(jié)合外部知識(shí)庫(kù)和搜索增強(qiáng)功能,該技術(shù)有效降低了幻覺發(fā)生率,提升了模型的決策可信度。張向征透露,得益于這一技術(shù),360智腦在AI搜索場(chǎng)景中的用戶體驗(yàn)提升了32%。
此外,在Agent流程可控方面,360智腦構(gòu)建了一套針對(duì)多Agent協(xié)作任務(wù)的流程監(jiān)控與管理機(jī)制,通過(guò)實(shí)時(shí)監(jiān)測(cè)和動(dòng)態(tài)調(diào)整,確保模型任務(wù)執(zhí)行的全程可控性與透明性。這一舉措不僅有效降低了操作偏差的風(fēng)險(xiǎn),還為復(fù)雜任務(wù)的安全性提供了有力保障。
演講還介紹了新型攻擊方式的風(fēng)險(xiǎn)評(píng)估與應(yīng)對(duì)策略。隨著大模型應(yīng)用的加深,基于自然語(yǔ)言到代碼的間接提示注入(NL2SHELL)等攻擊正日益增多。對(duì)此,360智腦利用自主研發(fā)的安全評(píng)測(cè)大模型,結(jié)合紅隊(duì)攻擊模型,通過(guò)對(duì)抗方式快速識(shí)別潛在威脅,并持續(xù)優(yōu)化模型的安全策略。
張向征表示,大模型安全不僅是技術(shù)問題,更是行業(yè)共同面臨的課題,只有在保障大模型安全的前提下,才能真正釋放AI的無(wú)限可能。360智腦致力于與產(chǎn)業(yè)伙伴協(xié)作,共建安全可信的AI生態(tài)。他呼吁全行業(yè)關(guān)注大模型的“檢、防、攻、測(cè)”體系建設(shè),通過(guò)技術(shù)創(chuàng)新與資源共享,共同推動(dòng)大模型在社會(huì)各領(lǐng)域的落地與發(fā)展。
【免責(zé)聲明】:
凡注明 “環(huán)球科技網(wǎng)” 字樣的圖片或文字內(nèi)容均屬于本網(wǎng)站專稿,如需轉(zhuǎn)載圖片請(qǐng)保留 “環(huán)球科技網(wǎng)” 水印,轉(zhuǎn)載文字內(nèi)容請(qǐng)注明來(lái)源“環(huán)球科技網(wǎng)”;凡本網(wǎng)注明“來(lái)源:XXX(非環(huán)球科技網(wǎng))”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其作品內(nèi)容的實(shí)質(zhì)真實(shí)性負(fù)責(zé),轉(zhuǎn)載信息版權(quán)屬于原媒體及作者。如轉(zhuǎn)載內(nèi)容涉及版權(quán)或者其他問題,請(qǐng)投訴至郵箱;1978751725@qq.com
本網(wǎng)公告
環(huán)球科技網(wǎng)從不發(fā)布負(fù)面新聞資訊,也絕不會(huì)發(fā)布負(fù)面信息。如發(fā)現(xiàn)負(fù)面信息鏈接請(qǐng)甄別是否為環(huán)球科技網(wǎng)所發(fā)。
本網(wǎng)系北京伯樂傳媒廣告有限公司主辦、所有。本網(wǎng)唯一域名(www.www.lzsczx.com),其它域名鏈接均為假冒。望廣大網(wǎng)民及企業(yè)主認(rèn)真甄別。
咨詢、采訪、合作、投稿等請(qǐng)致電:13911566744(含微信)