在人工智能技術(shù)快速發(fā)展的背景下,AI瀏覽器代理的廣泛應(yīng)用引發(fā)了新的安全挑戰(zhàn)。這類代理能夠模擬人類用戶操作,完成電子郵件收發(fā)、在線銀行交易等敏感任務(wù),其高權(quán)限訪問特性為網(wǎng)絡(luò)攻擊者提供了可乘之機(jī)。近期,科技公司Perplexity針對(duì)這一隱患推出新型安全系統(tǒng)BrowseSafe,通過技術(shù)創(chuàng)新構(gòu)建起多層次防護(hù)體系。
傳統(tǒng)安全評(píng)估工具在應(yīng)對(duì)復(fù)雜網(wǎng)絡(luò)攻擊時(shí)暴露出明顯短板。以AgentDojo為代表的現(xiàn)有基準(zhǔn)測試主要依賴簡單提示場景,難以模擬真實(shí)環(huán)境中的多樣化攻擊手法。攻擊者常將惡意指令嵌入網(wǎng)頁隱藏區(qū)域,誘導(dǎo)AI代理執(zhí)行未經(jīng)授權(quán)的操作,例如將用戶數(shù)據(jù)傳輸至第三方服務(wù)器。這種隱蔽性攻擊方式對(duì)現(xiàn)有檢測系統(tǒng)構(gòu)成嚴(yán)峻考驗(yàn)。
BrowseSafe系統(tǒng)采用混合專家架構(gòu)設(shè)計(jì),在保持用戶體驗(yàn)流暢性的同時(shí)實(shí)現(xiàn)實(shí)時(shí)安全掃描。該系統(tǒng)通過三個(gè)核心維度構(gòu)建攻擊檢測模型:攻擊類型分類、注入策略識(shí)別和語言風(fēng)格分析,特別針對(duì)"看似無害實(shí)則危險(xiǎn)"的偽裝內(nèi)容進(jìn)行重點(diǎn)篩查。測試數(shù)據(jù)顯示,系統(tǒng)對(duì)Prompt注入攻擊的識(shí)別準(zhǔn)確率達(dá)到91%,較GPT-5等前沿模型提升6個(gè)百分點(diǎn),較同類產(chǎn)品PromptGuard-2高出56個(gè)百分點(diǎn)。
在防御策略構(gòu)建方面,Perplexity創(chuàng)新性地采用三層防護(hù)機(jī)制。首層通過快速分類器實(shí)現(xiàn)初步過濾,第二層運(yùn)用基于推理的大語言模型進(jìn)行深度分析,最終形成完整的安全防護(hù)閉環(huán)。這種架構(gòu)設(shè)計(jì)既保證了檢測效率,又提升了復(fù)雜攻擊的識(shí)別能力。不過測試也發(fā)現(xiàn)系統(tǒng)存在改進(jìn)空間,例如對(duì)多語言攻擊的檢測率降至76%,HTML注釋區(qū)域的惡意代碼比頁面顯性區(qū)域的更難被發(fā)現(xiàn)。
為推動(dòng)行業(yè)安全標(biāo)準(zhǔn)升級(jí),Perplexity決定開源BrowseSafe相關(guān)技術(shù)資源,包括評(píng)估基準(zhǔn)、模型架構(gòu)和研究論文。此舉旨在通過開放協(xié)作提升整體防護(hù)水平,應(yīng)對(duì)不斷演變的網(wǎng)絡(luò)攻擊形態(tài)。公司安全團(tuán)隊(duì)負(fù)責(zé)人表示,盡管當(dāng)前系統(tǒng)已能攔截絕大多數(shù)攻擊,但仍有約9%的復(fù)雜攻擊手法可能突破防線,這凸顯出持續(xù)技術(shù)迭代的重要性。
劃重點(diǎn):











