隨著AI瀏覽器市場(chǎng)競(jìng)爭(zhēng)加劇,以O(shè)penAI Atlas為代表的新一代產(chǎn)品憑借自然語(yǔ)言驅(qū)動(dòng)的網(wǎng)頁(yè)自動(dòng)化功能引發(fā)關(guān)注,但同時(shí)也催生了新型網(wǎng)絡(luò)安全威脅。由南洋理工大學(xué)牽頭,聯(lián)合香港理工大學(xué)、夏瑪諾阿分校共同研發(fā)的WebCloak防御系統(tǒng),通過(guò)創(chuàng)新性的網(wǎng)頁(yè)結(jié)構(gòu)與語(yǔ)義混淆技術(shù),為數(shù)據(jù)安全構(gòu)建起輕量化防護(hù)屏障。
研究團(tuán)隊(duì)發(fā)現(xiàn),當(dāng)前主流Web Agent均采用"解析-理解"雙層工作流:首先通過(guò)工具壓縮網(wǎng)頁(yè)結(jié)構(gòu)至千級(jí)token量級(jí),再由大語(yǔ)言模型提取目標(biāo)數(shù)據(jù)。這種技術(shù)范式雖提升自動(dòng)化效率,卻形成三大安全隱患:模擬真實(shí)瀏覽器環(huán)境繞過(guò)IP審查、破解驗(yàn)證碼成功率攀升、防御系統(tǒng)計(jì)算成本過(guò)高。更嚴(yán)峻的是,LLM技術(shù)已將爬蟲(chóng)開(kāi)發(fā)門(mén)檻降至冰點(diǎn)——新手使用Gemini-2.5-Pro生成腳本僅需1.5分鐘,效果優(yōu)于31分鐘完成的專(zhuān)家方案。
針對(duì)這一技術(shù)漏洞,WebCloak構(gòu)建了雙層防御體系。在結(jié)構(gòu)層面,系統(tǒng)通過(guò)加密隨機(jī)生成器動(dòng)態(tài)修改HTML標(biāo)簽,每次用戶(hù)會(huì)話(huà)生成獨(dú)特結(jié)構(gòu),同時(shí)植入標(biāo)準(zhǔn)格式的蜜罐地址。配套的客戶(hù)端腳本能在0.052秒內(nèi)完成視覺(jué)還原,通過(guò)Shadow DOM技術(shù)隱藏真實(shí)資源地址,確保人類(lèi)用戶(hù)無(wú)感知瀏覽。該機(jī)制已實(shí)現(xiàn)對(duì)圖片、文本、音頻等多類(lèi)型資產(chǎn)的統(tǒng)一防護(hù)。
語(yǔ)義防御層面,系統(tǒng)采用"精準(zhǔn)注入-對(duì)抗優(yōu)化"策略。防御模型在目標(biāo)元素前后及屬性位置插入三類(lèi)誤導(dǎo)線索:包括偽造的API驗(yàn)證提示、安全策略觸發(fā)語(yǔ)句和虛假解密指引。這些經(jīng)過(guò)GPT-4o-mini生成與GPT-4驗(yàn)證的語(yǔ)義陷阱,與網(wǎng)頁(yè)上下文深度融合,手動(dòng)清除成本高昂。實(shí)驗(yàn)顯示,即使攻擊者刪除90%的誤導(dǎo)信息,主流Web Agent的爬蟲(chóng)召回率仍被壓制在21.2%以下。
基于自建的LLMCrawlBench基準(zhǔn)數(shù)據(jù)集(覆蓋50個(gè)熱門(mén)網(wǎng)站的237個(gè)網(wǎng)頁(yè)快照),測(cè)試結(jié)果表明該系統(tǒng)對(duì)三類(lèi)主流Web Agent實(shí)現(xiàn)完全阻斷:Gemini-2.5-pro(L2S)、Crawl4AI(LNC)、Browser-Use(LWA)的爬蟲(chóng)召回率從平均88.7%降至零。面對(duì)已知防御機(jī)制的自適應(yīng)攻擊,L2S和LNC的突破成功率分別僅有0.3%和1.58%。系統(tǒng)性能開(kāi)銷(xiāo)控制出色,服務(wù)器端配置生成僅需3分鐘/頁(yè),客戶(hù)端還原延遲0.052秒,頁(yè)面體積增幅20.8%。用戶(hù)盲測(cè)顯示,91%的參與者未察覺(jué)瀏覽體驗(yàn)變化,視覺(jué)相似度評(píng)估達(dá)99.9%。
這項(xiàng)突破性技術(shù)已實(shí)現(xiàn)全平臺(tái)兼容,支持Chrome、Firefox等主流瀏覽器及Windows、macOS等操作系統(tǒng),特別適用于電商平臺(tái)、內(nèi)容創(chuàng)作等數(shù)據(jù)敏感場(chǎng)景。研究團(tuán)隊(duì)已公開(kāi)項(xiàng)目主頁(yè)與論文鏈接,并提供完整代碼庫(kù)。當(dāng)前系統(tǒng)版本通過(guò)動(dòng)態(tài)混淆邏輯優(yōu)化,已具備應(yīng)對(duì)未來(lái)Web Agent技術(shù)演進(jìn)的基礎(chǔ)能力。











