日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

為什么Agent總是Demo猛如龍實戰(zhàn)一條蟲?

   時間:2025-12-22 23:04:37 來源:量子位編輯:快訊 IP:北京 發(fā)表評論無障礙通道
 

為什么Agent在演示時無所不能,到了實際場景卻頻頻拉胯?

一篇長達51頁的論文研究了自ChatGPT以來的主要智能體,給出參考框架:適應(yīng)性是其中關(guān)鍵。

智能體定義上不是只會被動回答的AI,而是能自己規(guī)劃、用工具(比如搜索引擎、代碼編譯器、數(shù)據(jù)庫)、記東西,一步步完成復雜任務(wù)。

當遇到新任務(wù)、新環(huán)境時,不需要重造一個新的智能體,而是通過 “微調(diào)自己” 或 “優(yōu)化工具”,快速適配需求(比如從寫普通代碼適配到寫垂直行業(yè)代碼)。

這篇論文作者陣容豪華,來自UIUC、斯坦福、普林斯頓、哈佛、UC伯克利等12所高校的三十多位研究者聯(lián)手,由UIUC的韓家煒教授團隊領(lǐng)銜,共同一作Pengcheng Jiang,Jiacheng Lin,Zhiyi Shi為UIUC博士生。

Agent“適應(yīng)性”的四個象限

團隊認為,當前Agent系統(tǒng)的核心瓶頸在于適應(yīng)性:模型如何根據(jù)反饋信號調(diào)整自身行為。

為此,他們提出了一個2×2的分類框架,把現(xiàn)有的適應(yīng)方法切成了四大范式。

第一個維度是“優(yōu)化誰”:是優(yōu)化Agent本身(Agent Adaptation),還是它調(diào)用的工具(Tool Adaptation)。

第二個維度是“信號從哪來”:是來自工具執(zhí)行的結(jié)果,還是來自Agent最終輸出的評估。

據(jù)此分成四類:

A1范式讓Agent根據(jù)工具執(zhí)行的反饋來學習,比如代碼能不能跑通、檢索結(jié)果準不準。

A2范式則是用Agent的最終答案作為優(yōu)化信號,典型代表就是DeepSeek-R1這類用強化學習訓練推理能力的工作。

T1范式是即插即用:工具獨立訓練好,Agent直接調(diào)用,比如SAM、CLIP這些預(yù)訓練模型。

T2范式讓工具反過來根據(jù)Agent的輸出來優(yōu)化自己,形成一種共生適應(yīng)的關(guān)系。

這樣分類之后,有兩個好處:

開發(fā)遇到問題時,不用盲目試錯。想讓AI更擅長工具的使用細”,就選 A1;想讓整體推理更靠譜,就選A2;想讓工具通用好用,就選T1;想讓工具適配特定AI,就選 T2。

另外也明確了trade-off。改AI(A1/A2)靈活但成本更高,需要重新訓練模型。改工具(T1/T2)省錢,但受限于 AI 本身的能力。

論文中還有一個關(guān)鍵發(fā)現(xiàn):T2范式的數(shù)據(jù)效率遠超A2范式。

以檢索增強生成任務(wù)為例,Search-R1采用A2范式端到端訓練Agent,需要約17萬條訓練樣本。

而采用T2范式,只訓練一個輕量級的搜索子智能體來服務(wù)凍結(jié)的主模型,僅用2400條樣本就達到了相當?shù)男Ч?shù)據(jù)量減少了約70倍,訓練速度快了33倍。

更值得注意的是泛化能力的差異。在醫(yī)學問答這種專業(yè)領(lǐng)域測試中,T2訓練的智能體達到了76.6%的準確率,而A2訓練的Search-R1只有71.8%。

論文分析認為,這是因為A2范式要求模型同時學習領(lǐng)域知識、工具使用技能和任務(wù)推理三件事,優(yōu)化空間過于復雜;而T2范式下,凍結(jié)的大模型已經(jīng)具備知識和推理能力,小模型只需要學習“怎么搜”這一項程序性技能。

四大前沿方向指路

論文最后指出了Agent適應(yīng)性研究的四個前沿方向。

協(xié)同適應(yīng)(Co-Adaptation)是最具挑戰(zhàn)性的課題。目前幾乎所有方法都是“凍一個、調(diào)一個”,但未來理想的系統(tǒng)應(yīng)該讓Agent和工具在同一個學習循環(huán)中相互優(yōu)化。這帶來了復雜的信用分配問題:任務(wù)失敗了,到底該怪Agent還是工具?

持續(xù)適應(yīng)(Continual Adaptation)針對的是真實世界的非平穩(wěn)性。任務(wù)分布會隨時間變化,工具會更新,用戶需求會演進。如何讓Agent持續(xù)學習新技能而不遺忘舊能力,是部署層面的核心難題。

安全適應(yīng)(Safe Adaptation)揭示了一個令人擔憂的現(xiàn)象:大模型在強化學習優(yōu)化推理能力的過程中,會逐漸侵蝕掉監(jiān)督微調(diào)階段建立的安全護欄。模型學會了用復雜的“思維鏈”給自己的違規(guī)行為編造理由,反而更容易被越獄攻擊。

高效適應(yīng)(Efficient Adaptation)關(guān)注的是資源受限場景。論文介紹了LoRA在強化學習中的應(yīng)用、FlashRL的量化加速技術(shù),以及端側(cè)設(shè)備的個性化適應(yīng)方案。

這篇綜述的GitHub倉庫已經(jīng)開放,持續(xù)收錄相關(guān)論文和資源。對于正在搭建Agent系統(tǒng)的開發(fā)者來說,這份51頁的“適應(yīng)性指南”或許能避開一些坑。

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭議稿件處理  |  English Version
 
日本精品一区二区三区高清 久久
91一区二区三区在线观看| 国产日韩欧美一区二区三区乱码 | 亚洲永久精品大片| 亚洲超碰精品一区二区| 免费的成人av| 国产精品一区专区| 91免费观看视频在线| 欧美日韩成人高清| 久久久蜜桃精品| 一区二区三区四区国产精品| 日日噜噜夜夜狠狠视频欧美人| 狠狠色丁香九九婷婷综合五月| 成人免费视频app| 欧美日韩国产在线观看| 久久久久久久久99精品| 亚洲激情中文1区| 美女久久久精品| av中文字幕一区| 91精品视频网| 中文字幕日本不卡| 偷拍一区二区三区| 成人午夜av电影| 制服丝袜日韩国产| 亚洲欧洲色图综合| 久久er99热精品一区二区| 91麻豆成人久久精品二区三区| 日韩欧美激情在线| 亚洲精品视频在线观看免费 | 国产丝袜美腿一区二区三区| 一个色在线综合| 国产ts人妖一区二区| 5858s免费视频成人| 亚洲色图视频网站| 国产九九视频一区二区三区| 精品视频色一区| 亚洲天堂福利av| 极品美女销魂一区二区三区免费 | 一区二区三区中文字幕电影| 国产精品中文欧美| 日韩一区二区三区四区| 一区二区三区欧美日| 国产成a人无v码亚洲福利| 777精品伊人久久久久大香线蕉| 国产精品激情偷乱一区二区∴| 男女男精品网站| 欧美性一二三区| 一区在线中文字幕| 国产成人一区二区精品非洲| 日韩欧美亚洲一区二区| 午夜精品久久久久久久久| 91在线精品一区二区| 久久精品视频网| 久久国产精品免费| 欧美疯狂性受xxxxx喷水图片| 亚洲人xxxx| 99免费精品在线| 中文字幕不卡在线观看| 国产一区啦啦啦在线观看| 欧美一区二区黄色| 香蕉乱码成人久久天堂爱免费| 色天使色偷偷av一区二区| 韩日精品视频一区| 欧美一区二区三区色| 亚洲第一福利视频在线| 在线观看亚洲a| 亚洲另类在线视频| 色综合天天综合网天天看片| 国产精品传媒视频| 成人av电影免费观看| 亚洲国产高清不卡| 成人激情免费视频| 国产精品久久久久久久久久久免费看 | 国产一区亚洲一区| 久久免费精品国产久精品久久久久| 免费人成网站在线观看欧美高清| 在线播放亚洲一区| 日本欧美一区二区在线观看| 欧美日韩成人综合天天影院 | 欧美一区二区大片| 日韩成人一区二区三区在线观看| 欧美日本在线观看| 日本中文字幕一区二区有限公司| 欧美疯狂做受xxxx富婆| 蜜乳av一区二区| 精品国产乱子伦一区| 国产在线精品一区二区| 国产丝袜欧美中文另类| av影院午夜一区| 亚洲女人的天堂| 91福利在线播放| 五月激情综合色| 日韩三级视频在线观看| 国内不卡的二区三区中文字幕| 国产欧美久久久精品影院| eeuss鲁片一区二区三区在线看| 日韩毛片在线免费观看| 欧美亚洲一区二区三区四区| 亚洲国产一区二区视频| 日韩欧美亚洲另类制服综合在线 | 国产亚洲成年网址在线观看| 高清视频一区二区| 亚洲免费观看高清完整版在线| 欧美视频在线一区| 美女一区二区视频| 国产欧美日韩在线视频| 在线精品观看国产| 免费亚洲电影在线| 欧美激情艳妇裸体舞| 在线观看91精品国产入口| 青青草视频一区| 欧美经典一区二区| 欧美亚洲尤物久久| 国产美女一区二区| 亚洲综合免费观看高清完整版在线| 欧美一级电影网站| 99久久99久久精品国产片果冻| 亚洲成年人影院| 国产视频一区二区在线| 日本国产一区二区| 国内精品国产三级国产a久久| 亚洲视频 欧洲视频| 日韩欧美卡一卡二| 一本一道久久a久久精品| 久久机这里只有精品| 亚洲美女少妇撒尿| 久久久亚洲午夜电影| 欧美日韩精品一区二区三区| 国产精品自拍三区| 亚洲线精品一区二区三区| 久久久噜噜噜久久人人看| 欧美三电影在线| 成人一区二区视频| 男男视频亚洲欧美| 亚洲欧美一区二区不卡| 精品福利视频一区二区三区| 色婷婷激情综合| 国产精品18久久久久久久网站| 亚洲电影在线播放| 亚洲欧美在线观看| 精品国产乱码久久| 欧美日韩一区二区在线视频| 国产成人精品免费网站| 日韩av网站免费在线| 最新日韩在线视频| www国产精品av| 欧美日韩免费不卡视频一区二区三区| 国产91精品入口| 美女任你摸久久| 偷拍与自拍一区| 亚洲视频中文字幕| 久久精品免视看| 日韩午夜av电影| 精品视频在线视频| 色综合天天综合网天天看片| 成人中文字幕在线| 国产综合久久久久久鬼色| 亚洲v日本v欧美v久久精品| 最近日韩中文字幕| 国产欧美精品一区二区三区四区| 日韩一级片网址| 欧美日韩久久一区| 欧美在线啊v一区| 91丝袜国产在线播放| 成人精品在线视频观看| 国产高清亚洲一区| 国产乱码精品一区二区三区五月婷| 麻豆精品一区二区三区| 青草国产精品久久久久久| 亚洲国产精品久久久男人的天堂| 亚洲同性gay激情无套| ...xxx性欧美| 一区在线观看免费| 亚洲欧美一区二区三区孕妇| 中文av一区二区| 国产精品视频在线看| 国产农村妇女毛片精品久久麻豆| 久久亚洲私人国产精品va媚药| 欧美电影免费提供在线观看| 91精品国产高清一区二区三区蜜臀| 欧美色老头old∨ideo| 欧美人与禽zozo性伦| 欧美剧情电影在线观看完整版免费励志电影| 色婷婷综合久久久久中文一区二区| 99这里都是精品| 99re热视频精品| 欧美中文字幕一二三区视频| 91久久精品一区二区三| 91黄色激情网站| 欧美日韩1234| 欧美一级欧美三级在线观看 | 精品一区二区三区香蕉蜜桃| 免费成人在线影院| 韩国视频一区二区| 国产精品一级片在线观看| 国产宾馆实践打屁股91| 91亚洲精品久久久蜜桃网站| 色噜噜狠狠色综合中国| 欧美日韩日日夜夜| 欧美一卡2卡3卡4卡| 久久久www成人免费无遮挡大片|