日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

UCSD與英特爾聯手推出PettingLLMs框架,多智能體協同訓練提升LLM任務表現

   時間:2025-11-08 13:51:47 來源:互聯網編輯:快訊 IP:北京 發表評論無障礙通道
 

在大語言模型(LLM)驅動的智能體研究領域,多智能體協作的強化學習機制長期面臨技術瓶頸。現有訓練框架普遍聚焦單智能體優化,而醫療診斷、科研探索、復雜編程等場景中,多智能體協同工作流已被證明能顯著提升任務表現。針對這一矛盾,來自加州大學圣地亞哥分校與英特爾的聯合研究團隊,提出了首個通用化多智能體強化學習框架PettingLLMs,實現了跨任務、跨模型規模的群體智能進化。

傳統強化學習算法GRPO(Group Relative Policy Optimization)通過同一上下文生成候選回答并計算相對優勢,但其核心假設要求比較組內所有回答必須基于完全相同的輸入提示(prompt)。在多智能體多輪交互場景中,這一條件難以滿足——不同智能體在不同輪次接收的提示往往包含歷史對話、其他智能體生成的中間結果等動態信息。例如編程任務中,第二輪的提示可能同時包含原始需求、智能體A生成的代碼框架以及智能體B編寫的單元測試用例。若強行將跨輪次、跨智能體的回答納入同一比較組,將直接破壞GRPO的公平性假設,導致優勢計算基準混亂。

研究團隊提出的解決方案包含兩大核心創新。首先是基于貪心搜索的樹狀采樣機制:每個輪次中,每個智能體作為節點進行K次分支探索,系統動態選擇當前獎勵值最高的智能體路徑進行下一輪擴展。這種設計在保證組內回答批次量的同時,通過動態路徑選擇維持了優勢計算的公平性。其次是角色-全局雙獎勵函數:每個智能體的獎勵既包含角色專屬目標(如代碼生成質量),也納入全局任務指標(如系統整體通過率),確保個體能力進化與群體協作的平衡。

為支持不同場景下的訓練需求,研究團隊構建了異步分發訓練系統。該系統通過路由模塊智能分配數據流:在專屬模型模式下,不同智能體的交互軌跡被定向發送至獨立資源池進行模型更新;共享模型模式下,所有軌跡數據則匯總至同一資源池進行聯合優化。這種靈活架構使得研究人員可根據任務特性,在角色專業化與模型通用化之間自由切換。

開源框架PettingLLMs大幅降低了多智能體強化學習的開發門檻。開發者僅需定義任務特定的智能體交互邏輯與獎勵函數,即可利用框架內置的采樣算法、資源調度系統和環境適配接口快速構建訓練環境。框架支持不同模型與智能體的自由映射,并兼容LoRA等輕量化適配技術。目前,框架已預置數學推理、代碼生成、策略游戲等主流任務環境,并提供完整的環境開發教程。

實證研究覆蓋Qwen3-1.7B與Qwen3-8B兩個模型規模,涉及規劃(推箱子、路徑規劃)、代碼(LiveCodeBench、APPS競賽集)、數學(AIME競賽、奧林匹克基準)三大類任務。實驗數據顯示,采用AT-GRPO算法訓練后,推箱子任務成功率從14%躍升至96%,路徑規劃任務準確率從47%提升至99.5%;代碼生成任務中,LiveCodeBench、APPS、CodeContests的得分分別提高6.1%、4.2%和7.0%;數學推理任務AIME 2024與2025的得分提升達9.0%和17.9%。

消融實驗進一步驗證了框架設計的合理性。單智能體訓練模式下,即使將規劃、工具等子角色分開訓練,其指標提升幅度顯著低于多智能體協作模式;角色策略互換實驗顯示,已訓練成熟的智能體組合若強行調換角色,任務準確率將從96%暴跌至6%,證明不同智能體習得的是互補且不可替代的能力。訓練過程分析表明,隨著迭代進行,智能體間的協作效率持續提升,完成任務所需的平均交互輪次明顯下降。

該研究成果已通過開源代碼與論文形式公開。項目地址:https://github.com/pettingllms-ai/PettingLLMs;論文鏈接:https://huggingface.co/papers/2510.11062。研究者表示,這一框架為復雜任務中的群體智能進化提供了通用解決方案,其模塊化設計可支持未來更多類型智能體的接入與協同。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
日本精品一区二区三区高清 久久
欧美成人a在线| 欧美日韩极品在线观看一区| 精品一区二区三区久久久| 亚洲一区二区在线观看视频| 亚洲一卡二卡三卡四卡无卡久久 | 另类中文字幕网| 蜜桃av一区二区| 国产一区二区三区免费| 国产精品亚洲第一区在线暖暖韩国| 激情综合色丁香一区二区| 精品亚洲欧美一区| 成人av影院在线| 91蜜桃传媒精品久久久一区二区| 91精品福利在线| 欧美精品日韩综合在线| 精品福利视频一区二区三区| 国产午夜亚洲精品午夜鲁丝片| 国产精品嫩草影院com| 国产精品欧美久久久久无广告 | 日本在线播放一区二区三区| 看国产成人h片视频| 国产.欧美.日韩| 99re在线精品| 欧美日韩日本视频| 久久久国际精品| 亚洲男人天堂av| 青青草国产成人av片免费| 国产最新精品精品你懂的| 91在线观看高清| 欧美日韩一区二区三区四区五区| 精品国产区一区| 亚洲精品视频在线| 美女视频一区二区三区| k8久久久一区二区三区| 91.xcao| 国产视频一区二区在线| 亚洲日本成人在线观看| 久久精品国产99久久6| 91免费小视频| 久久久久久免费毛片精品| 一区二区三区欧美久久| 国产精品一区二区在线观看不卡| 91精品国产综合久久精品app| 久久一区二区三区四区| 亚洲制服丝袜av| 成人综合婷婷国产精品久久| 欧美精选一区二区| 中文字幕亚洲精品在线观看| 久久国产精品无码网站| 欧美影院午夜播放| 亚洲人妖av一区二区| 精品无人区卡一卡二卡三乱码免费卡| 一本色道久久综合精品竹菊| 26uuu色噜噜精品一区二区| 亚洲国产人成综合网站| 不卡的电影网站| 国产天堂亚洲国产碰碰| 热久久免费视频| 欧美日韩在线电影| 亚洲视频在线观看一区| 国产成人av电影在线播放| 欧美成人高清电影在线| 免费观看一级欧美片| 欧美在线视频全部完| 亚洲精品免费看| 91污在线观看| 综合婷婷亚洲小说| eeuss鲁片一区二区三区 | 欧美性受xxxx黑人xyx| 国产精品美女久久福利网站| 国产精品一区二区三区99| 日韩一区二区三区免费看 | 精品粉嫩超白一线天av| 日韩中文字幕区一区有砖一区| 欧美日韩亚洲综合一区| 一区二区三区精品| 欧美综合欧美视频| 午夜精品久久一牛影视| 欧美日韩高清影院| 亚洲成a人片在线不卡一二三区| 在线视频国产一区| 午夜国产不卡在线观看视频| 日韩一区二区三区视频| 国产一区欧美二区| 国产午夜精品理论片a级大结局| 国产精品一区2区| 欧美高清一级片在线观看| 成人av在线电影| 亚洲女人小视频在线观看| 欧美在线观看禁18| 天天射综合影视| 欧美精品一区二区在线观看| 国产精品18久久久| 一区二区三区在线免费播放| 欧美午夜精品一区二区蜜桃| 免费观看久久久4p| 久久久久久久免费视频了| 色婷婷综合中文久久一本| 天堂在线一区二区| 国产欧美日韩精品a在线观看| 成人午夜激情在线| 性做久久久久久免费观看| 久久―日本道色综合久久| av电影在线观看一区| 亚瑟在线精品视频| 欧美激情资源网| 在线国产亚洲欧美| 久久91精品久久久久久秒播| 国产精品福利一区| 欧美一级二级三级蜜桃| 丰满岳乱妇一区二区三区| 午夜电影网亚洲视频| 国产亚洲精品超碰| 4438成人网| 91老师国产黑色丝袜在线| 久久精品免费看| 一区二区三区在线观看欧美 | 国产色产综合色产在线视频| 欧美综合欧美视频| 成人黄色av网站在线| 六月丁香婷婷久久| 亚洲成av人片www| 日韩理论电影院| 久久精品综合网| 欧美日韩国产高清一区| 91视视频在线观看入口直接观看www | 欧美国产欧美亚州国产日韩mv天天看完整 | 精品乱码亚洲一区二区不卡| 在线视频亚洲一区| 成人ar影院免费观看视频| 久久精品国产亚洲一区二区三区| 亚洲精品高清在线| 中文字幕成人在线观看| 精品成人一区二区| 欧美一区二区三区四区视频| 日本韩国视频一区二区| jlzzjlzz欧美大全| 国产精品1区二区.| 狠狠色丁香久久婷婷综合_中| 亚洲国产精品一区二区久久 | 国内精品写真在线观看| 亚洲va韩国va欧美va精品 | 韩国女主播成人在线观看| 日韩高清在线观看| 亚洲成a人在线观看| 亚洲综合在线视频| 综合久久综合久久| 中文字幕在线不卡视频| 国产精品国产自产拍高清av | 99re6这里只有精品视频在线观看| 国产在线播放一区三区四| 久久精工是国产品牌吗| 另类欧美日韩国产在线| 裸体在线国模精品偷拍| 久久精品国产精品青草| 国产一区二区中文字幕| 国产精品一区免费视频| 成人激情小说乱人伦| 97成人超碰视| 欧美性一二三区| 日本一区二区三区视频视频| 欧美激情艳妇裸体舞| 国产精品久久久久久久久久久免费看 | 久久久美女艺术照精彩视频福利播放| 91精品国产手机| 久久久综合激的五月天| 国产精品久久久久久亚洲毛片| 亚洲视频你懂的| 婷婷中文字幕综合| 激情综合五月天| 99riav一区二区三区| 欧美日韩国产a| 久久亚洲精品小早川怜子| 国产精品成人免费精品自在线观看| 一区二区在线观看免费| 亚洲第一搞黄网站| 久久99精品一区二区三区| 国产99久久精品| 欧美三级在线视频| 精品国产免费视频| 亚洲区小说区图片区qvod| 午夜视频在线观看一区二区 | 一区二区三区 在线观看视频| 亚洲妇熟xx妇色黄| 极品少妇一区二区三区精品视频| 高清国产一区二区| 欧美日韩国产不卡| 欧美极品aⅴ影院| 日韩电影在线一区| 高潮精品一区videoshd| 欧美色倩网站大全免费| 久久久夜色精品亚洲| 亚洲最色的网站| 国产经典欧美精品| 51午夜精品国产| 亚洲精品中文字幕乱码三区| 韩国欧美国产1区| 在线成人av网站| 1024成人网| 国产91精品一区二区|