日本精品一区二区三区高清 久久

ITBear旗下自媒體矩陣:

UCSD與英特爾聯手推出PettingLLMs框架,多智能體強化學習性能顯著提升

   時間:2025-11-09 20:51:35 來源:快訊編輯:快訊 IP:北京 發表評論無障礙通道
 

在人工智能領域,大語言模型(LLM)驅動的多智能體系統正展現出強大的潛力。然而,現有的訓練框架主要聚焦于單智能體場景,多智能體間的協作優化——“群體強化”仍是一個亟待突破的領域。針對這一挑戰,來自UCSD與英特爾的研究團隊提出了一種全新的通用多智能體強化學習框架——PettingLLMs,為多智能體協同訓練提供了創新解決方案。

多智能體系統在醫療、編程、科研、具身智能等領域的應用中,已展現出超越單智能體的顯著優勢。然而,當前主流的強化學習算法(如GRPO)均基于單智能體假設,其核心機制是通過同一輸入(prompt)生成多組候選回答,并在組內進行相對優勢評估。這一機制的有效性依賴于“共同prompt”的前提——即所有候選回答必須基于完全相同的上下文生成。但在多智能體多輪交互場景中,不同智能體在不同輪次接收到的prompt可能包含其他智能體的歷史輸出(如編程任務中,智能體生成的代碼可能被其他智能體用于單元測試),導致“共同prompt”假設被破壞,進而影響優勢計算的公平性與有效性。

為解決這一問題,研究團隊提出了一種基于貪心搜索的樹狀采樣方法。該方法通過每輪為每個智能體生成K個分支,并選擇當前獎勵最高的智能體進行下一輪分支,從而平衡探索與利用的矛盾。同時,每個智能體的獎勵函數被設計為同時考慮自身角色專屬獎勵與全局任務獎勵,確保智能體在提升協作能力的同時保持角色特異性。

針對多智能體訓練中的策略選擇問題(即何時采用“專屬模型”模式,何時采用“共享模型”模式),研究團隊構建了異步分發訓練系統。該系統通過路由模塊收集多智能體交互產生的軌跡數據,并根據訓練模式需求進行差異化處理:在專屬模型模式下,系統將智能體i的數據僅發送至模型資源池i的更新單元,實現獨立模型進化;在共享模型模式下,系統將所有智能體的軌跡數據合并后發送至同一資源池,實現統一模型優化。

基于上述方法,研究團隊開源了PettingLLMs框架,支持不同模型與智能體間的任意映射,并允許每個智能體適配不同的LoRA(低秩適應)參數。開發者僅需定義任務特定的智能體交互邏輯與獎勵函數,即可快速構建多智能體訓練環境。目前,框架已內置數學、編程、游戲等主流任務環境。

實驗結果表明,該框架在復雜任務中表現突出。在推箱子(Sokoban)任務中,通過AT-GRPO算法訓練的兩個智能體將任務完成率從14%提升至96%;在路徑規劃任務中,完成率從47%提升至99.5%。代碼生成任務中,LiveCodeBench、APPS、CodeContests的準確率分別提升6.1%、4.2%和7.0%;數學推理任務中,AIME 24與AIME 25的準確率分別提升9.0%和17.9%。

消融實驗進一步驗證了框架設計的合理性。僅在單智能體環境中訓練規劃或工具子角色時,指標雖從5.0%提升至11.0%/14.5%,但聯合作業時準確率僅達16.0%;而互換已訓練角色的策略會導致準確率驟降至6.0%,證明智能體能力具有互補性與不可替代性。訓練過程中智能體學習回報同步上升,任務平均回合數持續下降,表明協作效率隨訓練進程顯著提升。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
日本精品一区二区三区高清 久久
国产白丝精品91爽爽久久| 成人免费视频视频| 中文字幕高清不卡| 制服丝袜中文字幕亚洲| 国产成人精品免费| 日韩成人一级大片| 亚洲六月丁香色婷婷综合久久| 欧美成人精品二区三区99精品| 91福利在线播放| 99国产精品久久久久久久久久| 精品一二三四在线| 美女在线观看视频一区二区| 亚洲一区二区在线播放相泽| 中文字幕av一区二区三区免费看| 日韩欧美二区三区| 日韩一区二区不卡| 欧美一区二区三区四区五区| 欧美人成免费网站| 欧美日韩精品免费观看视频| 在线精品观看国产| 欧美天堂一区二区三区| 欧洲激情一区二区| 欧美精品在线一区二区| 日韩一区二区三区电影在线观看| 欧美精品aⅴ在线视频| 日韩精品中文字幕一区 | 欧美日韩激情一区二区| 欧美一区午夜精品| 久久这里只有精品视频网| 久久久www成人免费毛片麻豆| 国产午夜亚洲精品理论片色戒| 国产亚洲欧洲997久久综合| 中文字幕av一区二区三区免费看| 18成人在线观看| 日韩成人精品在线| 国产黑丝在线一区二区三区| 在线观看免费成人| 精品少妇一区二区三区免费观看 | 99精品在线观看视频| 欧美日韩中文字幕精品| 精品国产乱码久久久久久夜甘婷婷 | 欧美日韩中字一区| 久久蜜桃一区二区| 伊人色综合久久天天人手人婷| 免费不卡在线观看| 91美女片黄在线| 精品国产一区二区三区av性色| 最新不卡av在线| 欧美精品乱码久久久久久| 亚洲国产精品激情在线观看| 麻豆精品视频在线观看| 欧美图区在线视频| 中文字幕日韩欧美一区二区三区| 日韩va亚洲va欧美va久久| 91一区一区三区| 欧美国产一区视频在线观看| 免费观看一级特黄欧美大片| 一本一道久久a久久精品| 国产欧美精品一区二区色综合朱莉| 亚洲一二三四在线| 成人精品高清在线| 国产欧美日产一区| 国产成人av电影在线| 精品国产乱码久久久久久夜甘婷婷 | 高清日韩电视剧大全免费| 日韩免费视频一区| 婷婷激情综合网| 4438x亚洲最大成人网| 亚洲chinese男男1069| 在线视频国内自拍亚洲视频| 亚洲激情五月婷婷| 在线一区二区观看| 国产精品不卡一区二区三区| 成人一区二区在线观看| 欧美韩国一区二区| 99久久综合99久久综合网站| 亚洲人123区| 91 com成人网| 国产制服丝袜一区| 日本一区二区在线不卡| 成人av动漫网站| 亚欧色一区w666天堂| 日韩欧美黄色影院| 国产激情视频一区二区在线观看 | 国产美女一区二区| 国产精品乱人伦中文| 91国内精品野花午夜精品| 日韩1区2区日韩1区2区| 久久久精品综合| 日本国产一区二区| 九九**精品视频免费播放| 国产午夜三级一区二区三| 色香蕉成人二区免费| 九九九精品视频| 亚洲综合激情小说| 久久久不卡影院| 欧美日韩在线播放三区| 国产精品亚洲а∨天堂免在线| 亚洲视频每日更新| 久久久综合视频| 欧美午夜宅男影院| 高清视频一区二区| 蜜桃av噜噜一区| 香蕉影视欧美成人| 自拍偷拍国产亚洲| 国产日韩欧美制服另类| 在线91免费看| 欧美在线短视频| 色综合久久88色综合天天6| 国产福利不卡视频| 久久er99热精品一区二区| 亚洲成人1区2区| 亚洲欧美视频一区| 国产精品久久久久久久久久免费看 | 国产成人自拍在线| 日韩av中文字幕一区二区 | 成人黄色大片在线观看| 国产精品亚洲综合一区在线观看| 亚洲午夜在线观看视频在线| 亚洲视频在线观看一区| 国产精品久久夜| 亚洲人成亚洲人成在线观看图片| 成人欧美一区二区三区| 亚洲精品高清在线| 午夜精品久久久久久| 美国三级日本三级久久99| 韩国欧美国产一区| 成人丝袜18视频在线观看| 成人av资源在线| 在线精品视频免费播放| 欧美日韩成人一区| 欧美精品一区二区三区蜜臀 | 国产精品人人做人人爽人人添| 欧美激情一二三区| 夜夜嗨av一区二区三区网页| 日日噜噜夜夜狠狠视频欧美人| 韩日欧美一区二区三区| 99久久精品国产精品久久| 欧美影院午夜播放| www成人在线观看| 亚洲啪啪综合av一区二区三区| 午夜精品久久久久久久久| 国产在线播放一区| 色综合久久中文字幕| 精品粉嫩超白一线天av| 亚洲人成小说网站色在线 | 亚洲国产精品精华液ab| 日韩精品亚洲一区| 不卡电影一区二区三区| 91精品国产品国语在线不卡 | 国产精品国模大尺度视频| 天堂精品中文字幕在线| 不卡的电影网站| 欧美videos中文字幕| 亚洲国产aⅴ成人精品无吗| 狠狠色狠狠色综合日日91app| 在线亚洲精品福利网址导航| 国产欧美日韩三级| 国内外成人在线视频| 欧美高清精品3d| 亚洲乱码日产精品bd| 成人黄色片在线观看| 精品区一区二区| 免费看精品久久片| 欧美一区二区三区色| 天天色天天操综合| 欧美三电影在线| 亚洲成人av一区二区三区| 欧美综合色免费| 亚洲成人在线免费| 欧美日韩视频在线一区二区| 天堂蜜桃一区二区三区| 欧美亚洲国产怡红院影院| 一区二区三区.www| 91精品婷婷国产综合久久性色| 一区二区三区不卡在线观看| 在线亚洲欧美专区二区| 亚洲va天堂va国产va久| 正在播放亚洲一区| 免费亚洲电影在线| 2欧美一区二区三区在线观看视频 337p粉嫩大胆噜噜噜噜噜91av | 成人午夜免费av| 日韩一区日韩二区| 91久久国产综合久久| 日韩精品一级二级 | 亚洲激情第一区| 7777女厕盗摄久久久| 国产在线精品一区二区夜色 | 国产成人在线视频网站| 亚洲欧美激情在线| 欧美日韩成人激情| 国产一区二区久久| 一区二区三区鲁丝不卡| 日韩精品资源二区在线| 成人国产精品免费观看视频| 亚洲123区在线观看| 26uuu精品一区二区三区四区在线| 97久久超碰国产精品| 日韩高清欧美激情| 1区2区3区欧美|