滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

GAIR 2025：胡俠團隊“有損計算”突破，為大模型推理效率提升帶來新可能

時間：2025-12-12 17:09:52 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

在大語言模型領域，提升上下文處理能力一直是科研人員關注的焦點。當前，不同廠商發布的大語言模型在超長上下文處理方面取得了顯著進展，部分模型已能支持數百萬Token的輸入，例如MiniMax-M1、Qwen2.5-1M系列模型，均具備百萬Token級別的處理能力。然而，這場關于上下文長度的競爭仍在持續，因為更長的上下文處理能力能夠為模型在金融、法律、醫療等領域的長語境任務中提供更廣闊的應用空間，創造更大的商業與技術價值。

針對這一目標，一支科研團隊提出了“通過有損計算提高大語言模型推理效率”的研究方案。該方案的核心思路是利用大語言模型對低精度計算等“有損操作”產生的噪聲具有較強魯棒性的特點，主動引入可控的信息損失，以換取推理效率的提升。這種“有損計算”主要通過降低計算或存儲精度來實現，重點圍繞模型參數量化、KV Cache壓縮、模型剪枝與知識蒸餾等路徑展開。

在處理醫療領域長篇文獻信息提取等任務時，大語言模型面臨“預訓練長度限制”和“推理內存需求激增”的雙重挑戰。為應對這些挑戰，該團隊的研究實現了兩項關鍵技術突破。在算法層面，通過粗化遠距離標記的位置信息，將模型的語境長度擴展至原有水平的8倍；在系統層面，將過往標記的中間狀態（KV Cache）量化為2比特數字，實現了8倍內存效率提升和3.5倍時鐘時間加速，且不影響模型性能。

在具體實施中，粗化位置信息的策略并非靜態，而是根據上下文需求動態調整。而將KV Cache壓縮至2比特是一項激進的優化，團隊通過大量實驗驗證了其在低精度表示下仍能保持模型準確率。KV Cache是大模型訓練和推理中的重要中間存儲狀態，直接關聯GPU內存。例如，A100 80GB GPU中，超過90%的內存用于存儲KV Cache。將其從16比特壓縮至2比特，相當于將存儲量提升近10倍，顯著降低了硬件成本。

目前，該方案主要在llama模型上進行了實驗驗證，相關研究成果已發表于2024年。團隊開發的AutoKeras等開源項目已被廣泛采用，此次的有損計算技術也已被hugging face的transformer和llama.cpp等主流開源軟件包采納。與混合專家模型（MoE）等技術相比，該方案在哲學上追求效率與準確率的平衡，但在技術路徑上完全不同。MoE通過稀疏性解決問題，而粗化位置信息方法則要求模型讀完所有內容，但無需記憶精確位置。

在應用場景方面，該方案目前主要針對語言大模型，在多模態大模型或其他智能體上的效果尚未充分驗證。實驗表明，在問答類任務中，壓縮至2比特時模型準確率不會下降，但在生成程序等對精度要求極高的任務中可能影響準確性。團隊在醫療健康領域開發了一個基于罕見病的問診系統，用戶可通過輸入癥狀查詢可能的罕見病，效果顯著。由于大模型能夠整合大量統計信息，該方案在法律和醫療等場景中仍具有應用潛力。

關于硬件協同設計，該方案目前專注于GPU層面的優化，尚未涉及特定硬件的變革。然而，團隊認為，未來可能需要新的模型架構在預訓練階段直接融入稀疏性設計，而非僅在推理階段進行補救。該方案具有“即插即用”的特點，實現原理簡單易懂，因此用戶數量眾多。目前，團隊正探索2比特壓縮在實際中的應用邊界，以及理論研究與系統落地的結合方向。

更多>同類資訊

Runway推GWM-1世界模型：拓展至多領域，同步升級視頻生成與算力支撐

12-12

黑芝麻智能攜手元戎啟行，以芯片算法融合賦能高階輔助駕駛量產

12-12

云從科技攜手高校發布首個百萬級“空對空”反無人機追蹤基準及強力模型

12-12

美圖CEO吳欣鴻：打造AI創新工作室內部“賽馬”助力產品創新升級

12-12

密度法則引領大模型新方向：智能將走向分布式，端側潛力無限

12-12

宇樹科技王興興：具身智能“雙80%”達成就迎拐點或一兩年內實現

12-12

杭州以勒：以科技賦能咖啡機打造智能售貨新體驗的領航者

其主營產品涵蓋人工智能組合商用售飲機、現磨咖啡機、智能售貨機、服務型AI機器人等商用設備，同時提供配套設備操控系統、后臺管理系統軟件開發與相關售后服務。總結來說，智能售貨咖啡機代表了現代科技與日常生活的結合…

12-12

紐約州率先立法規范AI廣告：明確生成內容披露與已故者形象使用規則

12-12

迪士尼豪擲10億牽手OpenAI：經典IP集體“入局”Sora，開啟AI娛樂新實驗

12-12

1X機器人轉向工業賽道：Neo獲EQT十年萬臺訂單，先攻倉庫再圖家庭市場

12-12

英偉達推出AR1自動駕駛模型：開放推理賦能，復雜路況應對更從容

12-12

1X攜手EQT開啟戰略合作，人形機器人Neo從家庭走向工業新賽道

12-12

釘釘8.1.10煥新登場：AI深度融入溝通、協作與硬件，重塑職場新體驗

12-12

OPPO調整AI架構推"超級小布" 姜昱辰領銜打造智能交互新體驗

12-12

迪士尼與OpenAI達成重磅合作：10億美元投資 200余角色入駐Sora平臺

12-12

點擊查看更多 +

全站最新

新能源售后滿意度逆襲傳統燃油車汽車服務競爭重心加速遷移

智能座艙生態困局：硬件碎片化、適配成本高，如何破局重構體驗？

縱橫G700憑全場景實力出圈，續航、舒適、通信全滿足，成穿越新寵

GDPS 2025探秘：從插花到救援，具身智能機器人應用加速落地

機器人ETF易方達盤中吸金力強獲1700萬份凈申購產業前景受關注

麥克斯韋國際北京設金融創新基地創始人馬鑫將捐百所圖書館助公益

熱門內容

本欄最新

山東首富跨界轉型：借北汽制造“拼車” 另辟蹊徑尋車市突破

3000萬輛里程碑！中國長安以“長安速度”書寫汽車產業新輝煌

協作型智能體時代來臨：多智能體協作重塑產業新生態

嵐圖追光L上市，27.99萬起售，能否在中大型轎車市場掀起波瀾？

英飛凌OptiMOS 7功率MOSFET發布，為多領域應用帶來性能新突破

領益智造遞交H股上市申請，業務多點開花啟動“A+H”雙平臺新篇

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

GAIR 2025：胡俠團隊“有損計算”突破，為大模型推理效率提升帶來新可能

日本精品一区二区三区高清久久