滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

英偉達(dá)發(fā)布TiDAR：單步生成多個Token吞吐量提升600%

時間：2025-12-03 09:49:47 來源：IT之家編輯：快訊 IP：北京 發(fā)表評論無障礙通道

12 月 2 日消息，科技媒體 Tom's Hardware 今天（12 月 2 日）發(fā)布博文，報道稱英偉達(dá)在最新論文中，詳述名為 TiDAR 的新型 AI 解碼方法，巧妙融合了自回歸（Autoregressive）與擴(kuò)散（Diffusion）兩種模型機(jī)制，利用 GPU 的“空閑槽位”加速文本生成。

自回歸（Autoregressive）是一種生成方式，AI 必須根據(jù)上一個字才能猜出下一個字，像接龍一樣，只能按順序一個接一個生成。

擴(kuò)散（Diffusion）常用于 AI 繪畫的技術(shù)，通過逐步去除噪點(diǎn)來生成內(nèi)容，在 TiDAR 中，它被用來一次性“猜”出好幾個可能的詞，供后續(xù)篩選。

援引博文介紹，當(dāng)前的語言模型通常一次生成一個 Token（詞元），這種逐個生成的機(jī)制導(dǎo)致了極高的計算成本和延遲。

TiDAR 的核心理念在于利用模型推理過程中未被使用的“空閑槽位”，在不犧牲生成質(zhì)量的前提下，通過單步生成多個 Token 來大幅提升響應(yīng)速度并降低 GPU 運(yùn)行時長。

在技術(shù)原理方面，TiDAR 創(chuàng)新性地訓(xùn)練單個 Transformer 模型同時執(zhí)行兩項任務(wù)：標(biāo)準(zhǔn)的自回歸“下一詞預(yù)測”和基于擴(kuò)散的“并行起草”。

不同于以往依賴獨(dú)立草稿模型的投機(jī)解碼（Speculative Decoding），TiDAR 通過結(jié)構(gòu)化的注意力掩碼（Attention Mask）將輸入分為三個區(qū)域：前綴區(qū)、驗證區(qū)和起草區(qū)。

投機(jī)解碼是一種加速技術(shù)，先用一個小模型快速草擬一段話，再由大模型進(jìn)行檢查和修正。TiDAR 試圖在同一個模型內(nèi)完成這兩步。

這種設(shè)計讓模型在利用擴(kuò)散頭并行起草新 Token 的同時，還能通過自回歸頭驗證這些草稿，最關(guān)鍵的是，它確保了 KV 緩存（KV Cache）的結(jié)構(gòu)有效性，解決了早期擴(kuò)散解碼器面臨的部署難題。

研究團(tuán)隊基于 Qwen 系列模型進(jìn)行了測試。在 Humaneval 和 GSM8K 等基準(zhǔn)測試中，TiDAR 的準(zhǔn)確率與基準(zhǔn)模型持平甚至略有提升。

在速度方面，15 億參數(shù)版本的 TiDAR 模型實(shí)現(xiàn)了 4.71 倍的吞吐量增長；而 80 億參數(shù)版本的表現(xiàn)更為搶眼，吞吐量達(dá)到了 Qwen3-8B 基準(zhǔn)的 5.91 倍。這表明在當(dāng)前測試規(guī)模下，TiDAR 能有效利用 GPU 的顯存帶寬，在不增加額外顯存搬運(yùn)的情況下生成更多 Token。

該媒體指出盡管實(shí)驗數(shù)據(jù)亮眼，TiDAR 目前仍面臨規(guī)模擴(kuò)展的挑戰(zhàn)。論文中的測試僅限于 80 億參數(shù)以下的中小模型，且未涉及定制化的內(nèi)核級優(yōu)化（如 fused kernels），僅使用了標(biāo)準(zhǔn)的 PyTorch 環(huán)境。

隨著模型參數(shù)量和上下文窗口的擴(kuò)大，計算密度可能會飽和，從而壓縮“多 Token 擴(kuò)展”的成本優(yōu)勢。研究人員表示，未來將在更大規(guī)模的模型上進(jìn)行驗證，以確定該技術(shù)是否能成為云端大規(guī)模 AI 部署的實(shí)用替代方案。

更多>同類資訊

眾擎全尺寸人形機(jī)器人T800發(fā)布：18萬元起售

12-03

阿童木天兵一號ATOM01人形機(jī)器人迭代升級發(fā)布

12-03

IBM CEO：以現(xiàn)有成本建設(shè)AI數(shù)據(jù)中心“幾乎不可能回本”

12-03

陳天橋發(fā)文：當(dāng)管理退出認(rèn)知升起，KPI崩塌了

12-03

“豆包”3499元的手機(jī)一天就賣光，閑魚掛價最高近萬元

12-03

AI聊天機(jī)器人ChatGPT今天突發(fā)故障，OpenAI緊急修復(fù)

12-03

押注OpenAI，軟銀痛斬英偉達(dá)

12-03

國內(nèi)作物學(xué)界迎首位AI科研伙伴“豐登” 明年將全球上線助力育種研究

12-03

神舟二十號舷窗現(xiàn)細(xì)微裂紋中國緊急發(fā)射二十二號飛船保障安全

相關(guān)負(fù)責(zé)人介紹，針對出現(xiàn)異常的神舟二十號飛船，后續(xù)將安排神舟二十一號任務(wù)的航天員在出艙作業(yè)期間，對舷窗裂紋情況進(jìn)行近距離觀察與評估。后續(xù)，神舟二十號將按計劃以無人狀態(tài)再入返回，整個返回過程將采集大量真實(shí)環(huán)境…

12-03

本周硬核突破！航空航天到氣象預(yù)報，我國多領(lǐng)域成果閃耀世界

經(jīng)過為期一年的艙外暴露實(shí)驗后，首批用于月面建造研究的“月壤磚”樣品，日前隨神舟二十一號飛船順利返回地球。我國自主研制的全球首個氣溶膠-氣象耦合預(yù)報人工智能模型，在不到1分鐘的時間內(nèi)，可以完成未來5天、涵蓋…

12-03

北京首座太空算力中心加速建設(shè) “辰光一號”將開啟太空算力新篇章

北京市科委、中關(guān)村管委會副主任龔維冪表示，作為重要信息基礎(chǔ)設(shè)施，太空數(shù)據(jù)中心是商業(yè)航天和人工智能領(lǐng)域戰(zhàn)略交叉的重要方向，太空數(shù)據(jù)中心將成為北京國際科技創(chuàng)新中心建設(shè)的重點(diǎn)布局方向之一，會對其加大支持力度、加快推…

12-03

北京發(fā)力太空算力領(lǐng)域：“辰光一號”將升空太空數(shù)據(jù)中心未來可期

IT之家從文章獲悉，太空數(shù)據(jù)中心創(chuàng)新聯(lián)合體就是以太空數(shù)據(jù)中心建設(shè)與應(yīng)用為核心目標(biāo)，通過整合國內(nèi)商業(yè)航天領(lǐng)域的創(chuàng)新鏈、產(chǎn)業(yè)鏈資源，協(xié)同開展多項前沿交叉技術(shù)、關(guān)鍵核心技術(shù)和核心零部件攻關(guān)。據(jù)北京星空院院長張善…

12-03

碳化硅市場風(fēng)云變幻：從汽車到AI，探尋下一個盈利增長點(diǎn)

12-03

2025專家展望：數(shù)字經(jīng)濟(jì)核心產(chǎn)業(yè)比重將升至15%，AI與數(shù)據(jù)成新引擎

12-03

理想Q3財報背后的十年布局：組織煥新、產(chǎn)品升級、技術(shù)突圍

12-03

點(diǎn)擊查看更多 +

全站最新

生學(xué)教育與火山引擎強(qiáng)強(qiáng)聯(lián)合：AI技術(shù)賦能，開啟數(shù)智教育新征程

AI技術(shù)平權(quán)時代：普通人用一句話“搓”出生活新工具

12月商超經(jīng)營全攻略：從營銷策劃到陳列規(guī)劃，沖刺年終消費(fèi)高峰

49.9元眉筆牽手高端絲芙蘭：是美妝寒冬下的突圍還是錯位博弈？

盒馬“大姐”李衛(wèi)平接棒高鑫零售，能否帶領(lǐng)商超巨頭走出業(yè)績陰霾？

比亞迪11月狂銷48萬輛創(chuàng)年內(nèi)新高海外銷量同比激增297%領(lǐng)跑全球

熱門內(nèi)容

本欄最新

階躍星辰開源GELab-Zero：GUI Agent模型落地消費(fèi)級，多終端一鍵部署成亮點(diǎn)

嵐圖追光L 12月10日上市，以實(shí)力重塑中大型轎車新標(biāo)桿

魏牌藍(lán)山智能進(jìn)階版實(shí)車亮相：VLA大模型賦能，續(xù)航超1300km對標(biāo)理想L8

智能舒適新標(biāo)桿！東風(fēng)日產(chǎn)N6上市，打造家庭出行新體驗

易鑫獲評“年度AI應(yīng)用場景突破企業(yè)” 開源大模型引領(lǐng)汽車金融智能化升級

第七屆工業(yè)互聯(lián)網(wǎng)大賽新興產(chǎn)業(yè)賽落幕共繪“工業(yè)互聯(lián)網(wǎng)×新興產(chǎn)業(yè)”新藍(lán)圖

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

英偉達(dá)發(fā)布TiDAR：單步生成多個Token吞吐量提升600%

日本精品一区二区三区高清久久