12月1日,豆包手機(jī)正式開(kāi)啟小規(guī)模市場(chǎng)發(fā)售,市場(chǎng)反響熱烈程度遠(yuǎn)超預(yù)估。盡管該手機(jī)助手尚未打通各類(lèi)應(yīng)用程序的API接口,但其憑借AI技術(shù)模擬用戶(hù)點(diǎn)擊、滑動(dòng)等操作,直接理解屏幕內(nèi)容并跨應(yīng)用執(zhí)行指令,成功在某種程度上打破了應(yīng)用程序間的“信息孤島”現(xiàn)象,實(shí)現(xiàn)了應(yīng)用間的協(xié)同操作。
在12月17日舉辦的FORCE原動(dòng)力大會(huì)上,火山引擎宣布推出豆包大模型1.8版本。該版本不僅強(qiáng)化了Agent相關(guān)能力,還在多模態(tài)理解和上下文管理方面取得顯著進(jìn)展。與此同時(shí),萬(wàn)億Token俱樂(lè)部成員數(shù)量突破100家,這一規(guī)模已超越某頭部云服務(wù)提供商。火山引擎總裁譚待在會(huì)上強(qiáng)調(diào),模型領(lǐng)域的關(guān)鍵不在于競(jìng)爭(zhēng),而在于共同開(kāi)拓市場(chǎng)。他指出,火山引擎率先提出模型的重要性,并通過(guò)技術(shù)革新大幅降低成本,同時(shí)保持盈利能力。這一策略最初引發(fā)質(zhì)疑,但如今已有更多廠商跟進(jìn)降價(jià)措施。
譚待在現(xiàn)場(chǎng)公布的數(shù)據(jù)顯示,截至今年12月,豆包大模型的日均token使用量突破50萬(wàn)億,較去年同期增長(zhǎng)超10倍,自發(fā)布以來(lái)累計(jì)增長(zhǎng)417倍。目前已有超過(guò)100家企業(yè)客戶(hù)的累計(jì)token使用量超過(guò)一萬(wàn)億,標(biāo)志著企業(yè)級(jí)AI應(yīng)用正加速規(guī)模化落地。豆包大模型1.8版本在設(shè)計(jì)階段便聚焦多模態(tài)Agent場(chǎng)景,系統(tǒng)性提升了多輪交互、復(fù)雜指令遵循及操作系統(tǒng)級(jí)Agent操作能力。在視覺(jué)能力方面,該版本通過(guò)底層升級(jí)實(shí)現(xiàn)了對(duì)低幀率超長(zhǎng)視頻的理解,并在視頻語(yǔ)義解析、空間關(guān)系理解及文檔結(jié)構(gòu)化處理等領(lǐng)域取得突破。其原生支持的智能上下文管理機(jī)制允許用戶(hù)通過(guò)策略配置自動(dòng)清理歷史信息,確保超長(zhǎng)多步驟任務(wù)的穩(wěn)定執(zhí)行。
火山引擎的視頻生成模型Seedance也迎來(lái)重大升級(jí)。從春季發(fā)布的1.0版本到冬季的1.5 Pro版本,該模型采用原生音視頻聯(lián)合生成架構(gòu),支持環(huán)境音、背景音樂(lè)及人聲等多元素同步輸出,實(shí)現(xiàn)毫秒級(jí)音畫(huà)對(duì)齊。Seedance 1.5 Pro還具備多人跨語(yǔ)言對(duì)話能力,可根據(jù)畫(huà)面中說(shuō)話角色的數(shù)量和景深信息精準(zhǔn)匹配口型,有效解決“張口不發(fā)聲”或口型錯(cuò)位等問(wèn)題。該版本原生支持多語(yǔ)言及四川話、粵語(yǔ)、上海話等中文方言,顯著拓展了視頻內(nèi)容創(chuàng)作的實(shí)用場(chǎng)景。相較于市場(chǎng)上其他模型在口型匹配和語(yǔ)義一致性方面的不足,Seedance 1.5 Pro在這兩項(xiàng)關(guān)鍵指標(biāo)上實(shí)現(xiàn)顯著提升。
在定價(jià)策略上,火山引擎推出業(yè)內(nèi)首個(gè)“AI節(jié)省計(jì)劃”,覆蓋旗下所有按量后付的大模型產(chǎn)品,包括豆包大模型家族及第三方開(kāi)源模型,最高可為用戶(hù)節(jié)省47%的使用成本。針對(duì)企業(yè)Agent應(yīng)用的規(guī)模化落地難題,火山引擎推出推理代工服務(wù),提供極致彈性伸縮、全棧推理優(yōu)化及分布式緩存支持。該服務(wù)被比喻為“已調(diào)校完成的頂級(jí)賽車(chē)”,用戶(hù)只需“插入模型發(fā)動(dòng)機(jī)”即可快速運(yùn)行。
隨著大模型智能水平的持續(xù)提升,Agent技術(shù)正逐步滲透企業(yè)核心業(yè)務(wù)。譚待預(yù)測(cè),未來(lái)兩三年內(nèi)Agent將引發(fā)生產(chǎn)力革命,但企業(yè)當(dāng)前更關(guān)注如何將構(gòu)建好的Agent轉(zhuǎn)化為大規(guī)模業(yè)務(wù)價(jià)值。為此,火山引擎發(fā)布AI Agent平臺(tái)AgentKit+HiAgent技術(shù)體系。其中,AgentKit作為基礎(chǔ)設(shè)施底座,集成了身份認(rèn)證、運(yùn)行時(shí)環(huán)境、云沙箱、網(wǎng)關(guān)、記憶庫(kù)、可觀測(cè)性、評(píng)測(cè)系統(tǒng)及安全圍欄等功能。傳統(tǒng)Agent開(kāi)發(fā)需手動(dòng)調(diào)用模型、解析結(jié)果并處理異常狀態(tài),前端邏輯需編寫(xiě)七八百行代碼,后端接口及云資源調(diào)用同樣需要相同量級(jí),總代碼量達(dá)1500至2000行且易出錯(cuò)。AgentKit通過(guò)SDK和服務(wù)化封裝將復(fù)雜控制邏輯開(kāi)箱即用,前端Agent僅需約50行代碼,后端僅需十幾行即可完成簡(jiǎn)單串聯(lián),整套實(shí)現(xiàn)控制在61行以?xún)?nèi),代碼量減少約96%。依托預(yù)置云端服務(wù),該平臺(tái)顯著提升了Agent開(kāi)發(fā)與運(yùn)行的穩(wěn)定性,加速了企業(yè)將Agent推向生產(chǎn)環(huán)境的進(jìn)程。
火山引擎于2024年發(fā)布的HiAgent解決方案也在持續(xù)迭代。今年推出的“1+N+X”體系包含統(tǒng)一AI任務(wù)調(diào)度入口、N個(gè)企業(yè)通用智能體及X個(gè)業(yè)務(wù)定制智能體應(yīng)用,進(jìn)一步助力企業(yè)加速Agent規(guī)模化部署。通過(guò)這些技術(shù)突破,火山引擎正推動(dòng)AI從技術(shù)潛力轉(zhuǎn)化為實(shí)際行業(yè)生產(chǎn)力。











