火山引擎近期宣布調(diào)整其2021年設(shè)定的千億元年?duì)I收目標(biāo),將原定于2029年至2031年實(shí)現(xiàn)的時間周期保持不變,但目標(biāo)金額上調(diào)數(shù)百億元。這一調(diào)整源于團(tuán)隊(duì)主動提出,體現(xiàn)了火山引擎在AI云領(lǐng)域的堅(jiān)定決心。火山引擎總裁譚待表示,團(tuán)隊(duì)對拿下AI云市場的信心來自于MaaS(模型即服務(wù))收入和豆包大模型能力的超預(yù)期提升。
在12月18日舉辦的冬季Force原動力大會上,譚待透露,豆包大模型日均Token處理量在12月已超過50萬億,半年內(nèi)增長超200%。這一增長不僅得益于字節(jié)旗下豆包、即夢等AI應(yīng)用的快速發(fā)展,還吸引了大量外部客戶深入使用大模型。數(shù)據(jù)顯示,累計(jì)使用上萬億Token的客戶超過100家,數(shù)量是云計(jì)算巨頭AWS的兩倍。
譚待指出,大模型能力的持續(xù)提升正在解鎖新場景,帶動Token使用量增長。例如,生圖、生視頻需求隨著Seedream、Seedance模型的成熟迅速上升。此次大會上,火山引擎升級了多款大模型,其中豆包基礎(chǔ)大模型1.8版本強(qiáng)化了多輪指令遵循與OS Agent能力,可理解長達(dá)1.5小時的視頻。譚待還透露,能力更強(qiáng)的豆包大模型2.0版本即將上線。
視頻生成模型Seedance升級至1.5 pro版本,重點(diǎn)提升了音畫同步、多人多語言對話能力,并賦予畫面電影級質(zhì)感。譚待強(qiáng)調(diào),細(xì)節(jié)處理是關(guān)鍵,Seedance 1.5 pro不僅能處理中文、英語、西班牙語等多種語言,還能精準(zhǔn)匹配四川話、陜西話等方言的口型,解決了多數(shù)視頻生成模型的痛點(diǎn)。
在定價策略上,火山引擎不再強(qiáng)調(diào)單點(diǎn)降價,而是推出覆蓋豆包系列大模型、DeepSeek、月之暗面等開源模型及周邊產(chǎn)品的“節(jié)省計(jì)劃”。譚待解釋,隨著客戶深入使用AI,不同業(yè)務(wù)中調(diào)用多種模型的需求增加,節(jié)省計(jì)劃通過整體優(yōu)惠降低試錯成本,鼓勵客戶“用得越多,省得越多”。
譚待觀察到,企業(yè)開發(fā)邏輯正因大模型發(fā)生變化:過去以if-else定義工作流,如今轉(zhuǎn)向基于Prompt和模型驅(qū)動Agent;運(yùn)維(Ops)也從管理服務(wù)器轉(zhuǎn)變?yōu)檫\(yùn)營數(shù)字員工(Agent)。為此,火山引擎構(gòu)建了從MaaS到Agent開發(fā)、運(yùn)營的全棧產(chǎn)品體系,將豆包app中的對話、搜索、思考等能力封裝成Agent API,供客戶通過幾行代碼調(diào)用。
當(dāng)前云計(jì)算行業(yè)在AI領(lǐng)域的競爭愈發(fā)激烈,頭部廠商將MaaS視為長期成功的關(guān)鍵指標(biāo)。譚待認(rèn)為,更多參與者入局有助于擴(kuò)大行業(yè)規(guī)模,火山引擎有信心保持份額領(lǐng)先。他多次強(qiáng)調(diào)“加速度最重要”,無論是基礎(chǔ)大模型的追趕還是業(yè)務(wù)規(guī)模的擴(kuò)張,火山引擎的ToC和ToB協(xié)同優(yōu)勢及積累的know-how將成為關(guān)鍵。
在訪談中,譚待透露,豆包2.0模型仍在訓(xùn)練中,但1.8版本已在多模態(tài)和Agent能力上取得顯著進(jìn)步。例如,其視覺理解能力可處理1.5小時視頻,適用于監(jiān)控片段檢索等場景。針對視頻生成模型,譚待表示,火山引擎有信心做到國際領(lǐng)先,而基礎(chǔ)語言模型的短期目標(biāo)是躋身第一梯隊(duì),盡管追趕OpenAI等先行者需要時間,但加速度優(yōu)勢將逐步縮小差距。
火山引擎此次未延續(xù)降價策略,而是通過節(jié)省計(jì)劃推動創(chuàng)新。譚待解釋,客戶在不同業(yè)務(wù)中調(diào)用多種模型導(dǎo)致采購復(fù)雜,節(jié)省計(jì)劃通過整體優(yōu)惠降低創(chuàng)新成本。例如,客戶積累的語言模型用量折扣可直接應(yīng)用于視頻生成模型,試錯成本大幅降低。他強(qiáng)調(diào),模型能力提升和抽卡成功率增加已實(shí)際降低ROI角度的成本,節(jié)省計(jì)劃旨在進(jìn)一步加速創(chuàng)新。
針對企業(yè)開發(fā)門檻,火山引擎推出了豆包助手API,將豆包app的深度思考、邊想邊搜等能力封裝成更高層級的Agent API。譚待舉例,IoT硬件接入豆包視頻通話或搜索能力時,過去需調(diào)用基礎(chǔ)模型API并自行搭建Agent流程,如今通過助手API可直接調(diào)用封裝好的能力,大幅降低創(chuàng)新門檻。他對比了HiAgent、AgentKit、扣子等開發(fā)工具,強(qiáng)調(diào)助手API的獨(dú)特性在于無需開發(fā)即可調(diào)用復(fù)雜Agent能力。
譚待認(rèn)為,API可替換性僅存在于淺層使用場景,復(fù)雜業(yè)務(wù)如視頻創(chuàng)作需結(jié)合私有數(shù)據(jù)、特定畫風(fēng)及模型調(diào)整,端到端跑通Agent需身份認(rèn)證、組件支持等,類似開發(fā)復(fù)雜網(wǎng)站,粘性較強(qiáng)。他以云計(jì)算發(fā)展為例,指出云原生階段的價值在于彈性、現(xiàn)金流管理和技術(shù)觸達(dá)效率,AI時代這些價值被進(jìn)一步放大。
火山引擎的產(chǎn)品策略源于降低AI創(chuàng)新門檻的思路。譚待介紹,從基礎(chǔ)MaaS層到Agent開發(fā)層,火山引擎通過Prompt優(yōu)化、智能路由、Response API內(nèi)置工具等提升易用性,并推出推理代工和RL Serverless服務(wù)。在Agent開發(fā)層面,全棧AgentKit覆蓋權(quán)限管理、身份認(rèn)證、Memory、安全等模塊,HiAgent則用于Agent運(yùn)營管理。火山引擎與第三方合作開發(fā)專用Agent,如與Cocos合作的小游戲開發(fā)Agent。
譚待指出,AI使ToB和ToC產(chǎn)品體驗(yàn)差距縮小,火山引擎擅長通過產(chǎn)品體驗(yàn)增益客戶。他觀察到,編程邏輯正從if-else轉(zhuǎn)向模型驅(qū)動Agent,窗口限制帶來的上下文管理問題需新中間件解決,傳統(tǒng)if-else將通過MCP等方式調(diào)用。AI原生時代的DevOps中,Dev變?yōu)榛赑rompt的開發(fā),Ops變?yōu)閿?shù)字員工運(yùn)營,企業(yè)需構(gòu)建“1+N+X”落地模式:1個統(tǒng)一控制臺、N個預(yù)置通用Agent、X個快速開發(fā)的自有Agent。
火山引擎在AI實(shí)踐上的領(lǐng)先得益于字節(jié)集團(tuán)內(nèi)部50多個業(yè)務(wù)線的持續(xù)嘗試。譚待認(rèn)為,服務(wù)內(nèi)外客戶的經(jīng)驗(yàn)使其更懂痛點(diǎn),認(rèn)知優(yōu)勢源于實(shí)踐而非空想。他強(qiáng)調(diào),內(nèi)部團(tuán)隊(duì)不強(qiáng)制使用火山產(chǎn)品,充分競爭才能提升質(zhì)量,內(nèi)部客戶的溝通優(yōu)勢在于反饋直接透徹。
談及Agent落地情況,譚待表示,盡管Agent整體增長迅速,但多數(shù)仍偏簡單。復(fù)雜Agent需調(diào)用多個工具并動態(tài)創(chuàng)建子Agent,火山引擎推出的AgentKit可簡化開發(fā)流程。例如,大會展示的報名Agent通過AgentKit實(shí)現(xiàn)智能打卡和會議總結(jié),提升了參會體驗(yàn)。目前,火山引擎的深度客戶集中在ToC行業(yè),智能制造、消費(fèi)電子和汽車行業(yè)用量增長顯著,符合二八定律。
在行業(yè)合作方面,火山引擎與全球前10手機(jī)廠商中的9家合作,汽車領(lǐng)域聚焦座艙場景,不涉及智駕。拓展行業(yè)客戶時,火山引擎延續(xù)傳統(tǒng)云服務(wù)長打法,通過專門團(tuán)隊(duì)匹配需求,但更注重長期目標(biāo)設(shè)定、考核機(jī)制和靈活調(diào)整。譚待強(qiáng)調(diào),組織能力是關(guān)鍵,需保持上下聲音通暢、調(diào)整靈活,字節(jié)范兒的“Context,not Control”文化支持了快速糾錯。







