滾動資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

5天5次迭代升級，可靈AI年末發(fā)力引領(lǐng)生成式AI新潮流

時間：2025-12-10 19:25:45 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

生成式AI領(lǐng)域近日迎來新一輪技術(shù)浪潮，國產(chǎn)視頻生成大模型可靈AI在短時間內(nèi)連續(xù)推出多項突破性功能，引發(fā)行業(yè)廣泛關(guān)注。其最新發(fā)布的可靈O1模型與2.6版本，通過多模態(tài)融合與音畫協(xié)同技術(shù)，重新定義了AI視頻創(chuàng)作的效率邊界。

可靈O1模型的核心突破在于構(gòu)建了全球首個統(tǒng)一的多模態(tài)創(chuàng)作引擎。該模型將參考生視頻、文生視頻、首尾幀生成等十余種任務(wù)整合至單一平臺，用戶無需切換工具即可完成從創(chuàng)意構(gòu)思到成品輸出的全流程。技術(shù)團隊通過引入Multimodal Transformer架構(gòu)與長上下文理解機制，使模型在主體一致性控制與畫面細(xì)節(jié)編輯方面達到行業(yè)領(lǐng)先水平。內(nèi)部測評數(shù)據(jù)顯示，在圖片參考任務(wù)中，其效果較Google Veo 3.1提升247%；指令變換任務(wù)中，較Runway Aleph優(yōu)化230%。

圖像生成領(lǐng)域同樣實現(xiàn)重要迭代。新上線的圖像O1模型支持純文本生成與多圖融合創(chuàng)作，用戶最多可上傳10張參考圖進行風(fēng)格遷移或元素重組。該模型通過建立從基礎(chǔ)生成到高階編輯的無縫銜接管道，顯著降低了專業(yè)圖像處理的門檻。測試案例顯示，模型在復(fù)雜場景構(gòu)建與細(xì)節(jié)還原方面表現(xiàn)突出，能夠精準(zhǔn)捕捉用戶描述中的光影變化與材質(zhì)特征。

12月3日發(fā)布的可靈2.6版本則聚焦音畫協(xié)同技術(shù)，推出行業(yè)首個"音畫同出"功能。該模型突破傳統(tǒng)AI視頻"先畫面后配音"的工作模式，可在單次生成中同步輸出自然語言、動作音效與環(huán)境氛圍音。目前支持中英文語音生成，視頻時長上限達10秒，后續(xù)將擴展至更多語種與定制化聲線。技術(shù)實現(xiàn)上，模型通過深度語義對齊算法，使音頻節(jié)奏與畫面動態(tài)保持高度同步，在環(huán)境音渲染與情感表達層面達到專業(yè)級水準(zhǔn)。

數(shù)字人技術(shù)同步迎來升級。2.0版本支持用戶上傳角色圖像后，通過文本描述直接驅(qū)動數(shù)字人表演，最長可生成5分鐘視頻內(nèi)容。該功能內(nèi)置表情捕捉與肢體動作生成算法，能夠根據(jù)配音內(nèi)容自動匹配微表情變化，在廣告營銷、短視頻制作等領(lǐng)域展現(xiàn)出強大應(yīng)用潛力。某影視公司測試反饋顯示，使用數(shù)字人2.0制作產(chǎn)品宣傳片，效率較傳統(tǒng)拍攝提升80%以上。

技術(shù)突破的背后是持續(xù)的市場驗證。數(shù)據(jù)顯示，可靈AI已服務(wù)超過2萬家企業(yè)客戶，覆蓋影視制作、廣告創(chuàng)意、電商營銷等30余個行業(yè)。某頭部電商平臺采用其視頻生成技術(shù)后，商品展示視頻制作成本降低65%，點擊轉(zhuǎn)化率提升40%。技術(shù)團隊透露，正在研發(fā)的3.0版本將重點優(yōu)化長視頻生成能力與多語言支持，計劃引入3D空間理解技術(shù)，進一步拓展虛擬制片與沉浸式內(nèi)容創(chuàng)作場景。

行業(yè)觀察人士指出，可靈AI的密集更新標(biāo)志著國產(chǎn)生成式AI技術(shù)進入成熟應(yīng)用階段。其通過構(gòu)建統(tǒng)一的多模態(tài)創(chuàng)作底座，不僅解決了傳統(tǒng)工具鏈割裂的痛點，更在創(chuàng)作效率與作品質(zhì)量層面形成差異化優(yōu)勢。隨著數(shù)字人、音畫協(xié)同等功能的持續(xù)完善，AI技術(shù)正在從輔助工具升級為內(nèi)容創(chuàng)作的核心驅(qū)動力。

12-10

豆包與努比亞合作AI手機M153發(fā)售，二手市場價格飆升至3.6萬

12-10

Google為Chrome AI筑安全防線懸賞2萬美元邀全球“找茬”

12-10

夸克AI眼鏡S1熱銷斷貨：二手價飆升，產(chǎn)能排期長達45天

12-10

TikTok Shop成美國社交電商新勢力 2025年社交電商將持續(xù)兩位數(shù)增長

12-10

京東34.73億港元購入香港辦公大樓50%權(quán)益持續(xù)加碼香港業(yè)務(wù)布局

12-10

電商“出清期”激戰(zhàn)正酣：阿里憑現(xiàn)金優(yōu)勢出擊，拼多多穩(wěn)健蓄力破局

12-10

谷歌Android XR智能眼鏡路線圖揭曉：輕量化設(shè)備引領(lǐng)未來穿戴新潮流

IT之家 12 月 9 日消息，科技媒體 Android Authority 今天（12 月 9 日）發(fā)布博文，報道稱在“The AndroidShow: XR Edition”活動中，谷歌公布了 Andr…

12-10

努比亞與抖音高管共話AI手機：豆包助手引領(lǐng)創(chuàng)新，開放共享未來可期

他以手機AI助手打車為例，指出整個過程“機主”可以通過“助手”絲滑完成，但其中需要調(diào)用地理位置、打車軟件、地圖導(dǎo)航、路況信息、支付等多個APP及數(shù)據(jù)，本質(zhì)上是“機主”授權(quán)“助手”完成了這一切，與什么所謂入侵…

12-10

谷歌Project Aura XR眼鏡2026年亮相：以手機為核，開啟輕量化交互新體驗

但實際體驗顯示，該設(shè)備較谷歌I/O大會展出的早期版本實現(xiàn)了全方位升級：顯示畫面的清晰度與可讀性顯著提升，系統(tǒng)運行流暢穩(wěn)定，與Gemini大模型的集成邏輯自然直觀，用戶僅需簡單引導(dǎo)即可快速上手操作。筆者就這一…

12-10

抖音副總裁李亮：AI手機助手靠“機主”授權(quán)，實現(xiàn)場景近在眼前又困難重重

IT之家 12 月 8 日消息，抖音集團副總裁李亮今晚通過微博發(fā)文，談到了自己對當(dāng)下“AI手機助手”的看法。他以打車場景為例稱，先前在影視作品中看到的場景，（現(xiàn)在）從技術(shù)上已經(jīng)可以實現(xiàn)了。李亮表示，在這樣…

12-10

努比亞M153攜豆包助手亮相，倪飛：AI手機成破局關(guān)鍵共筑開放生態(tài)

早在2017年，努比亞就推出首款A(yù)I手機Z17，近十年從Z系列真全面屏的AI功能，到如今M153的多模型協(xié)同，始終堅持“AI for All”：讓AI不是實驗室炫技，而應(yīng)成為大眾可輕松獲取的基礎(chǔ)能力，每一步…

12-10

阿里巴巴成立千問C端事業(yè)群，加速AI布局欲打造超級APP及AI助手

阿里巴巴在內(nèi)部溝通中提及，千問C端事業(yè)群的首要目標(biāo)是將千問打造成為一款超級APP，成為AI時代用戶的第一入口。千問App公測一周下載量即突破1000萬，用戶增長和留存超預(yù)期；同時與夸克AI瀏覽器、夸克AI眼…

12-10

三星Z TriFold三折疊手機開啟預(yù)售頂配21999元創(chuàng)新形態(tài)與AI功能亮點多

新機采用雙側(cè)向內(nèi)折疊的設(shè)計，完全展開后，呈現(xiàn)一塊10英寸的第二代動態(tài)AMOLED主顯示屏。在機身尺寸控制上，三星Z TriFold在完全展開狀態(tài)下，機身最薄處（含SIM卡托區(qū)域）的厚度僅為3.9毫米，整機重…

12-10

谷歌2026年推首款A(yù)I眼鏡，攜手多方布局，與Meta正面對決智能穿戴賽道

12月9日消息，據(jù)CNBC報道稱，谷歌計劃于2026年正式推出其首款人工智能眼鏡，這家科技巨頭正加緊努力，在日益火熱的人工智能可穿戴設(shè)備賽道上與Meta展開正面競爭。此外，谷歌還與三星在硬件設(shè)計方面展開協(xié)作，…

12-10

點擊查看更多 +

全站最新

五菱星光560新車圖曝光！硬派設(shè)計+三種動力 12月11日開啟預(yù)訂

東風(fēng)日產(chǎn)NX8公告圖亮相，800V平臺+5C超充引領(lǐng)中大型新能源SUV新潮流

12月工信部新車大揭秘！比亞迪秦MAX、全新奧迪A6L等多款新車亮點搶先看

五菱星光730煥新登場，“一車三動力”滿足全家出行多樣需求

東風(fēng)日產(chǎn)NX8來襲！簡約造型+800V 5C超充，2026上半年將亮相

純電版保時捷卡宴亮相：外觀精致升級，電氣化轉(zhuǎn)型能否再續(xù)輝煌？

熱門內(nèi)容

本欄最新

智電浪潮下寶馬堅守駕趣本心，以技術(shù)融合重塑豪華出行新體驗

15萬級純電SUV大比拼！深藍S05與銀河E5，誰更能滿足你的期待？

銳勝M8攜三動力架構(gòu)入場，12.98萬起重塑MPV市場新格局

幾乎翻倍，魏橋再造魏橋

老虎環(huán)球基金新動向：募資22億轉(zhuǎn)向?qū)徤骶劢梗鹤⑷斯ぶ悄茴I(lǐng)域

頂尖創(chuàng)業(yè)者偏愛聰明人：選對人才，才能讓創(chuàng)業(yè)之路事半功倍

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

5天5次迭代升級，可靈AI年末發(fā)力引領(lǐng)生成式AI新潮流

日本精品一区二区三区高清久久