在第八屆世界聲博會暨2025科大訊飛全球1024開發(fā)者節(jié)上,科大訊飛以“更懂你的AI”為核心主題,推出訊飛星火大模型最新技術升級及系列創(chuàng)新產(chǎn)品,全面描繪AI技術賦能產(chǎn)業(yè)發(fā)展的實踐路徑。此次發(fā)布不僅展現(xiàn)了自主可控技術體系的突破,更通過多領域應用場景的落地,為全球AI生態(tài)建設注入新動能。

深度推理大模型星火X1.5的亮相成為技術突破的焦點。該模型采用混合專家(MoE)架構,總參數(shù)量達2930億,激活參數(shù)300億,在保持國際領先的數(shù)學能力基礎上,推理效率較前代提升100%,整體性能達到GPT-5的95%以上。其多語言支持覆蓋130個語種,在拉美、東盟等14個重點語言場景中表現(xiàn)優(yōu)異。值得關注的是,星火X1.5在國產(chǎn)算力平臺上攻克兩大核心難題:長思維鏈強化學習訓練效率從30%躍升至84%,MoE模型全鏈路訓練效率實現(xiàn)質(zhì)的飛躍,為自主可控技術體系奠定堅實基礎。全球首發(fā)的非自回歸語音大模型架構通過并行輸出機制,將推理成本降低520%,效果提升16%,開創(chuàng)語音處理新范式。
軟硬一體化解決方案的推出標志著AI技術向真實場景的深度滲透。基于獨家“AI+麥克風陣列技術”,訊飛智能辦公本X5搭載上4下4環(huán)八麥克風陣列,在95分貝高噪環(huán)境下仍保持95.08%的識別準確率,超越iPhone 17 Pro;AI翻譯耳機采用單耳三麥多感融合系統(tǒng),復雜噪聲下識別率達97.1%;雙屏翻譯機2.0在90分貝環(huán)境中實現(xiàn)98.69%的識別率。在視覺呈現(xiàn)領域,智能座艙音響方案iFLYSOUND通過立體空間聲場重構技術,已在19家車企量產(chǎn),累計出貨量超100萬臺。教育場景中,AI黑板搭載的圓偏類自然光護眼大屏使視覺疲勞降低50%,130度超寬域顯示確保教室全覆蓋;AI學習機集成微納米類紙屏技術,獲得國內(nèi)外10余項護眼認證。
多模態(tài)交互能力的革新重新定義了人機關系。數(shù)字人導覽“小飛”現(xiàn)場演示了八大核心技術突破:遠場麥克風識別、3D視覺感知、多人主動交互、類人舉止反饋、視聽覺融合理解、超擬人數(shù)字人生成、個性化記憶構建及情感語義分析。其中,個性化記憶系統(tǒng)通過用戶畫像、近期反饋與短期對話的綜合分析,實現(xiàn)真正的“懂你”交互;百變聲音復刻技術僅需1秒錄音即可克隆任意音色,并支持風格化聲音創(chuàng)造。科大訊飛董事長劉慶峰強調(diào):“超擬人多模態(tài)交互將成為AI進入家庭的標準配置,讓技術真正具備情感溫度。”

應用場景的拓展彰顯AI技術的普惠價值。教育領域,星火大模型構建的4000+標簽錯因體系通過權威鑒定,智能批閱機與教師助手形成“小時級閉環(huán)”,推動因材施教范式變革;醫(yī)療領域,星火醫(yī)療大模型達到主任級醫(yī)師診療水平,人機協(xié)同使基層診斷合理率提升至96%,病歷書寫時間減半,“智醫(yī)助理醫(yī)院版1.0”與個人健康助手“訊飛曉醫(yī)”累計完成1.6億次健康咨詢;出行領域,星火智慧座艙2.0通過54維記憶錨點記錄用戶偏好,提供體征監(jiān)測與場景化服務;辦公場景中,智能辦公本X5實現(xiàn)手寫紀要與AI生成的深度融合,聽見APP可自動生成會議紀要與待辦事項;情感陪伴方面,“AI星朋友”憑借4.35MOS高保真聲音克隆與160種人設模型,通過自學習情感模型主動提供關懷,讓科幻場景成為現(xiàn)實。
生態(tài)建設的加速推進為全球開發(fā)者創(chuàng)造新機遇。2025年AI開發(fā)者大賽吸引17國36,898個團隊參與,催生4,622個垂類智能體。截至10月底,訊飛開放平臺開發(fā)者總數(shù)達968萬,近一年新增200萬,大模型企業(yè)開發(fā)者增長125%。發(fā)布會上,原生支持RPA的智能體平臺Astron正式開源,該平臺整合Agent決策能力與RPA自動化執(zhí)行,提供八大行業(yè)智能體模板,助力開發(fā)者跨越AI應用門檻。同期啟動的“星火點亮全球”計劃,將依托多語言優(yōu)勢與自主技術,與全球伙伴共建AI生態(tài),為世界提供技術發(fā)展的“第二種選擇”。











