在第八屆世界聲博會暨2025科大訊飛全球1024開發(fā)者節(jié)上,科大訊飛以“更懂你的AI”為核心主題,正式推出訊飛星火大模型最新技術(shù)升級及系列創(chuàng)新產(chǎn)品,全面描繪了人工智能產(chǎn)業(yè)價值落地的實踐路徑。此次發(fā)布會上,深度推理大模型訊飛星火X1.5成為焦點(diǎn),其推理效率較前代提升100%,在語言理解、文本生成、知識問答、邏輯推理、數(shù)學(xué)能力、代碼開發(fā)等六大核心維度達(dá)到國際領(lǐng)先水平,數(shù)學(xué)能力持續(xù)保持全球優(yōu)勢。該模型支持超過130種語言,整體性能達(dá)到GPT-5的95%以上,為全球AI發(fā)展提供了全新選擇。
在底層技術(shù)突破方面,科大訊飛實現(xiàn)多項關(guān)鍵進(jìn)展。基于全國產(chǎn)算力平臺,團(tuán)隊攻克長思維鏈強(qiáng)化學(xué)習(xí)訓(xùn)練效率難題,深度推理訓(xùn)練效率從30%躍升至84%以上,同時優(yōu)化MoE模型全鏈路訓(xùn)練流程,進(jìn)一步鞏固自主可控技術(shù)底座。語音技術(shù)領(lǐng)域,全球首發(fā)的非自回歸架構(gòu)通過并行輸出機(jī)制,將推理效率提升至新高度。硬件創(chuàng)新方面,獨(dú)家“AI+揚(yáng)聲器陣列技術(shù)”結(jié)合自研算法,實現(xiàn)立體聲場重構(gòu),為用戶帶來沉浸式音頻體驗。
教育場景應(yīng)用中,星火大模型構(gòu)建了包含3大類、3層級、4000余個標(biāo)簽的錯因分析體系,該成果通過國家數(shù)學(xué)課程標(biāo)準(zhǔn)修訂組組長曹一鳴教授領(lǐng)銜的專家組鑒定。通過智能批閱機(jī)與教師助手聯(lián)動,系統(tǒng)可在數(shù)小時內(nèi)完成從作業(yè)批改到個性化教學(xué)方案生成的閉環(huán),推動教學(xué)模式革新。醫(yī)療領(lǐng)域,星火醫(yī)療大模型在權(quán)威評測中達(dá)到三甲醫(yī)院主任醫(yī)師水平,基于覆蓋7.7萬家基層機(jī)構(gòu)的“智醫(yī)助理”數(shù)據(jù)反饋,人機(jī)協(xié)同使診斷準(zhǔn)確率從87%提升至96%,病歷書寫時間縮短50%。新發(fā)布的“智醫(yī)助理醫(yī)院版1.0”集成輔助診療、病歷生成等功能,個人健康助手“訊飛曉醫(yī)”則支持解析99%的醫(yī)學(xué)報告,累計完成1.6億次健康咨詢。
多模態(tài)交互技術(shù)迎來重要突破。數(shù)字人導(dǎo)覽員“小飛”現(xiàn)場演示了跨語言、多用戶交互能力,可同時處理中文、英文等語種對話,并根據(jù)用戶歷史記錄提供個性化服務(wù),完成購票、訂酒店等復(fù)雜任務(wù)。其交互體驗源于八大技術(shù)突破:遠(yuǎn)場語音識別、3D視覺感知、主動交互引擎、類人動作反饋、視聽融合理解、超擬人形象生成、個性化記憶管理以及情感語義分析。
兩大核心技術(shù)首發(fā)成為另一亮點(diǎn)。個性化記憶系統(tǒng)通過構(gòu)建用戶畫像庫,整合長期行為模式、近期反饋及短期對話內(nèi)容,使AI具備深度理解能力。百變聲音復(fù)刻技術(shù)基于星火語音大模型,僅需1秒錄音即可復(fù)制任意音色,并支持通過指令創(chuàng)造多樣化語音風(fēng)格。視覺健康領(lǐng)域,訊飛AI黑板搭載全球首款圓偏振自然光護(hù)眼屏幕,將視覺疲勞降低50%,130度超寬視角確保教室每個角落的學(xué)生都能清晰觀看。
在天津產(chǎn)業(yè)布局方面,科大訊飛已設(shè)立5家子公司,業(yè)務(wù)涵蓋大數(shù)據(jù)、消費(fèi)電子、創(chuàng)業(yè)投資、融資租賃及產(chǎn)業(yè)基金等領(lǐng)域。2011年成立的天津訊飛信息科技作為首家全資子公司,持續(xù)推動智慧教育、智慧醫(yī)療等項目落地。此次發(fā)布會特別展示了AI在津應(yīng)用成果:某中學(xué)引入智能批閱系統(tǒng)后,教師批改效率提升4倍;基層醫(yī)療機(jī)構(gòu)通過“智醫(yī)助理”系統(tǒng),年處理門診量超2000萬人次。










