生成式人工智能正從簡單的圖文生成邁向更復雜的真實場景應用,模型復雜度與內容豐富度的提升,對算力與能耗提出了前所未有的挑戰。當前光電芯片雖在加速判別類任務中表現突出,卻難以直接支撐大規模生成模型的運行。如何突破這一瓶頸?上海交通大學集成電路學院陳一彤課題組近日在《科學》期刊發表研究成果,宣布成功研制全球首款支持大規模語義視覺生成的全光計算芯片LightGen,為下一代算力芯片開辟了全新路徑。
傳統電子芯片依賴電子在晶體管中的流動完成計算,而光計算芯片則讓光在芯片內部傳播,通過光場變化實現運算。光信號具有天然的高速并行特性,理論上可突破現有算力與能耗限制。然而,生成式AI模型規模龐大且需跨維度處理,若芯片集成度不足,光信號需頻繁與電信號轉換,反而會因延遲與能耗抵消速度優勢。全光計算因此成為關鍵——只有完全擺脫電信號輔助,才能充分發揮光的潛力。
LightGen的突破性在于單芯片同時攻克三大技術難題:首次實現百萬級光學神經元集成,構建起可處理復雜任務的“光腦”;開發全光維度轉換技術,使芯片能自主切換不同計算模式;創新不依賴真實數據的光學生成模型訓練算法,解決傳統方法依賴海量標注數據的痛點。這三項技術單拎任何一項均屬行業前沿,而LightGen的集成創新讓大規模生成任務的全光端到端實現成為可能。
更值得關注的是,LightGen構建了完整的“輸入—理解—語義操控—生成”閉環。當圖像輸入芯片后,系統可自動提取語義特征,并在語義指令下生成全新媒體內容。實驗顯示,該芯片不僅能完成高分辨率圖像生成、3D建模、高清視頻合成,還支持去噪、特征遷移等復雜任務。例如,在語義調控下,芯片可將冬季雪景轉換為夏季綠蔭,或讓靜態圖像“動”起來生成視頻片段。
這項成果被國際學術界視為算力芯片領域的里程碑。傳統電子芯片每秒可處理約10萬億次運算,而LightGen通過光子并行計算,理論算力可提升數個數量級,同時能耗降低至傳統方案的百分之一。業內專家指出,該研究不僅為生成式AI提供了更高效的硬件支撐,更揭示了光計算在復雜認知任務中的潛力,可能引發計算架構的范式變革。










