近日,月之暗面核心團隊在海外社交平臺Reddit上發起了一場深度互動問答活動,聯合創始人兼CEO楊植麟等多位技術負責人就模型研發、技術路線選擇及開源生態建設等熱點問題展開回應。此次活動吸引了大量海外開發者參與,問題覆蓋模型性能優化、技術架構創新及商業化路徑等多個維度。
針對Kimi K2 Thinking模型訓練成本的網絡爭議,楊植麟明確否認"460萬美元"的傳言。他指出,模型研發成本難以簡單量化,研究實驗階段的投入占比顯著。同時透露團隊已啟動視覺-語言(VL)版本研發,但純文本模型優先發布是因正確數據獲取與訓練需要更長時間。對于用戶反饋的推理時間過長問題,他解釋當前版本優先保障絕對性能,后續將通過獎勵機制優化token使用效率。
在技術架構層面,混合線性注意力架構Kimi Linear成為討論焦點。該架構在短上下文、長上下文及強化學習擴展等場景首次超越傳統全注意力機制,其核心模塊KDA已被納入下一代模型規劃。楊植麟透露,KDA在長思維鏈強化學習場景中展現出高效優勢,未來可能結合擴散模型進行創新,但文本擴散應用仍面臨先驗不足的技術挑戰。算法負責人周昕宇進一步說明,KDA混合架構在預訓練和強化學習階段均優于傳統方案,成本效益顯著提升。
面對模型實際體驗與榜單成績的差異質疑,楊植麟承認現階段存在通用能力不足的問題。他以HLE基準測試為例,表示團隊正在通過提升智能體推理能力來改善實際應用表現。對于用戶提出的100萬token上下文窗口需求,周昕宇坦言此前嘗試因服務成本過高暫停,但未來會重新評估技術方案。在模型部署方面,針對企業用戶對"中國大模型"的安全顧慮,聯合創始人吳育昕強調開源策略可消除部分擔憂,企業自主部署能提升信任度。
關于AI瀏覽器開發計劃,周昕宇直言無需通過Chromium套殼實現模型優化,團隊將專注核心模型訓練并持續更新kimi.com功能。在商業化層面,針對編程訂閱方案API計費模式引發的資源消耗爭議,團隊表示將探索更優解決方案,同時強調當前計費方式符合企業成本結構且透明度高。對于小型模型需求,楊植麟透露已發布Kimi-Linear-48B等輕量化版本,未來將擴展更多功能模型。
這場持續數小時的技術對話,不僅展現了月之暗面在混合注意力架構、強化學習等領域的創新突破,更通過坦誠回應海外開發者關切,彰顯了中國AI團隊的技術自信與開放態度。從模型性能優化到開源生態建設,從技術路線選擇到商業化實踐,這場跨越時區的問答揭示了中國AI創新正在獲得全球技術社區的深度關注。











