在上海世博中心舉辦的2025年冬季火山引擎FORCE原動力大會上,一場關于AI技術深度落地的創新實踐吸引了行業目光。字節跳動旗下AI開發平臺扣子Coze與智能機器人品牌靈宇宙的聯合成果——AI智能體"Yummy",憑借其獨特的共情陪伴模式與教育場景應用,成為大會焦點。這款以"天才小廚師"為定位的智能體,不僅展現了AI技術在垂直領域的突破,更探索出一條將勞動教育融入家庭場景的創新路徑。
區別于傳統教育工具的機械輸出模式,Yummy通過火山引擎的視覺理解模型與實時音視頻技術,構建起多模態交互體系。在家庭廚房場景中,當兒童制作蛋撻時,智能體能通過攝像頭實時識別操作步驟,以語音引導完成打蛋、攪拌等精細動作。針對兒童挑食問題,系統采用創意敘事策略——將西蘭花轉化為"森林大樹",用趣味化解讀激發探索欲。這種非強制性的引導方式,與當前健康管理領域"認知驅動"的前沿理念高度契合,成功實現從被動接受到主動嘗試的轉變。
支撐這種智能交互的,是靈宇宙自研的LingOS系統與火山引擎的模型矩陣協同。開發者無需從零搭建基礎架構,即可調用Vision視覺模型、Doubao-1.8語言模型等組件,專注于交互設計與角色塑造。Yummy不僅能識別食材,更能結合歷史典故進行知識延伸:在介紹粽子時講述屈原故事,解析羊角面包時還原奧斯曼帝國貿易史。這種"萬物皆教材"的設計理念,將廚房空間轉化為立體課堂,讓勞動教育突破傳統說教框架。
大會現場展示的便攜式終端設備"小方機",進一步拓展了AI陪伴的物理邊界。這款僅手掌大小的設備采用掛繩設計,可隨身佩戴或置于桌面,通過攝像頭與麥克風陣列構建起"第三只眼"的感知系統。其混合架構設計確保了毫秒級響應速度——當用戶指向物體提問時,系統能即時生成對話反饋。靈宇宙創始人顧嘉唯透露,設備搭載的Viking長期記憶技術,可自動記錄用戶行為偏好,形成動態數字畫像,為個性化陪伴提供數據支撐。
在靈宇宙的愿景中,這種交互模式將延伸至更廣泛的物理空間。通過構建"物理空間行為大模型",系統不僅能識別物體,更能理解空間關系與行為邏輯——例如預測積木倒塌路徑或解析手工船的浮力原理。當用戶完成手工創作后,AI可自動關聯相關知識庫,在后續對話中觸發跨模態記憶,實現虛擬知識與現實體驗的無縫銜接。這種"點物賦靈"的交互范式,正在重新定義人與物理世界的連接方式。
目前,靈宇宙已啟動與火山引擎Viking產品的深度整合計劃。通過長期記憶技術的持續優化,未來每個用戶都將擁有專屬的"數字靈魂檔案",記錄關鍵事件與興趣偏好。這種技術演進方向,不僅強化了AI的陪伴屬性,更構建起連接現實體驗與知識體系的智能橋梁。正如顧嘉唯所言:"真正的突破不在于單一技術,而在于定義新的交互范式——讓每個物體都成為理解世界的入口。"















