12 月 20 日消息,谷歌于 12 月 18 日發(fā)布公告,宣布推出 FunctionGemma,是基于 Gemma 3 270M 微調(diào)的專用模型,目的是將強(qiáng)大的函數(shù)調(diào)用(Function Calling)能力引入手機(jī)等邊緣設(shè)備。
谷歌表示,隨著行業(yè)從單純的對話式接口轉(zhuǎn)向主動(dòng)式智能體(Agent),開發(fā)者對模型本地執(zhí)行任務(wù)的需求日益迫切。
FunctionGemma 正是為此而生,它不僅繼承了 Gemma 系列的輕量化優(yōu)勢,更通過專項(xiàng)微調(diào),讓邊緣設(shè)備(如智能手機(jī)和嵌入式系統(tǒng))無需依賴云端算力,能夠精準(zhǔn)理解用戶指令并調(diào)用相應(yīng)功能。
與通用大模型不同,F(xiàn)unctionGemma 專為“定制化”設(shè)計(jì)。它既能與人類自然對話,也能生成結(jié)構(gòu)化的函數(shù)調(diào)用代碼來指揮計(jì)算機(jī)。
在 Google 進(jìn)行的“移動(dòng)操作”(Mobile Actions)測試中,該模型展現(xiàn)了驚人的可塑性:未經(jīng)微調(diào)的基礎(chǔ)版本準(zhǔn)確率為 58%,而經(jīng)過針對性微調(diào)后,其執(zhí)行復(fù)雜指令(如“明天約午飯并添加到日歷”、“幫我把昨天拍的美食發(fā)給老媽”)的準(zhǔn)確率躍升至 85%。
為了在算力和電池受限的邊緣設(shè)備上流暢運(yùn)行,F(xiàn)unctionGemma 采用了極致的輕量化設(shè)計(jì)。它利用 Gemma 的 256k 詞表高效處理 JSON 數(shù)據(jù)和多語言輸入,大幅降低了延遲。
該模型目前已適配 NVIDIA Jetson Nano 等開發(fā)板及主流移動(dòng)設(shè)備,甚至能作為“交通指揮官”,處理簡單任務(wù)并將復(fù)雜邏輯路由至更大的 Gemma 3 27B 模型。
為了降低開發(fā)門檻,谷歌為 FunctionGemma 構(gòu)建了廣泛的生態(tài)支持。開發(fā)者現(xiàn)在即可通過 Hugging Face、Kaggle 下載模型,并利用 Unsloth、Keras 或 NVIDIA NeMo 進(jìn)行微調(diào)。
在部署方面,該模型全面支持 LiteRT-LM、vLLM、Llama.cpp 和 Ollama 等工具。谷歌還同步發(fā)布了 TinyGarden 游戲演示和“移動(dòng)操作”微調(diào)指南,展示了如何用自然語言控制虛擬農(nóng)場或手機(jī)系統(tǒng)設(shè)置,幫助開發(fā)者快速構(gòu)建屬于自己的私有化、低延遲端側(cè)智能體。附上演示視頻如下:
無論是“為明天的午餐創(chuàng)建一個(gè)日歷事件”、“將 John 添加到我的聯(lián)系人”還是“打開手電筒”,該模型都能解析自然語言并識(shí)別正確的操作系統(tǒng)工具來執(zhí)行命令。
在這個(gè)互動(dòng)小游戲中,玩家使用語音指令來管理一塊虛擬土地。例如,你可以說“在最上面一排種向日葵并澆水”,模型會(huì)將指令分解為具體的應(yīng)用程序功能,例如針對特定網(wǎng)格坐標(biāo)的“種植作物”或“澆水作物”。 使用自然語言解決有趣的物理模擬謎題,款游戲完全在用戶瀏覽器中本地運(yùn)行,由 FunctionGemma 和 Transformers.js 提供支持。









