科技領(lǐng)域迎來新動(dòng)態(tài),谷歌計(jì)劃在Gemini平臺(tái)推出一項(xiàng)名為Nano Banana Pro的創(chuàng)意功能升級(jí),主要面向設(shè)計(jì)師、營銷人員及教育工作者群體。用戶可通過Gemini應(yīng)用中的“Thinking”模型直接使用該功能,其核心亮點(diǎn)在于強(qiáng)大的布局控制能力。
在圖像生成方面,該功能支持用戶生成最高達(dá)4K分辨率的圖像,并且能夠自由設(shè)定多種縱橫比。從適用于演示和印刷品的16:9,到適配社交媒體帖子的9:16,多樣化的比例設(shè)置可確保輸出內(nèi)容直接滿足不同發(fā)布渠道的規(guī)格要求,無需創(chuàng)作者后期額外調(diào)整。
此次升級(jí)的一大技術(shù)突破是引入了“高級(jí)文本渲染”技術(shù)。這一技術(shù)極大地提升了圖像中文字和拼寫的精準(zhǔn)度,能夠清晰生成包含復(fù)雜文本的海報(bào)、菜單、邀請(qǐng)函,甚至數(shù)據(jù)密集型信息圖。對(duì)于需要大量文字展示的創(chuàng)意設(shè)計(jì)場(chǎng)景,該技術(shù)無疑提供了有力支持。
Nano Banana Pro還對(duì)概念設(shè)計(jì)流程進(jìn)行了優(yōu)化。用戶只需上傳一張二維草圖,再通過提示詞,就能讓Gemini將其渲染成具有照片級(jí)真實(shí)感的三維產(chǎn)品圖像。這一功能方便創(chuàng)作者探索不同材質(zhì)和光影效果,為產(chǎn)品設(shè)計(jì)的初期階段提供了更直觀、高效的呈現(xiàn)方式,有助于快速迭代設(shè)計(jì)方案。
在圖像編輯與合成領(lǐng)域,該功能同樣實(shí)現(xiàn)了顯著增強(qiáng)。它支持用戶同時(shí)上傳多達(dá)六張圖片,進(jìn)行場(chǎng)景融合或元素提取。例如,創(chuàng)作者可以將不同場(chǎng)景中的元素組合在一起,創(chuàng)造出全新的視覺效果;或者從多張圖片中提取特定元素,用于新的創(chuàng)作中,極大地豐富了創(chuàng)作的可能性。
其中,“風(fēng)格遷移”功能可以將參考圖像的調(diào)色板或整體視覺風(fēng)格應(yīng)用到另一張照片上,讓創(chuàng)作者能夠快速實(shí)現(xiàn)風(fēng)格的統(tǒng)一或轉(zhuǎn)換。而更具創(chuàng)新性的“畫布引導(dǎo)”功能,允許用戶直接在上傳的圖片上通過涂鴉、畫圈或注釋等方式下達(dá)視覺指令。這種直觀的交互方式,讓AI能夠更準(zhǔn)確地理解創(chuàng)作者的修改意圖,并快速執(zhí)行相應(yīng)操作。
與早前發(fā)布的版本相比,Nano Banana Pro的核心價(jià)值在于將多圖像合成、高可靠性排版以及縱橫比控制等關(guān)鍵功能整合進(jìn)單一工作流中。這種集成化設(shè)計(jì)有效減少了創(chuàng)作者在不同專業(yè)軟件之間來回切換的繁瑣操作,避免了因軟件切換導(dǎo)致的工作流程中斷和數(shù)據(jù)丟失等問題,顯著提升了工作效率,為創(chuàng)意工作者提供了更加便捷、高效的創(chuàng)作工具。











