阿里通義團隊近日宣布,其研發(fā)的圖像編輯模型Qwen-Image-Edit迎來重大升級,最新開源版本Qwen-Image-Edit-2511正式上線。該版本在角色一致性、工業(yè)設計能力及幾何推理等多個維度實現(xiàn)突破性提升,尤其針對人物生成質(zhì)量進行了深度優(yōu)化。
在核心特性方面,新版本通過算法迭代顯著增強了角色一致性表現(xiàn)。模型不僅能夠根據(jù)單張肖像圖進行創(chuàng)意編輯,還能在多人合照場景中保持高度統(tǒng)一的視覺風格。實驗數(shù)據(jù)顯示,相較于前代2509版本,2511版本在處理雙人及多人合照時,面部特征、光影效果等細節(jié)的一致性指標提升超過30%。例如輸入兩張不同角度的人物照片,模型可自動生成具有統(tǒng)一光照條件和表情管理的合成圖像。
技術(shù)集成層面,該版本創(chuàng)新性地內(nèi)置了LoRA(Low-Rank Adaptation)微調(diào)能力。基礎模型直接整合了打光控制、多場景適配等熱門LoRA效果,用戶無需額外加載插件即可實現(xiàn)專業(yè)級編輯。具體應用中,通過調(diào)整模型參數(shù)可精準控制畫面光源方向,或在保持主體不變的前提下快速切換背景場景。這種設計既降低了技術(shù)門檻,又拓展了創(chuàng)作自由度。
針對工業(yè)設計領域,新版本強化了三維建模與材質(zhì)渲染能力。在批量產(chǎn)品設計測試中,模型可同時生成20個不同視角的產(chǎn)品圖,且保持結(jié)構(gòu)比例精確無誤。材質(zhì)替換功能支持金屬、玻璃、塑料等12類常見材質(zhì)的智能轉(zhuǎn)換,轉(zhuǎn)換后的表面紋理、反光特性均符合物理規(guī)律。某家電企業(yè)試用后反饋,使用該模型可將產(chǎn)品渲染效率提升4倍,設計成本降低60%。
幾何推理能力的突破是本次升級的另一亮點。模型新增輔助線生成功能,在繪制建筑、機械等需要精確比例的圖像時,可自動顯示結(jié)構(gòu)參考線。測試案例顯示,在繪制標準六邊形時,模型生成的輔助線誤差控制在0.5像素以內(nèi),顯著優(yōu)于同類工具。這項功能尤其適用于教育、工程制圖等需要高精度輸出的場景。
目前,Qwen-Image-Edit-2511已通過ModelScope和Hugging Face平臺開源,開發(fā)者可自由下載使用。團隊透露,后續(xù)將持續(xù)優(yōu)化模型在動態(tài)視頻編輯、3D模型生成等方向的表現(xiàn),并計劃推出移動端輕量化版本。







