OpenAI于近日正式推出全新圖像生成模型GPT Image 1.5,并同步在ChatGPT平臺上線獨(dú)立“Images”功能模塊。這款被定義為“旗艦級”的模型不僅在圖像質(zhì)量上實(shí)現(xiàn)突破,更在指令理解能力方面展現(xiàn)出顯著優(yōu)勢。用戶現(xiàn)在可通過網(wǎng)頁端chatgpt.com或移動應(yīng)用側(cè)邊欄直接訪問該功能,全球所有ChatGPT用戶及API開發(fā)者均可使用。
新模型最核心的升級在于精準(zhǔn)的指令執(zhí)行能力。無論是從零創(chuàng)作圖像,還是基于現(xiàn)有照片進(jìn)行編輯修改,GPT Image 1.5都能在保持原始圖像關(guān)鍵特征的基礎(chǔ)上,準(zhǔn)確完成用戶提出的各項(xiàng)要求。特別是在光線處理、構(gòu)圖布局和人物特征保留等細(xì)節(jié)方面,有效解決了傳統(tǒng)AI圖像生成常見的“面目全非”問題。OpenAI展示的案例顯示,該模型甚至能實(shí)現(xiàn)逼真的虛擬試衣效果,并支持高度原創(chuàng)性的概念轉(zhuǎn)換。
針對長期困擾AI繪圖領(lǐng)域的文本渲染難題,新版本取得突破性進(jìn)展。模型現(xiàn)在能夠自然地將文字元素融入圖像場景,生成包含清晰可讀文本的復(fù)合圖像。配合全面升級的編輯工具集,用戶現(xiàn)在可以精確添加、刪除或移動圖像中的任意元素,實(shí)現(xiàn)專業(yè)級的圖像處理操作。OpenAI形象地將這種能力比喻為“隨身攜帶的迷你修圖工作室”。
在交互設(shè)計方面,獨(dú)立“Images”標(biāo)簽頁內(nèi)置了多種預(yù)設(shè)濾鏡和創(chuàng)作提示詞庫。這種“開箱即用”的設(shè)計顯著降低了使用門檻,即使非專業(yè)用戶也能快速生成高質(zhì)量圖像。功能上線初期,有用戶發(fā)現(xiàn)生成的月歷存在時間錯誤,后通過其他工具進(jìn)行了修正,這一插曲從側(cè)面反映出用戶對新生功能的高度關(guān)注。
項(xiàng)目研發(fā)團(tuán)隊(duì)陣容堪稱豪華,由Gabriel Goh擔(dān)任技術(shù)負(fù)責(zé)人,Adele Li統(tǒng)籌產(chǎn)品落地。值得關(guān)注的是,Sora視頻生成模型負(fù)責(zé)人Bill Peebles與DALL-E系列締造者Aditya Ramesh共同參與項(xiàng)目指導(dǎo),這暗示新功能可能融合了視頻生成領(lǐng)域的先進(jìn)技術(shù)。首席研究官M(fèi)ark Chen領(lǐng)銜的跨學(xué)科團(tuán)隊(duì)涵蓋核心推理、多模態(tài)處理等關(guān)鍵技術(shù)領(lǐng)域,確保模型在復(fù)雜場景下的穩(wěn)定運(yùn)行。
為應(yīng)對AI生成內(nèi)容帶來的倫理挑戰(zhàn),OpenAI組建了由二十余位專家構(gòu)成的安全合規(guī)團(tuán)隊(duì)。該部門專門負(fù)責(zé)制定內(nèi)容過濾機(jī)制、預(yù)防惡意使用,并確保所有生成內(nèi)容符合法律法規(guī)要求。這種將技術(shù)創(chuàng)新與風(fēng)險管控同步推進(jìn)的策略,展現(xiàn)出企業(yè)級AI應(yīng)用開發(fā)的成熟思路。從技術(shù)研發(fā)到市場推廣的全鏈條團(tuán)隊(duì)配置,凸顯OpenAI將前沿成果轉(zhuǎn)化為消費(fèi)級產(chǎn)品的系統(tǒng)化能力。











