作者 | 小小
參數依舊華麗,但體驗真的能打嗎?
在谷歌Nano Banana的步步緊逼下,高傲的OpenAI最終不得不選擇了“自降身價”。新版GPT-Image-1.5的上線,雖然打出了4倍生成極速和“像素級”控制的王炸,更直接祭出了API端降價20%的肉搏戰術,但這一切難掩其防御姿態的倉促。
輿論場瞬間撕裂。務實派大贊其“畫質出色、控制精準,適用于實際生產”,認為這是工作流的福音;但權威專家卻冷冷地潑下一盆冷水:“在處理復雜視覺內容時,其表現可能仍不及競品Nano Banana Pro。”
也有評論員尖銳地指出:當OpenAI試圖用“軍備競賽”的方式回應競爭,它是否已經忘記了當初那個誓言要造出AGI的初心?當科技巨頭們不再講故事,而是專注于“堆料”和“降價”時,這究竟是技術的進步,還是創新精神的淪陷?
帶著這些疑問,讓我們剝開GPT-Image-1.5華麗的速度外衣,它到底強在哪里?又有哪些“隱形短板”仍舊困擾著這位視覺霸主?
1. 硬核評測:速度狂飆4倍,從“佛系等待”到“實時反饋”
ChatGPT Images這次的產品策略非常清晰:用極致的速度和精準的控制力,直擊專業級用戶對效率與可控性的痛點。
——“極速”能力的質變:創作工作流的福音
如果你是重度創作者或營銷人員,那么GPT-Image-1.5在速度上的進化,無疑將成為你眼中的絕對主角。
官方數據顯示,新模型的生成速度最高直接飆升至原先的4倍!有網友評論稱,這是“自從Nano Banana發布以來,AI圖像生成領域在模型排名上最大的飛躍!”
在追求實時交互和高效迭代的今天,這種速度的革命性意義在于:
· 并行創作:用戶可以在已有圖像生成的同時,繼續發起新的創作請求,徹底消除“等待時間”。
· 降低試錯成本:以前需要數分鐘的嘗試,現在可以在幾十秒內完成多輪迭代,極大地提高了“試錯效率”。
這種速度的提升,使得圖像生成從“被動等待”轉向了近乎 “實時反饋”,為工作流的整合奠定了堅實的基礎。
——獨立創作空間:用戶體驗的顛覆性重構
為了配合這種高速迭代的需求,OpenAI推出了獨立的Images創作空間,不再讓圖像功能僅僅是聊天窗口中的“附屬功能”。
這個專屬的“創意工作室”內置了多種預設濾鏡、持續更新的流行提示詞趨勢以及創意模板。用戶還可以一次性上傳個人形象(肖像),用于后續重復創作,從而降低了重復描述的成本。正如OpenAI應用負責人菲吉·西莫所說,新界面旨在讓圖像生成過程充滿樂趣,使創意探索變得毫不費力。
——“精確編輯”的強悍實力:告別整體漂移
在具體的編輯應用場景中,GPT-Image-1.5也有質的飛躍:
· 一致性保持(核心):它能更準確地區分圖像中 “需要改變的部分” 與 “應當保持不變的部分”,并在內部推理中“釘死”關鍵的視覺錨點。例如,你可以給人物換服裝、換發型,而人物的五官、面部特征和光照條件依然紋絲不動,大大提升了“試穿試戴”和“角色一致性”的實用價值。
· 指令遵循與文本渲染:模型在理解多約束、復雜組合要求時的穩定性有所提升。同時,它在文字渲染方面實現了進一步增強,能夠更清晰地呈現密集文本與小字號內容,被視為圖像模型“邁向實用化”的必要補課。
世界頂尖免疫學家德里亞·烏努特馬茲(Derya Unutmaz)用“驚艷”來形容使用體驗,特別稱贊了ChatGPT Images在指令執行的精準度和圖像編輯的細致程度上的出色表現。
2. 深度挖掘:光鮮背后的“隱形短板”與行業焦慮
但我們不能只看官方秀出的肌肉。在GPT-Image-1.5耀眼的參數之下,也有一些值得警惕的短板和行業焦慮。
——技術“護城河”的消失與GPT-Image-1.5的定位
這是奧特曼“紅色警報”的核心原因之一。雖然OpenAI宣稱GPT-Image-1.5在一致性方面有所突破,但行業現狀是:差距已經微乎其微。
谷歌Nano Banana Pro在精確編輯、背景移除等方面一直領先。Runway在視頻生成領域甚至反超了Sora。
有網友評論稱,將版本號定為1.5而非2.0,本身就暗示了OpenAI的謹慎態度:這是一次重要迭代而非代際革命
曾經,OpenAI領先對手一年甚至兩年;現在,這個領先優勢被壓縮到了幾周甚至幾天。圖像生成的底層范式已經成為行業共識,OpenAI不再擁有獨門秘籍。
——復雜構圖與結構化設計的挑戰
盡管模型在保持核心要素一致性上表現出色,但在面對復雜和結構化任務時,挑戰依然存在。
沃頓商學院教授伊桑·莫利克(Ethan Mollick)認為,在處理復雜視覺內容(如多圖幻燈片、信息圖表等結構化設計)時,ChatGPT Images的表現可能仍不及競品Nano Banana Pro。
前OpenAI研究員邁爾斯·布倫迪奇(Miles Brundage)則吐槽道,當提示詞過長或過于復雜時,ChatGPT Images可能無法完全理解并協調所有細節,導致輸出結果看起來隨機或不準確。
這說明,模型在“抽象理解”和“多元素邏輯協調”上,仍未達到完美狀態。
——降本增效:商業突圍的布局
這次升級也是一場精明的商業突圍。
GPT-Image-1.5已通過API形式正式開放,其最大的亮點在于:圖像輸入與輸出的整體成本降低了約20%! API定價為每百萬輸入Token 8美元、每百萬輸出Token 32美元。
這對于預算有限的初創公司和電商企業來說,無疑是極大的利好。Wix、Canva等頭部企業已開始集成該模型。
正如Wix AI研究與數據科學負責人希拉·加特(Hila Gat) 所言,GPT Image 1.5畫質出色、控制精準,能準確執行編輯指令,支持端到端迭代,適用于實際生產。







