在人工智能領(lǐng)域競(jìng)爭(zhēng)日益激烈的當(dāng)下,當(dāng)眾多企業(yè)仍在聚焦大模型參數(shù)規(guī)模的比拼時(shí),360公司另辟蹊徑,在AI視覺識(shí)別能力上實(shí)現(xiàn)了重大突破。其最新推出的FG-CLIP2視覺語(yǔ)言模型,憑借對(duì)圖像細(xì)節(jié)的精準(zhǔn)捕捉與深度理解,在全球同類模型中脫穎而出,多項(xiàng)測(cè)試成績(jī)超越谷歌、meta等國(guó)際科技巨頭的同類產(chǎn)品,成為當(dāng)前全球性能最強(qiáng)的視覺語(yǔ)言模型。
FG-CLIP2模型的核心優(yōu)勢(shì)在于攻克了“細(xì)粒度識(shí)別”這一技術(shù)難題。該模型能夠精準(zhǔn)識(shí)別圖像中的微小差異和復(fù)雜細(xì)節(jié),例如區(qū)分不同品牌、型號(hào)的電子產(chǎn)品,或識(shí)別人物面部表情、服飾配飾等細(xì)微特征。這一突破為具身智能和商業(yè)智能化應(yīng)用開辟了新的可能性。以家庭服務(wù)機(jī)器人為例,搭載FG-CLIP2的機(jī)器人可以準(zhǔn)確理解“拿起茶幾上屏幕有裂痕的手機(jī)”這類復(fù)雜指令;在安防領(lǐng)域,系統(tǒng)能夠通過(guò)“尋找戴黑色鴨舌帽的可疑人員”的描述快速鎖定目標(biāo),大幅提升實(shí)際應(yīng)用效率。
這一成果的取得,源于360公司在AI領(lǐng)域的長(zhǎng)期積累。作為國(guó)內(nèi)較早布局人工智能的企業(yè),360依托搜索、瀏覽器等核心業(yè)務(wù),積累了超過(guò)百億級(jí)的圖文數(shù)據(jù)資源。同時(shí),公司自主研發(fā)了大規(guī)模高質(zhì)量數(shù)據(jù)集FineHARD,為模型訓(xùn)練提供了豐富的素材支持。通過(guò)持續(xù)深耕AI底層技術(shù),360不僅推動(dòng)了自身技術(shù)能力的提升,更為中國(guó)構(gòu)建自主可控的AI技術(shù)體系作出了重要貢獻(xiàn)。
在中文benchmark綜合排名中,F(xiàn)G-CLIP2模型的表現(xiàn)尤為突出。其超越國(guó)際競(jìng)爭(zhēng)對(duì)手的成績(jī),標(biāo)志著中國(guó)企業(yè)在視覺語(yǔ)言模型領(lǐng)域已達(dá)到世界領(lǐng)先水平。這一突破不僅提升了中國(guó)AI技術(shù)的國(guó)際影響力,也為相關(guān)行業(yè)的智能化轉(zhuǎn)型提供了強(qiáng)有力的技術(shù)支撐。











