滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

阿里千問APP公測(cè)遇“小插曲”：9.9與9.11大小之爭(zhēng)下的AI進(jìn)階路

時(shí)間：2025-11-18 15:05:53 來源：快訊編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

一道看似簡(jiǎn)單的數(shù)學(xué)題——比較9.9和9.11的大小，竟成為檢驗(yàn)人工智能模型能力的試金石。近日，阿里巴巴最新公測(cè)的千問APP在回答這一問題時(shí)出現(xiàn)失誤，引發(fā)行業(yè)對(duì)AI技術(shù)局限性的討論。該事件不僅暴露了當(dāng)前大模型在基礎(chǔ)運(yùn)算中的潛在漏洞，更折射出AI從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用面臨的挑戰(zhàn)。

測(cè)試過程中，千問APP首次回答稱"9.11更大"，隨后在問題拆解階段又正確指出"9.9的十分位是9，9.11的十分位是1，因此9.9更大"。面對(duì)這種自相矛盾的回應(yīng)，AI模型解釋稱首次結(jié)論屬于"階段性錯(cuò)誤"，并歸因于"數(shù)字長(zhǎng)度錯(cuò)覺"——三位數(shù)的9.11在視覺上可能引發(fā)認(rèn)知偏差。經(jīng)過自我溯源后，該模型在第三次提問中給出了正確答案。

這道經(jīng)典算術(shù)題最早由艾倫研究機(jī)構(gòu)成員林禹臣發(fā)現(xiàn)。他在測(cè)試ChatGPT-4o時(shí)發(fā)現(xiàn)，該模型竟認(rèn)為13.11大于13.8。隨后Scale AI工程師萊利·古德賽德變換問法，向多個(gè)主流模型發(fā)起挑戰(zhàn)，結(jié)果包括ChatGPT-4o、谷歌Gemini Advanced等在內(nèi)的多個(gè)大模型集體"翻車"。這一現(xiàn)象在AI技術(shù)圈引發(fā)廣泛關(guān)注，相關(guān)測(cè)試截圖在社交平臺(tái)獲得數(shù)百萬(wàn)瀏覽量。

行業(yè)專家指出，大模型本質(zhì)上是基于語(yǔ)言數(shù)據(jù)訓(xùn)練的統(tǒng)計(jì)模型，其核心能力在于捕捉語(yǔ)言模式而非理解數(shù)學(xué)規(guī)則。這種技術(shù)路徑導(dǎo)致AI在處理需要嚴(yán)格邏輯推理的任務(wù)時(shí)表現(xiàn)不穩(wěn)定。某AI技術(shù)從業(yè)者表示："語(yǔ)言模型擅長(zhǎng)處理模糊的自然語(yǔ)言，但面對(duì)精確的數(shù)學(xué)運(yùn)算時(shí)，其統(tǒng)計(jì)學(xué)習(xí)機(jī)制反而成為短板。"

盡管存在基礎(chǔ)運(yùn)算缺陷，中國(guó)大模型在全球市場(chǎng)的競(jìng)爭(zhēng)力不容小覷。以阿里巴巴Qwen系列為例，該模型累計(jì)下載量已突破6億次，在技術(shù)積累和生態(tài)布局方面形成獨(dú)特優(yōu)勢(shì)。愛彼迎CEO布萊恩·切斯基公開表示，公司已將Qwen模型深度整合到運(yùn)營(yíng)體系，稱贊其"速度快、成本低"。這種實(shí)際應(yīng)用場(chǎng)景的驗(yàn)證，為中國(guó)AI模型提供了差異化競(jìng)爭(zhēng)路徑。

阿里巴巴日前宣布全面進(jìn)軍消費(fèi)級(jí)AI市場(chǎng)，計(jì)劃將千問APP與地圖、外賣、票務(wù)等20余個(gè)生活場(chǎng)景深度融合。基于開源模型Qwen3打造的"千問"項(xiàng)目，被管理層定位為"AI時(shí)代的戰(zhàn)略級(jí)入口"。通過整合海外影響力，阿里巴巴正與OpenAI等國(guó)際巨頭展開直接競(jìng)爭(zhēng)。這種"技術(shù)輸出+場(chǎng)景落地"的雙輪驅(qū)動(dòng)模式，或?qū)⒅厮苋駻I產(chǎn)業(yè)格局。

值得關(guān)注的是，千問APP的此次失誤恰逢其全球推廣關(guān)鍵期。測(cè)試結(jié)果顯示，該模型在復(fù)雜場(chǎng)景理解、多模態(tài)交互等方面表現(xiàn)突出，但在基礎(chǔ)運(yùn)算等"簡(jiǎn)單任務(wù)"上仍需優(yōu)化。這種"高階能力突出、基礎(chǔ)能力薄弱"的反差現(xiàn)象，為AI技術(shù)發(fā)展路徑提供了新的研究樣本。如何平衡模型復(fù)雜度與可靠性，將成為行業(yè)下一階段的重要課題。

11-30

真我GT8與GT8 Pro怎么選？影像性能續(xù)航全對(duì)比，幫你找到適合款

真我GT8以同級(jí)唯一潛望長(zhǎng)焦+理光GR影像系統(tǒng)成為“最強(qiáng)標(biāo)準(zhǔn)版”，7000mAh大電池+100W快充終結(jié)續(xù)航焦慮，輕薄設(shè)計(jì)兼顧質(zhì)感與手感。真我GT8 Pro則憑借2億像素長(zhǎng)焦+8K視頻拍攝和機(jī)械拼裝Deco…

11-30

中國(guó)科研實(shí)力崛起：六城閃耀全球十強(qiáng)，長(zhǎng)三角創(chuàng)新協(xié)同共譜新篇

11-30

黃仁勛談AI芯片：英偉達(dá)GPU通用性強(qiáng)，市場(chǎng)強(qiáng)勁供應(yīng)鏈迎挑戰(zhàn)

11-30

新國(guó)都擬赴港上市：2025年前9個(gè)月營(yíng)收23.43億扣非凈利降33%

11-30

中國(guó)科研力量發(fā)力太空計(jì)算，硬核企業(yè)“天算計(jì)劃”開啟太空超算新篇

中國(guó)科學(xué)院計(jì)算技術(shù)研究所是算力研究的國(guó)家隊(duì)，很早就開展了天基算力底座的研究工作，率先研制出極光POPS級(jí)星載智能計(jì)算載荷和天基大模型、智能體，并已開展了應(yīng)用工作。他們自2019年起深耕太空智能計(jì)算，先后…

11-30

ChatGPT安卓測(cè)試版現(xiàn)廣告相關(guān)字段未來或打破無(wú)廣告使用體驗(yàn)

IT之家 11 月 29 日消息，據(jù)外媒 Bleeping Computer 今日?qǐng)?bào)道，OpenAI 已開始在內(nèi)部測(cè)試為 ChatGPT加入“廣告”功能，若未來正式上路，可能會(huì)徹底改寫當(dāng)今的網(wǎng)絡(luò)商業(yè)模式。 …

11-30

智啟未來生活總臺(tái)“保姆機(jī)器人大會(huì)”深圳展演社區(qū)管家機(jī)器人新成果

深圳社區(qū)管家機(jī)器人展演活動(dòng)作為總臺(tái)“保姆機(jī)器人大會(huì)”分賽道的重要一站，以“科技賦能城市治理，智能創(chuàng)造美好生活”為核心，集中呈現(xiàn)社區(qū)管家機(jī)器人在環(huán)衛(wèi)保潔、社區(qū)安防、公共服務(wù)等多個(gè)城市治理領(lǐng)域的創(chuàng)新成果與突破應(yīng)…

11-30

華為賦能湖南：算力筑基，AI賦能，共繪數(shù)智化發(fā)展新畫卷

而在湖南，算力產(chǎn)業(yè)已轉(zhuǎn)化為實(shí)實(shí)在在的應(yīng)用價(jià)值，如湖南氣象局依托華為的算力實(shí)現(xiàn)了天氣預(yù)報(bào)從傳統(tǒng)經(jīng)驗(yàn)?zāi)Ｊ较蛑悄芑途?xì)化的轉(zhuǎn)變，極大提升了極端天氣的預(yù)報(bào)準(zhǔn)確性，成為了計(jì)算能力為行業(yè)賦能轉(zhuǎn)型的實(shí)踐案例。2023 …

11-30

李斌盈利的底氣：樂道越賣越多，「蔚來」越賣越少？

11-30

黃仁勛親自「帶貨」，英偉達(dá)預(yù)告本周五將推機(jī)器人新品

11-30

快被信息淹沒時(shí)，和靈光的對(duì)話幫了我

11-30

格力電器分紅55億，董明珠直言「挑戰(zhàn)很大」

11-30

新研究：削弱AI大模型“撒謊能力” 竟意外觸發(fā)其“有意識(shí)”聲明現(xiàn)象

11-30

第三屆全國(guó)工業(yè)和信息化技術(shù)技能大賽：人機(jī)協(xié)作繪就產(chǎn)才融合新畫卷

11-30

點(diǎn)擊查看更多 +

全站最新

從賽道到街道：一汽奧迪Q6L e-tron以賽道技術(shù)賦能豪華純電新體驗(yàn)

比亞迪自產(chǎn)空氣懸掛新規(guī)劃曝光，自研自產(chǎn)或讓中高端車型更具競(jìng)爭(zhēng)力

2025官方油耗公式+省油技巧大公開！算清油耗，輕松告別“油老虎”

電動(dòng)自行車新國(guó)標(biāo)12月1日實(shí)施！新規(guī)亮點(diǎn)、選購(gòu)指南、舊車處理一文全懂

關(guān)海濤告別車圈回歸榮耀：對(duì)極氪深情難舍，曾助力品牌多領(lǐng)域建設(shè)

一汽豐田2025年末推新卡羅拉外觀運(yùn)動(dòng) 雙動(dòng)力版本值得期待

熱門內(nèi)容

本欄最新

銀河航天徐鳴：太空基建加速跑 6G通信與新場(chǎng)景引領(lǐng)產(chǎn)業(yè)新變革

上汽大眾ID. ERA冬測(cè)邀您共赴，旗艦實(shí)力共鑒，開啟出行新紀(jì)元

廣州車展上汽大眾ID. ERA登場(chǎng)，以務(wù)實(shí)之姿開啟新能源新征程

別克至境世家實(shí)車到店！中大型MPV配激光雷達(dá)，12月上市定價(jià)引猜測(cè)

37.99萬(wàn)元起售！嵐圖泰山上市，以頂尖技術(shù)重塑高端新能源SUV格局

廣州車展首發(fā)！榮威M7 DMH攜“活人感”車機(jī)，開啟智能出行新體驗(yàn)

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

阿里千問APP公測(cè)遇“小插曲”：9.9與9.11大小之爭(zhēng)下的AI進(jìn)階路

日本精品一区二区三区高清久久