滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

阿里千問APP公測對標ChatGPT 卻在9.9與9.11大小上“栽跟頭”后糾錯

時間：2025-11-17 19:23:59 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

一場關于小數比較的簡單數學題，意外成為檢驗人工智能大模型能力的試金石。當被問及“9.9和9.11哪個更大”時，多個知名AI模型接連出現判斷失誤，引發行業對技術局限性的深入討論。這場測試最初由艾倫研究機構成員林禹臣在社交平臺曝光，他發現ChatGPT-4o將13.11判定為大于13.8，隨后Scale AI工程師通過變換問法，對多個主流模型展開測試，結果顯示多數模型均未能正確回答“9.9與9.11的大小關系”。

第一財經近期針對阿里巴巴最新公測的千問APP展開測試，發現該模型在首次回答中同樣出現錯誤。面對“數字9.9和9.11誰大”的提問，千問APP初始回答稱“9.11更大”，但在后續問題拆解中，模型承認存在思維陷阱，并經過分析修正為“9.9大于9.11”。當被追問前后答案矛盾時，千問解釋稱首次回答存在“階段性錯誤”，結論與推理過程不匹配，同時承認“9.11”的三位數形式可能引發數字長度錯覺，導致認知偏差。經過自我溯源與糾錯，千問在第三次提問中給出了正確答案。

這一現象折射出大模型在基礎能力上的潛在短板。有技術從業者指出，當前主流模型本質仍是語言模型，其訓練方式依賴語言數據的統計相關性，而非嚴格的規則學習。這種特性使模型在處理需要歸納推理的常識性問題時表現不穩定，即便能解決復雜數學競賽題，仍可能在簡單邏輯判斷上“翻車”。例如，谷歌Gemini Advanced和Claude 3.5 Sonnet等頭部模型，此前也曾在此類測試中集體失誤。

盡管存在局限性，中國大模型在全球市場的競爭力正逐步顯現。以阿里巴巴Qwen系列為例，其全球下載量已突破6億次，并在技術生態與商業應用層面取得突破。愛彼迎CEO布萊恩·切斯基公開表示，公司已廣泛采用Qwen模型，因其“速度快、成本低”，而OpenAI的最新模型在實際生產中因經濟性不足未被大規模使用。這種技術優勢正推動中國模型加速出海，與國際巨頭展開直接競爭。

阿里巴巴近日宣布全面推進“千問”項目，正式進軍消費級AI市場。基于開源模型Qwen3，千問APP計劃整合地圖、外賣、訂票、辦公、學習等生活場景，構建一站式智能服務平臺。公司管理層將此視為“AI時代的關鍵戰役”，試圖借助Qwen的海外影響力，在通用人工智能領域開辟新賽道。這一布局不僅體現技術自信，更標志著中國AI企業正從應用創新向底層技術競爭升級。

更多>同類資訊

AI產業蓬勃發展背后：人才緊缺指數高，算法與產品人才成“香餑餑”

12-07

中國電信發力AI生態：以終端矩陣推動多行業智能化升級

除了智能手機和有代表性的終端之外，其實人工智能涉及是眾多的行業，需要有各種各樣的產品，這些產品在不斷的探索過程中，把人工智能能力和產品能力融合，形成一個產品矩陣，通過這樣的智能終端矩陣，構建人工智能的全場景…

12-07

大普微發布第二代QLC企業級固態硬盤嶸神R6060，最大容量245TB助力AI數據存儲

12-07

潮州三環擬赴港交所上市：前9個月營收64億利潤19.58億股權結構明晰

12-07

別克至境世家上市：以“陸地灣流”之姿，開啟高端家庭出行新境界

12-07

別克至境世家震撼登場！43.99萬起開啟新能源旗艦MPV新體驗

12-07

別克至境世家重磅登場！43.99萬起售，打造新能源MPV“陸地灣流”新體驗

12-07

別克至境世家：以健康舒適破局，插混四驅魔毯底盤重塑高端MPV新體驗

12-07

李開復：AI Agent時代來臨，企業如何以三招構筑核心競爭力？

12-07

中國電信生態賦能：多領域終端融合，筑牢人工智能發展堅實底座

針對用戶實際使用場景，在麥芒40原生撥號盤上深度定制AI摘要、智能反詐、AI代接、智能字幕、智能翻譯五大AI通話功能，并將相關入口嵌入通話九宮格中，這就讓智能化的功能和傳統的通信完全無縫整合起來。酷諾N9…

12-07

AI賦能大灣區科技企業：從軟件決策到硬件革新，重塑業務新生態

12-07

這個雙休日，1800余名青少年齊聚徐匯，在機器人賽場碰撞智慧火花

12-07

AMD紀朝暉：2025 AI智能體元年啟幕邊緣算力引領生產力變革新潮

12-07

英偉達周末“雙響炮”：CUDA迎二十載最大革新，AGI賽場強勢奪冠

12-07

對話陳佳玉：從核聚變到家用機器人，探索通用智能的攀登之路

12-07

點擊查看更多 +

全站最新

從續航到場景：第三代藍電E5 PLUS如何解鎖混動SUV新價值密碼

不追熱點追傳統！這3位用熱愛讓文化瑰寶“活”成年輕人心中的頂流

全新日產奇駿插混版來襲，248馬力+7座，能否成家庭出行優選？

2026款雷克薩斯GX：349馬力全時四驅，47.5萬是性價比之選還是虛高定價？

嵐圖泰山8申報信息曝光插混SUV登場尺寸動力配置亮點多

樂道L60黑騎士特別版限量登場，全黑外觀內飾升級共享蔚來換電網絡

熱門內容

本欄最新

別克至境世家上市：以“陸地灣流”之姿，開啟高端家庭出行新境界

別克至境世家震撼登場！43.99萬起開啟新能源旗艦MPV新體驗

別克至境世家重磅登場！43.99萬起售，打造新能源MPV“陸地灣流”新體驗

別克至境世家：以健康舒適破局，插混四驅魔毯底盤重塑高端MPV新體驗

12月首周新車來襲！東風日產N6、福特新蒙迪歐等登場，年底購車別錯過

別克至境世家正式登場！43.99萬起售，豪華科技雙加持重塑MPV新標桿

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

阿里千問APP公測對標ChatGPT 卻在9.9與9.11大小上“栽跟頭”后糾錯

日本精品一区二区三区高清久久