語(yǔ)言,被古希臘哲學(xué)家亞里士多德視為人類(lèi)區(qū)別于其他生物的核心特征。他提出,人類(lèi)是“擁有語(yǔ)言的動(dòng)物”。如今,隨著人工智能技術(shù)的飛速發(fā)展,大語(yǔ)言模型(LLM)在模擬人類(lèi)語(yǔ)言能力方面取得了顯著進(jìn)展。然而,一個(gè)關(guān)鍵問(wèn)題依然存在:在語(yǔ)言的深層結(jié)構(gòu)中,是否存在某些人類(lèi)獨(dú)有的特質(zhì),是AI或其他生物無(wú)法復(fù)制的?
近期,加州大學(xué)伯克利分校與羅格斯大學(xué)的聯(lián)合研究對(duì)多個(gè)大語(yǔ)言模型進(jìn)行了一系列語(yǔ)言學(xué)測(cè)試,試圖解答這一問(wèn)題。測(cè)試內(nèi)容包括要求模型歸納虛構(gòu)語(yǔ)言的規(guī)則、解析多重歧義以及處理復(fù)雜的遞歸結(jié)構(gòu)。結(jié)果顯示,大多數(shù)模型未能像人類(lèi)一樣完成這些任務(wù),但OpenAI的o1模型卻展現(xiàn)出驚人的能力,其表現(xiàn)接近語(yǔ)言學(xué)研究生的水平。
研究負(fù)責(zé)人Ga?per Begu?指出,o1不僅能劃分句子成分、解析歧義,還能運(yùn)用遞歸等復(fù)雜語(yǔ)言學(xué)特征。這一發(fā)現(xiàn)挑戰(zhàn)了人們對(duì)人工智能能力的傳統(tǒng)認(rèn)知。例如,在處理“中心嵌入”結(jié)構(gòu)時(shí),o1能夠像人類(lèi)一樣理解并構(gòu)建多層遞歸的句子。
以句子“The worldview that the prose Nietzsche wrote expressed was unprecedented”為例,其結(jié)構(gòu)包含三層遞歸:最外層是“這個(gè)世界觀前所未有”,中間層是“那篇散文所表達(dá)的”,最內(nèi)層是“尼采寫(xiě)的”。o1不僅能正確解析這種結(jié)構(gòu),還能在要求下進(jìn)一步增加遞歸層次,生成更復(fù)雜的句子。
這種能力表明,o1不僅具備語(yǔ)言使用能力,還擁有“元語(yǔ)言能力”,即思考語(yǔ)言本身的能力。這與傳統(tǒng)觀點(diǎn)形成鮮明對(duì)比——許多語(yǔ)言學(xué)家認(rèn)為,大語(yǔ)言模型只是通過(guò)預(yù)測(cè)下一個(gè)單詞來(lái)生成文本,并未真正理解語(yǔ)言的深層結(jié)構(gòu)。
研究還發(fā)現(xiàn),o1在處理歧義和音韻學(xué)任務(wù)時(shí)表現(xiàn)優(yōu)異。例如,在解析句子“Eliza wanted her cast out”時(shí),o1能準(zhǔn)確區(qū)分“cast”作為動(dòng)詞(驅(qū)逐)和名詞(石膏)的兩種含義。面對(duì)30種新創(chuàng)建的迷你語(yǔ)言,o1能在無(wú)先驗(yàn)知識(shí)的情況下正確推斷語(yǔ)音規(guī)則。
這些結(jié)果引發(fā)了關(guān)于AI語(yǔ)言理解能力的深入討論。2023年,語(yǔ)言學(xué)家喬姆斯基曾在《紐約時(shí)報(bào)》撰文指出,語(yǔ)言的復(fù)雜性無(wú)法僅通過(guò)大數(shù)據(jù)浸泡來(lái)掌握。然而,o1的表現(xiàn)似乎對(duì)這一觀點(diǎn)提出了挑戰(zhàn)。
那么,為何只有o1能展現(xiàn)出如此強(qiáng)大的能力?研究認(rèn)為,o1的優(yōu)勢(shì)可能源于其“思維鏈”機(jī)制,使其能像人類(lèi)語(yǔ)言學(xué)家一樣逐步推理、驗(yàn)證假設(shè)并構(gòu)建抽象規(guī)則。相比之下,其他模型在這一方面表現(xiàn)較弱。
另一個(gè)值得探討的問(wèn)題是:隨著模型規(guī)模的擴(kuò)大,AI是否會(huì)超越人類(lèi)的語(yǔ)言理解能力?目前尚無(wú)定論。一方面,AI尚未提出原創(chuàng)性語(yǔ)言學(xué)觀點(diǎn)或教授新知識(shí);另一方面,增加計(jì)算能力和訓(xùn)練數(shù)據(jù)可能使其在語(yǔ)言技能上超越人類(lèi)。
盡管研究尚不足以宣稱(chēng)“機(jī)器理解語(yǔ)言勝于人類(lèi)”,但它為評(píng)估語(yǔ)言模型提供了新的視角:從關(guān)注“任務(wù)產(chǎn)出”轉(zhuǎn)向關(guān)注“結(jié)構(gòu)解釋”。當(dāng)可解釋性成為首要指標(biāo)時(shí),AI研究、教育與應(yīng)用治理或?qū)⒂瓉?lái)統(tǒng)一的標(biāo)準(zhǔn)。

















