拖AGI后腿的,竟是人類打字手速太慢?
沒錯,這是OpenAI的Codex負責(zé)人Alexander Embiricos的觀點。
他在近日《Lenny's Podcast》播客中表示,人類的打字速度正在拖慢通往AGI的進展。
Lenny(左)與Alexander Embiricos(右)在播客中
當(dāng)Lenny問到通往AGI的時間表時,Embiricos談到了他目前看到的一個限制因素:人類的打字速度或者是多任務(wù)處理能力。
除了Embiricos之外,奧特曼、Amodei、馬斯克等許多大佬也曾多次提到這個問題。
他們普遍將這一問題描述為人機協(xié)作過程中的「溝通」「摩擦」問題。
比如,奧特曼曾多次表示AI進步不會只靠繼續(xù)做大模型。
近期他在介紹AgentKit時,提到開發(fā)這套工具是為了讓開發(fā)者能更低摩擦、更高效地構(gòu)建智能Agent系統(tǒng),而不是在分散工具和復(fù)雜流程之間低效拼接。
同樣,Anthropic CEO Dario Amodei也在今年4月份提到,AI可能在3到6個月編寫90%的代碼,12個月內(nèi)「基本上編寫所有代碼」。
但他同時補充指出程序員仍需明確實現(xiàn)的功能、應(yīng)用設(shè)計思路及決策,因此在短期內(nèi)人類開發(fā)者的參與仍是關(guān)鍵。
這說明即便是AI基本上可以完成所有代碼的編寫,仍然需要開發(fā)人員的介入,因此人機協(xié)作的效率就顯得十分重要。
更早的時候,馬斯克就預(yù)見到這一問題。
他在談到Neuralink項目時曾提到開發(fā)腦機接口,目的之一就是為了繞過人類打字速度的限制。
他認為人類傳輸數(shù)據(jù)的速度遠遠慢于計算機:
「人類對計算機說話,在計算機聽來會像是非常緩慢的、帶有音調(diào)的喘息聲,有點像鯨魚的聲音」。
這些大佬的觀點,都呼應(yīng)了Embiricos的觀察,揭示出諸如文字輸入等人類自身的能力瓶頸,正在成為通往AGI的隱形障礙。
這類似于早期計算機時代,程序員必須手動輸入每一行代碼,開啟了人機交互和自動化的進程。
而隨著AI的飛速發(fā)展,如今人類的輸入速度已經(jīng)跟不上AI的思考,成了其發(fā)展的瓶頸。
就像一位網(wǎng)友說的,如果打字速度是瓶頸,我們就是系統(tǒng)中速度最慢的環(huán)節(jié)了。
AGI之路的隱形障礙
人類打字速度耽誤AGI,Embiricos這一觀點并非空穴來風(fēng),而是基于他對AI代理系統(tǒng)實際應(yīng)用的深刻觀察。
他認為當(dāng)前AI模型雖然在處理復(fù)雜任務(wù)時表現(xiàn)出色,但它們?nèi)愿叨纫蕾嚾祟愅ㄟ^文本輸入來指導(dǎo)和驗證.
而人類的打字速度以及處理多任務(wù)能力,已經(jīng)無法跟上AI的處理能力。
其中核心難點在于提示詞工程,它要求人類精確表述意圖。
但是人類的多任務(wù)處理涉及工作記憶的切換,每次切換都需要時間和精力,這導(dǎo)致提示詞工程效率的低下。
在Codex使用過程中,開發(fā)者需同時監(jiān)控AI輸出、調(diào)整提示,Embiricos將之類比為駕駛員手動控制自動駕駛汽車。
在這個過程中,人類需要多任務(wù)處理,同時思考問題、撰寫提示、審查輸出,其中的任務(wù)量遠遠超單純打字的速度問題(打字輸入只是人類思考意圖的實現(xiàn),是最后一個環(huán)節(jié)),由此也形成了制約AI生產(chǎn)力突破的瓶頸。
以安卓版Sora應(yīng)用的開發(fā)為例。
據(jù)OpenAI官方透露,該應(yīng)用僅動用了4人小隊,28天就完成了上線。
其中約85%的代碼由GPT-5.1+Codex自動生成,實現(xiàn)了99.9%的版本穩(wěn)定率。
雖然將傳統(tǒng)幾個月的工時被壓縮到28天,但這個過程中也暴露出AI編程的軟肋。
Codex就像一名記憶為零的新手高級工程師。
每一次對話,都必須通過提示詞清晰地告訴它要怎么做,才能生成高質(zhì)量的代碼。
整個過程中監(jiān)督、審查、邏輯確認、調(diào)試等需要依賴人工介入的工作,就成了工程中最慢、也是最關(guān)鍵的部分。
這一切都需要人工思考并輸入提示詞。
于是,打字速度突然成了真正的生產(chǎn)力障礙。
前不久,OpenAI前首席科學(xué)家Ilya Sutskever提到的模型在評測時技能爆表,一到實際場景就掉鏈的「性能悖論」,也在間接上證明了Embiricos的判斷:
他在談到為什么目前依賴Scaling(堆算力和數(shù)據(jù))越來越難推動AI進展時,提到了一個關(guān)于模型在修Bug時陷入無限循環(huán)的例子:
你讓AI修一個Bug,它修好了,但引入了一個新的Bug;
你指出這個新Bug,它去修卻又把第一個Bug帶回來了;
模型就這樣在兩個Bug之間來回折返,像在無限循環(huán)(ping-pong)。
這個例子暴露出當(dāng)前大模型的訓(xùn)練方法更多是在優(yōu)化評測指標,而不是生成真正類似人類的理解與泛化能力。
即使最先進的AI模型,在實際應(yīng)用場景中人機交互仍然是不可或缺的,這也使得人類能力,在某種程度上成了AI的生產(chǎn)力瓶頸。
就像網(wǎng)友Jeff Lurie所言,Embiricos提出了「人類打字速度瓶頸問題」,重新定了的生產(chǎn)力的限制。
這迫使我們在通過AGI的道路上,除了考慮打造更強的模型之外,還要考慮人類能力瓶頸(輸入速度)這一隱形障礙,也推動我們重新審視人機關(guān)系。
比如,有網(wǎng)友提出,在AI編碼場景中,如果把審查、判斷、設(shè)計(通常需要人類完成)前置,然后再讓AI編碼,就可以成倍提高開發(fā)速度。
AGI的實現(xiàn),需要進一步解放人類
AGI的實現(xiàn),是為了解放人類,但這里的一個悖論是:
在AGI到來之前,需要先把人類從審查AI的工作中解放出來。
Embiricos表示,想要突破「人類打字速度瓶頸問題」,必須讓AI智能體能夠自己審查工作、而不再依賴人類:
「你可以讓一個智能體盯著你正在做的所有事情,但如果這個智能體不能同時驗證它自己的工作,那你依然會被卡住。」
所以,問題最終又回到了人類自身:
你是否真的有精力去審查那么多代碼?
在Embiricos看來,解決之道就在于讓AI能夠自動審查自己的工作,將人類從編寫提示詞和驗證AI輸出的工作中解放出來,這樣就不會受制于人類的速度。
「如果我們能夠重新構(gòu)建系統(tǒng),讓智能體在默認狀態(tài)下就足夠有用,我們就會開始解鎖那種『曲棍球桿式』的增長」。
當(dāng)AI的自動化能力足夠強大,就可能實現(xiàn)Embiricos所說的那種「曲棍球桿式增長」:前期幾乎平坦,隨后突然陡然上升,形狀看起來就像一根曲棍球桿。
Embiricos認為,要實現(xiàn)完全自動化的工作流程并不存在一條放之四海而皆準的簡單路徑,每一種使用場景都需要單獨設(shè)計。
但他預(yù)計,朝著這種爆發(fā)式增長邁進的進展很快就會出現(xiàn)。
「從明年開始,我們會看到一批早期采用者的生產(chǎn)力率先出現(xiàn)曲棍球桿式提升;而在接下來的幾年里,會有越來越多的大公司也實現(xiàn)類似的生產(chǎn)力飛躍」。
Embiricos表示,到了2026年,隨著最早一批采用者率先實現(xiàn)曲棍球桿式的效率提升,以及未來幾年越來越多的大公司也實現(xiàn)類似的生產(chǎn)力飛躍,我們也將迎來AGI。
「這種曲棍球桿式的增長最終會反哺到AI實驗室,而到時我們基本上就已經(jīng)站在 AGI的門檻上了」。
沿著Embiricos的思路,可以得出這樣的結(jié)論:
通往AGI的一個真正突破點,在于打破人機協(xié)作的制約,讓AI智能體能夠自主工作,而不再依賴人類的時候。
就像谷歌DeepMind創(chuàng)始人哈薩比斯(Demis Hassabis)所言,在更具自主性和代理能力的系統(tǒng)到來之前,仍需要人機協(xié)作作為過渡形態(tài)。
他認為AI需要磨練自身的推理能力、自主性與創(chuàng)造力,在這方面目前仍有一些缺失。
「機器要掌握人類所能做的一切,可能還需要五到十年時間」,這也是他對AGI時間表的判斷。







