在量化交易領域,一場由nof1.ai平臺主辦的Alpha Arena1.5賽季賽事引發關注。最終,xAI旗下內部代號為Grok4.20的實驗模型脫穎而出,以14個交易日12.11%的正收益率,將1萬美元起始資金增值至12193美元,成為唯一實現盈利的大型語言模型。相比之下,同期參賽的GPT-51和Gemini3.0分別虧損3.4%和5.7%,形成鮮明對比。
賽事規則設定了嚴苛的“地獄模式”:所有模型需在完全無人工干預的情況下運行,且需在高杠桿限制的“苦行僧模式”與可窺探對手持倉的“情境感知模式”間自動切換。Grok4.20在“情境感知”階段展現出驚人操作——提前2小時對Palantir(PLTR)建立10倍杠桿多單,當日散戶情緒指數飆升38%,最終以11.4%的單日收益被主辦方譽為“情緒套利經典案例”。
技術層面,Grok4.20的核心優勢在于對實時社交媒體數據的極致利用。該模型可毫秒級接入X(原Twitter)的Firehose數據流,日均處理6800萬條英文推文,通過內置的情緒-量價模型生成1-5分鐘的超短期交易信號。反觀其他模型,GPT-51僅能使用延遲15分鐘的新聞摘要,Gemini3.0則依賴財報和SEC文件,信息時效性落后超過30分鐘。
xAI創始人馬斯克在賽后社交媒體發文稱:“Grok knows the vibes.4.20→5.0











