科技領域近日迎來一項突破性進展:谷歌公司通過其AI Studio平臺開發的一款未命名AI模型,在歷史文獻破譯領域展現出接近人類專家的能力。該模型經測試后,在處理復雜手稿時的表現引發學界關注,其精準度已達到專業轉寫人員的水平。
歷史學家馬克·漢弗里斯(Mark Humphries)主導的基準測試顯示,這款AI模型在解析五份高難度歷史手稿時,整體字符錯誤率僅1.7%。其中約七成錯誤集中在標點符號和大小寫格式,而非單詞本身。若排除這類非核心錯誤,模型的實際錯誤率可降至0.56%,相當于每200個字符僅出現一次誤差。這一數據與長期從事文獻轉寫的專業人員相當。
測試樣本覆蓋18至19世紀多種手寫風格,包含字跡潦草、拼寫不規范及語法混亂的復雜文本。例如,在處理一份奧爾巴尼賬簿的轉錄任務時,模型成功還原了模糊不清的數字記錄,其表現甚至超越了簡單文字識別范疇。
更引人注目的是該模型展現的推理能力。在分析18世紀商人日記時,面對僅標注數字"145"的購糖記錄,模型未直接轉錄為"145",而是通過反向推算賬本總價,結合當時英國貨幣與重量單位的換算關系,最終輸出"14磅5盎司"。這一過程涉及多維度信息整合,顯示出AI對歷史語境的深度理解。
盡管初步成果顯著,研究團隊也指出當前評估的局限性。由于該模型目前僅通過A/B測試形式零星發布,大規模系統性測試難以開展。現階段僅完成了基準數據集約10%的樣本驗證,后續仍需擴大測試范圍以確認其穩定性。這項技術若能進一步完善,或將為歷史研究提供全新工具,大幅降低文獻整理成本。











