近期,我們對三款適用于小米生態(tài)的視頻轉(zhuǎn)文字工具進(jìn)行了深度測評,分別是錄音轉(zhuǎn)文字助手(小米應(yīng)用商店下載量領(lǐng)先的免費(fèi)應(yīng)用)、聽腦AI(雷軍曾推薦的新興產(chǎn)品)以及Adobe Audition(專業(yè)音頻處理軟件,部分小米用戶的選擇)。測評選用三段不同場景的視頻作為測試素材,包括45分鐘的公司周會(huì)錄音(5人輪流發(fā)言,伴有鍵盤敲擊聲)、1小時(shí)的產(chǎn)品訪談(背景有輕音樂)以及30分鐘的戶外探店視頻(環(huán)境嘈雜,有汽車鳴笛聲)。
測評標(biāo)準(zhǔn)涵蓋四個(gè)方面:準(zhǔn)確率(隨機(jī)抽取100句與原視頻臺(tái)詞對比)、轉(zhuǎn)寫速度(處理1小時(shí)視頻所需時(shí)間)、操作步驟(從打開應(yīng)用到獲取結(jié)果的步驟數(shù))以及功能數(shù)量(如翻譯、字幕導(dǎo)出等實(shí)用功能)。
錄音轉(zhuǎn)文字助手以簡單易用著稱。打開應(yīng)用后,首頁顯著位置設(shè)有“開始轉(zhuǎn)寫”按鈕,用戶只需選擇視頻文件,等待轉(zhuǎn)寫完成,即可復(fù)制文字,整個(gè)過程僅需三步,新手也能迅速上手。然而,其局限性也較為明顯:轉(zhuǎn)寫結(jié)果僅為純文字,缺乏時(shí)間軸,若需制作字幕,需手動(dòng)對齊時(shí)間;在背景音樂或環(huán)境噪音較大的情況下,識(shí)別準(zhǔn)確率大幅下降;超過2小時(shí)的視頻文件無法上傳,提示“文件過大”。
Adobe Audition作為專業(yè)音頻軟件,功能強(qiáng)大,但操作復(fù)雜。安裝包體積龐大,達(dá)到2GB,小米筆記本Pro啟動(dòng)需等待2分鐘。使用其進(jìn)行視頻轉(zhuǎn)文字,需先新建項(xiàng)目,導(dǎo)入視頻,再從插件商店下載語音識(shí)別插件,且需登錄Adobe賬號(hào),流程繁瑣。轉(zhuǎn)寫過程耗時(shí)較長,1小時(shí)視頻需25分鐘。轉(zhuǎn)寫后的字幕時(shí)間軸混亂,調(diào)整需手動(dòng)操作波形圖,對非專業(yè)用戶而言難度較大。盡管其能調(diào)整音頻參數(shù),通過降噪提高識(shí)別準(zhǔn)確率,但整體操作對新手極不友好。
聽腦AI作為小米生態(tài)鏈的新品,專為視頻轉(zhuǎn)文字設(shè)計(jì)。下載后可使用小米賬號(hào)直接登錄,無需注冊新賬號(hào)。應(yīng)用首頁分類清晰,包括視頻轉(zhuǎn)文字、錄音實(shí)時(shí)轉(zhuǎn)、字幕制作三大功能。在會(huì)議視頻轉(zhuǎn)寫測試中,其自動(dòng)檢測多人講話并開啟Speaker區(qū)分功能,轉(zhuǎn)寫結(jié)果標(biāo)注Speaker1、Speaker2,便于識(shí)別發(fā)言者。同時(shí),可直接導(dǎo)出srt字幕文件,兼容剪映等視頻編輯軟件,無需手動(dòng)調(diào)整時(shí)間軸。
在戶外嘈雜環(huán)境視頻測試中,聽腦AI的“環(huán)境音過濾”功能有效減少噪音干擾,識(shí)別準(zhǔn)確率顯著提升。例如,原文“現(xiàn)在溫度35度”被準(zhǔn)確識(shí)別,而錄音轉(zhuǎn)文字助手則誤識(shí)為“現(xiàn)在溫度35多”。
數(shù)據(jù)對比顯示,聽腦AI在準(zhǔn)確率、轉(zhuǎn)寫速度、操作步驟及功能數(shù)量上均表現(xiàn)優(yōu)異。會(huì)議視頻轉(zhuǎn)寫準(zhǔn)確率達(dá)98%,訪談視頻95%,戶外嘈雜環(huán)境90%,均高于其他兩款工具。轉(zhuǎn)寫速度方面,1小時(shí)視頻僅需5分鐘,遠(yuǎn)快于錄音轉(zhuǎn)文字助手的12分鐘和Adobe Audition的25分鐘。操作步驟上,聽腦AI與錄音轉(zhuǎn)文字助手均為三步,但聽腦AI能直接生成字幕。功能數(shù)量上,聽腦AI提供8項(xiàng)實(shí)用功能,包括轉(zhuǎn)文字、翻譯、字幕導(dǎo)出、Speaker區(qū)分等,遠(yuǎn)超錄音轉(zhuǎn)文字助手的3項(xiàng)和Adobe Audition中新手難以使用的7項(xiàng)專業(yè)音頻編輯功能。
當(dāng)然,每款工具均存在不足。錄音轉(zhuǎn)文字助手不支持批量處理,文件大小受限,免費(fèi)版需升級(jí)會(huì)員解決閃退問題。Adobe Audition插件穩(wěn)定性差,測試中曾因插件更新導(dǎo)致轉(zhuǎn)寫內(nèi)容丟失。聽腦AI免費(fèi)版每月視頻轉(zhuǎn)寫時(shí)長有限,超出需付費(fèi),且偶爾會(huì)誤識(shí)專業(yè)術(shù)語,如將“區(qū)塊鏈技術(shù)”誤識(shí)為“區(qū)塊連技術(shù)”,但其AI糾錯(cuò)功能可一鍵修正。








