近日,新加坡國家人工智能計劃與阿里巴巴攜手,共同推出了一款名為Qwen-SEA-LION-v4的東南亞多語言大模型。這款模型以阿里巴巴的“通義千問”開源模型為技術(shù)基石,專為東南亞地區(qū)復(fù)雜的語言環(huán)境量身打造。
東南亞地區(qū)語言多樣性極高,擁有超過1200種語言,日常交流中多種語言混用的情況十分普遍。然而,全球主流的AI模型大多以英語為核心,難以有效滿足當(dāng)?shù)厥袌龅男枨螅瑢?dǎo)致當(dāng)?shù)谹I發(fā)展面臨巨大挑戰(zhàn)。Qwen-SEA-LION-v4的誕生,正是為了填補(bǔ)這一“AI鴻溝”,為東南亞地區(qū)提供更貼合實際的語言處理工具。
在“東南亞語言模型全面評估基準(zhǔn)”(SEA-HELM)的開源模型榜單(參數(shù)量2000億以下)中,這款由中新合作研發(fā)的模型迅速嶄露頭角,一舉登頂。這一成績不僅證明了其技術(shù)實力,也彰顯了雙方合作的成效。
為了更好地適應(yīng)東南亞的語言特點,Qwen3模型在預(yù)訓(xùn)練階段就納入了119種語言,為理解東南亞的小語種奠定了堅實基礎(chǔ)。通義千問團(tuán)隊還在后續(xù)訓(xùn)練中加大了跨語言任務(wù)的比重,使模型能夠更從容地應(yīng)對現(xiàn)實世界中多語言混合輸入的復(fù)雜場景。
目前,Qwen-SEA-LION-v4模型已通過AISingapore官網(wǎng)和HuggingFace開源社區(qū)向全球用戶開放免費下載,為更多地區(qū)和場景的語言處理需求提供了新的選擇。










