MTN致力於發展非洲語言的AI模型

MTN集團宣布將支持非洲語言數據集的開發,這是回應奈及利亞通訊、創新與數位經濟部部長Bosun Tijani博士的呼籲,希望能加強公私部門在人工智慧研究上的投資。這項決定是在紐約聯合國大會(UNGA)的Y'ello Chair Vodcast上宣布的。

這一舉措在語言資源匱乏的非洲大陸上具有重要意義,該地區有超過2000種語言在AI系統中並未得到充分代表。若無結構性的數據集,非洲的15億人口可能在教育、健康、商業和治理等AI驅動的服務中被排除在外。

打造非洲的語言模型

這項承諾是在奈及利亞語言地圖和擴展AI計畫(N-ATLAS)的基礎上提出的。該計畫是今年早些時候由奈及利亞政府和Awarri Technologies合作啟動的開放源碼多語言模式,旨在數位化和保存奈及利亞超過500種語言。其框架設計為能被其他非洲國家採用。

MTN集團總裁兼首席執行官Ralph Mupita表示,這項工作對確保非洲人在全球科技轉型中不落人後至關重要。他說:「我們必須避免非洲人成為數位弱勢群體。我們追求的結果是讓人們在數位世界和經濟中獲得包容與尊嚴。」

文化保存與新機遇

MTN對語言數據集的支持不僅限於文化保存,還展示非洲數位經濟中的新機會。透過支持語言數據集,該公司不僅希望脫穎而出為一電信運營商,還期望在非洲的AI領域被視為技術促進者。其他全球公司如Google和Meta也曾經對非洲語言模型進行過測試,但通常商業範圍有限。

MTN的這一舉措凸顯出私營部門對此的興趣日益增加。然而,這並不是第一個為解決非洲AI語言差距的倡議。自2019年以來,Masakhane這一草根研究社群的機器學習專家一直在為非洲語言構建翻譯模型。Mozilla的Common Voice項目則通過群眾外包方式收集如Kiswahili、Luganda和Wolof等語言的語音數據集。南非的Lelapa AI正在開發供資源匱乏的非洲語言使用的自然語言處理工具。

通過參與這股潮流,MTN將企業規模和資源帶入了由學術界和開源社群長期推動的努力。結果將決定非洲企業是否能夠開發出基於本地現實的AI解決方案,或是否仍需依賴於忽視其的全球系統。