9月15日,廈門理工學院智能視聽實驗室團隊于發(fā)布了“以中文為核心的多模態(tài)預訓練閩南話語言模型”“閩臺視頻資料AI增強與編輯云平臺”等多項科研成果。
“閩臺視聽資料AI超高清視頻增強與編輯云平臺”是依托人工智能技術實現(xiàn)對視頻資料的智能增強和編輯,用戶可以輕松地對視頻進行增強、剪輯、調色等操作,讓視頻更加清晰、鮮艷、逼真。課題組童同教授介紹,該平臺還支持多種視頻格式和分辨率,滿足不同用戶的需求。閩臺視聽資料AI超高清視頻增強與編輯云平臺的發(fā)布標志著實驗室的技術水平又向前邁進了一步。同時,基于人工智能技術手段,下一步平臺將應用于閩臺在文化領域的融合發(fā)展場景中,對珍貴的閩臺歷史影像資料進行融合和修復,并通過新媒體在兩岸地區(qū)傳播,深度挖掘兩岸歷史文化共性,對福建探索海峽兩岸融合發(fā)展將產生重大社會影響和文化價值。
“以中文為核心的多模態(tài)預訓練閩南話語言模型”采用了最新的深度學習技術和大規(guī)模語料庫訓練,能夠實現(xiàn)對閩南話的準確理解和生成。廈門理工學院影視與傳播學院副院長、福建省網絡視聽應用創(chuàng)新重點實驗室主任林小勇教授表示,該模型是以中文底層技術為核心,以閩南地區(qū)閩南話為基準音,融合臺灣等多地語音,還支持多種模態(tài)輸入,如文本、語音、圖像等,可以實現(xiàn)對不同形式的閩南話信息的處理和翻譯。模型的發(fā)布,不僅為全球閩南話使用者的溝通交流有力支持,而且對維護我國語言文化多樣性、國家國際傳播能力建設具有重要意義。同時,該模型還兼具巨大的經濟價值和應用空間,在電商交流、企業(yè)投資等各類閩臺民間交互場景中應用前景廣闊。團隊成員、廈門理工學院影視與傳播學院黃婉彬副教授表示,閩南話使用群體達七千萬人,使用區(qū)域覆蓋閩臺兩岸、東南亞與海外廣大的華人聚居地,閩南話大模是向世界傳播中國文化、加強民間互動交流的重要載體。
據(jù)了解,廈門理工學院智能視聽實驗室以福建省網絡視聽應用創(chuàng)新重點實驗室、福建省重點智庫培育單位福建未來媒體智庫和福建省高校人文社科研究基地未來媒體發(fā)展中心等省級平臺以依托建設,已獲得國家社科基金項目在內的省部級以上重大項目十多項。研究成果先后獲得國家廣電總局優(yōu)秀研究成果、福建省科技進步獎一等獎、福建省社科成果獎二等獎、廈門市社科成果獎一等獎等。接下來,課題組將進一步擴大閩南話語言模型應用推廣,持續(xù)推動智能視聽技術成果應用與轉化,促進閩臺融合發(fā)展。
來源: 廈門廣電網
