Facebook資助了一項研究項目,指望將人類大腦中的語言信號轉(zhuǎn)換成書面形式的語句。
據(jù)英國《衛(wèi)報》7月30日報道,這一項目的突破首次證明,可以從大腦活動中提取人類說出某個詞匯的深層含義,并將提取內(nèi)容迅速轉(zhuǎn)換成文本。
目前,該項目研發(fā)的大腦閱讀軟件只適用于它訓(xùn)練過的一些語句,但科學(xué)家們認(rèn)為,該軟件為某個更強(qiáng)大的系統(tǒng)奠定了良好的基礎(chǔ),未來的系統(tǒng)將能夠?qū)崟r解碼一個人想說的話。
致力于該項目的是美國加州大學(xué)舊金山分校的醫(yī)生們,他們希望研發(fā)出一種超越現(xiàn)有設(shè)備的產(chǎn)品,讓癱瘓的人也能夠更流暢地交流。目前已有的設(shè)備可以捕捉眼球運動和肌肉抽搐,從而控制虛擬鍵盤。
這項研究發(fā)表在《自然》(Nature)雜志上,首席研究員愛德華⋅張(Edward Chang)是一位神經(jīng)外科醫(yī)生,他說:“到目前為止,還沒有語音修復(fù)系統(tǒng)可以讓使用者跟上人類快速交談的節(jié)奏。”
該項目由Facebook資助進(jìn)行,得到了三位癲癇患者的幫助。在研究開始之前,醫(yī)生在他們的大腦上直接放置了一小塊微型電極,放置時間至少一個星期,以記錄他們癲癇發(fā)作的起因。
在住院期間,所有能正常說話的患者都同意了參加張的研究。他讓每個患者回答9個固定問題,并要求他們閱讀24個可能的回答,在這個過程中用電極記錄他們的大腦活動。
掌握這些記錄之后,張和他的團(tuán)隊建立了計算機(jī)模型,訓(xùn)練它將特定的大腦活動模式與患者聽到的問題和說出的答案相匹配。一旦接受過訓(xùn)練,該軟件幾乎能立即識別病人聽到的問題和做出的反應(yīng),這一過程僅憑大腦信號就能完成,準(zhǔn)確率分別為76%和61%。
研究小組的成員大衛(wèi)⋅摩西(David Moses)表示:“這是第一次用這種方法來識別口語詞匯和短語。很重要的一點是,我們使用的詞匯量非常有限,但在未來的研究中,我們希望增加翻譯的靈活性和準(zhǔn)確性。”
雖然目前該系統(tǒng)還處于初級階段,但已經(jīng)可以幫助病人回答一些基本問題了,比如喜歡的音樂;自己的身體感覺;房間的冷熱和光線;以及什么時候需要再次檢查。
盡管取得了突破,但研究仍然存在一些困難。其中一個挑戰(zhàn)是改進(jìn)軟件,使其能將大腦信號實時轉(zhuǎn)換成更多樣化的語音。這將需要系統(tǒng)對大量口語和相應(yīng)的大腦信號數(shù)據(jù)進(jìn)行算法訓(xùn)練,患者不同,這些數(shù)據(jù)可能也有差別。
另一個改進(jìn)目標(biāo)是讓系統(tǒng)讀出“想象的語言”,即在腦海中想到的語句。目前,該系統(tǒng)的運行主要通過檢測大腦發(fā)出的信號,這些信號是要支配嘴唇、舌頭、下巴和喉部的移動,換句話說,該系統(tǒng)目前只是一臺語言機(jī)器。但對于一些受傷或神經(jīng)退行性疾病的患者來說,可能無法發(fā)出這種信號,他們需要用更復(fù)雜的方式來解讀大腦中的語句。
溫斯頓⋅蔣是加州大學(xué)舊金山分校的一位神經(jīng)倫理學(xué)家,他沒有參與最新的研究,但他表示,這種系統(tǒng)以后可能會引發(fā)倫理問題,這一點值得注意。例如,這種輔助語言神經(jīng)的系統(tǒng)是否會無意中透露出人們最私密的想法?
張則表示,解碼一個人想公開說出的話已經(jīng)很困難了,提取他們內(nèi)心的想法幾乎是不可能的。“就算這種情況可能實現(xiàn),我也對開發(fā)一種技術(shù)來窺探人們內(nèi)心的想法沒有興趣。”他補(bǔ)充說。
“但如果有人想要交流卻沒法做到,我認(rèn)為作為科學(xué)家和臨床醫(yī)生,我們有責(zé)任恢復(fù)人類這種最基本的能力。”
