最近,《自然·神經科學》雜志上發達了一篇來自美國加州大學舊金山分校的科研團隊的研究,即使用人工智能解碼系統,把人的腦電波轉譯成英文句子,最低平均錯誤率只有3%,而專業速記員的平均錯誤率是5%

研究團隊從機器翻譯中獲得啟發,訓練了一種循環神經網絡。研究中,4名志愿者被要求大聲重復朗讀30至50句話。他們大腦外側皮質上分布著大量微電極,可以監測到相應的大腦神經活動。這些腦電波數據輸入人工智能系統后,先被編碼成一串序列,然后解碼成相應的英文句子。
這項研究的創新之處在于,采用端到端的深度學習網絡實現神經信號翻譯,從工程角度展示了人工智能技術應用于神經信號解讀的潛力。但研究團隊也強調,該研究涉及的句子量比較少。“如果你嘗試不使用這50個句子的數據集,解碼就會糟糕很多。”論文第一作者約瑟夫·馬金接受媒體采訪時說。
這項研究的難點在于兩個方面。
首先是采用了高密度微電極陣列,間距4毫米,多達256個電極,覆蓋大腦皮層表面的關鍵腦區,獲取了足夠的神經信息用于解碼。這種電極在國內尚沒有可用于臨床的產品。
另外,研究中深度循環神經網絡的訓練,除了采用時間軸上的卷積操作提高特征提取能力,還把語音頻譜特征也作為訓練目標,大大降低了對神經數據量的需求。
“腦機接口的一個核心難題是神經信息的解碼和翻譯,腦電信號噪聲大,背后的神經編碼機制復雜未知,這些都是挑戰。”洪波認為,以深度學習為代表的人工智能技術發展,為腦機接口打開一條應對該挑戰的新路徑。
不過人工智能與腦機接口結合,也帶來新難題:如何獲得大量的訓練數據?來自人腦的高精度神經數據通常只在臨床條件下才能獲得,這會使神經網絡訓練陷入困境。
現實應用仍存技術障礙
這項技術目前主要用于癲癇外科的臨床,幫助外科醫生在切除癲癇病灶之前,確定關鍵的語言功能區。要讓漸凍人、高位截癱等殘疾患者用上這樣的腦機接口,還要繼續解決長效電極和解碼效率的問題。 相關技術在未來實際應用中,仍然有很大的技術障礙,例如高密度的微電極陣列目前還無法長期植入,難以作為未來腦機接口的標準電極。根本上說,人工智能應用于腦機接口,關鍵門檻還是長期可靠的神經電極和清晰準確的神經解碼規律。
人們所期待的戴上腦電帽就能讀出心里話,從科學和工程角度來看還有很遠的距離。但腦科學和人工智能技術的結合,有可能加速這些探索和研發的進程