驗(yàn)證了肌電信號(hào)作為一種直觀、無(wú)縫的輸入方法適用于大多數(shù)人
(中國(guó)AI網(wǎng) 2025年07月24日)從鍵盤到鼠標(biāo),再到觸控屏,我們一直在適應(yīng)與計(jì)算機(jī)交互的新方式,以便進(jìn)行交流、創(chuàng)造和完成工作。但是,如果有一種方法是令設(shè)備適應(yīng)我們,由機(jī)器學(xué)習(xí)和人工智能驅(qū)動(dòng),同時(shí)控制方案不那么機(jī)器人化,而是更直觀,本質(zhì)上更人性化呢?
由于計(jì)算機(jī)視覺和自然語(yǔ)言理解,我們已經(jīng)看到了這一領(lǐng)域的進(jìn)步,并允許我們使用我們的聲音進(jìn)行交互,而且計(jì)算機(jī)可以像我們一樣看到世界。但是,如果我們可以利用手部的細(xì)微動(dòng)作來(lái)控制我們的計(jì)算機(jī)呢?畢竟,手是我們與周圍世界交互的第一種方式之一。
實(shí)際上,這正是Meta Reality Labs多年來(lái)一直在探索的未來(lái)。基于研究結(jié)果,團(tuán)隊(duì)認(rèn)為手腕表面肌電圖(sEMG)是開啟人機(jī)交互下一個(gè)范式轉(zhuǎn)變的關(guān)鍵。
日前,團(tuán)隊(duì)在《自然》發(fā)表了一項(xiàng)最新研究,并驗(yàn)證了肌電信號(hào)作為一種直觀、無(wú)縫的輸入方法適用于大多數(shù)人。


為了建立一個(gè)既高性能又易于訪問的接口,Meta團(tuán)隊(duì)專注于一種基于使用肌電圖(EMG)讀取肌肉電信號(hào)的非侵入性神經(jīng)運(yùn)動(dòng)接口。肌電位是由運(yùn)動(dòng)單位動(dòng)作電位(MUAPs)的總和產(chǎn)生,代表了一個(gè)了解中樞神經(jīng)系統(tǒng)發(fā)出的運(yùn)動(dòng)命令的窗口。表面肌電信號(hào)(sEMG)記錄通過放大肌肉中的神經(jīng)信號(hào)提供高信噪比,從而實(shí)現(xiàn)實(shí)時(shí)的單次手勢(shì)解碼。
表面肌電信號(hào)的性質(zhì)使其自然地適用于人機(jī)接口應(yīng)用,因?yàn)樗皇苡?jì)算機(jī)視覺方法所困擾問題的影響,例如遮擋、光線不足或最小運(yùn)動(dòng)手勢(shì)等等。事實(shí)上,肌電圖已經(jīng)在臨床環(huán)境中廣泛應(yīng)用于診斷和康復(fù),以及假肢控制。
然而,目前的肌電圖系統(tǒng),包括假肢控制系統(tǒng),在大規(guī)模使用和部署方面存在諸多局限性。實(shí)驗(yàn)室系統(tǒng)通常有連接外部電源和放大器的電線,并放置在不舒服的位置。商業(yè)可用的肌電圖神經(jīng)運(yùn)動(dòng)接口在控制方面一直具有挑戰(zhàn)性,涉及到無(wú)數(shù)的技術(shù)問題,如跨姿勢(shì)的魯棒性差,缺乏標(biāo)準(zhǔn)化數(shù)據(jù),電極位移,以及缺乏跨會(huì)話和跨用戶的泛化。
最近,深度學(xué)習(xí)技術(shù)在解決相關(guān)限制方面取得了一定的成功,但普遍缺乏可用的肌電圖數(shù)據(jù)和低樣本量限制了它們的有效性。
為了驗(yàn)證表面肌電信號(hào)可以提供直觀和無(wú)縫的計(jì)算機(jī)輸入的假設(shè),Meta開發(fā)并部署了強(qiáng)大的、非侵入性的硬件,以用于在手腕記錄表面肌電信號(hào)。之所以選擇手腕,是因?yàn)槿祟愔饕怯檬峙c世界接觸,而手腕提供了廣泛覆蓋的手、手腕和前臂肌肉的肌電信號(hào),同時(shí)提供了社會(huì)可接受性。
團(tuán)隊(duì)研發(fā)的表面肌電信號(hào)研究設(shè)備(sEMG- RD)是一種干電極,多通道記錄平臺(tái),能夠提取單個(gè)假定的MUAP。它舒適,無(wú)線,適應(yīng)不同的解剖結(jié)構(gòu)和環(huán)境,可以在數(shù)秒鐘內(nèi)穿上或脫下。
為了將表面肌電信號(hào)轉(zhuǎn)化為驅(qū)動(dòng)計(jì)算機(jī)交互的命令,研究人員構(gòu)建并部署了根據(jù)數(shù)千名被試的數(shù)據(jù)進(jìn)行訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。他們同時(shí)創(chuàng)建了自動(dòng)行為提示和參與者選擇系統(tǒng),以在大量不同的人群中擴(kuò)展神經(jīng)運(yùn)動(dòng)記錄。另外,團(tuán)隊(duì)展示了sEMG-RD驅(qū)動(dòng)計(jì)算機(jī)交互的能力,例如一維連續(xù)導(dǎo)航(類似于基于手腕姿勢(shì)的激光筆),手勢(shì)檢測(cè)(手指按壓和拇指滑動(dòng))和手寫轉(zhuǎn)錄等等。
表面肌電信號(hào)解碼模型在沒有特定訓(xùn)練或校準(zhǔn)的人群中表現(xiàn)出色。在離線評(píng)估中,sEMG-RD平臺(tái)在手寫和手勢(shì)檢測(cè)中的分類準(zhǔn)確率超過90%,在手腕角速度解碼的誤差小于13°?s?1。對(duì)于在線評(píng)估,團(tuán)隊(duì)在基于手腕的連續(xù)控制中實(shí)現(xiàn)了每秒0.66個(gè)目標(biāo)獲取,在離散手勢(shì)實(shí)現(xiàn)了每秒0.88個(gè)目標(biāo)獲取,在手寫方面實(shí)現(xiàn)了每分鐘20.9個(gè)單詞(WPM)。
研究人員總結(jié)道:“據(jù)我們所知,這是由神經(jīng)運(yùn)動(dòng)接口實(shí)現(xiàn)的最高水平的跨參與者表現(xiàn)。我們的方法為基于表面肌電信號(hào)的人機(jī)交互研究開辟了方向,同時(shí)解決了當(dāng)前和未來(lái)腦機(jī)接口研究的諸多基本技術(shù)問題。
這項(xiàng)研究為更廣泛的科學(xué)界提供了一個(gè)創(chuàng)造神經(jīng)運(yùn)動(dòng)接口的藍(lán)圖。除了一套重要的設(shè)計(jì)規(guī)則和硬件、實(shí)驗(yàn)設(shè)計(jì)、數(shù)據(jù)需求和建模的最佳實(shí)踐之外,團(tuán)隊(duì)同時(shí)公開發(fā)布了相關(guān)的數(shù)據(jù)集,包含來(lái)自300多名研究參與者的100多個(gè)小時(shí)的表面肌電信號(hào)記錄,涉及三個(gè)不同的任務(wù)。加上之前開源的用于姿態(tài)估計(jì)和表面類型的表面肌電信號(hào)數(shù)據(jù)集,Meta希望這有助于加快領(lǐng)域?qū)W者和研究人員的未來(lái)工作。
相關(guān)論文:A generic non-invasive neuromotor interface for human-computer interaction
https://www.nature.com/articles/s41586-025-09255-w
他們總結(jié)道:“隨著時(shí)間的推移,表面肌電信號(hào)可能會(huì)徹底改變我們與設(shè)備的交互方式,并為我們甚至做夢(mèng)都沒想到的人機(jī)交互解鎖新的可能性。它可能會(huì)被證明是幾乎所有設(shè)備的完美輸入。”

