Femeie "vorbește" după 20 ani, prin conectarea creierului la o mașină

Femeie "vorbește" după 20 ani, prin conectarea creierului la o mașină

În câteva cuvinte

O femeie paralizată de 20 de ani, în urma unui accident vascular cerebral, a reușit să comunice din nou, aproape în timp real, cu ajutorul unei interfețe creier-mașină și a inteligenței artificiale. Dispozitivul decodifică semnalele neuronale din cortexul motor asociate încercărilor ei de a articula cuvinte și le transformă în text și voce sintetizată. Deși invazivă și încă în dezvoltare, tehnologia reprezintă un progres semnificativ în redarea capacității de comunicare persoanelor cu paralizie.


Ann avea 30 de ani când a suferit un accident vascular cerebral la nivelul trunchiului cerebral, baza creierului care se conectează cu măduva spinării. A încetat să-și mai miște picioarele, brațele și chiar mușchii care acționează coardele vocale. Acum, după ani de antrenament cu inteligența artificială (IA), o interfață creier-mașină (BCI) îi permite să comunice aproape în timp real cu propria voce sintetizată. Pentru a realiza acest lucru, capul ei trebuie să fie conectat la o mașină care îi înregistrează activitatea neuronală printr-o rețea de 253 de electrozi plasați direct pe creier. Dar este prima dată când poate vorbi, chiar dacă sună ca un robot și este conectată la aparate, în mai bine de două decenii.

Ann, care a trecut deja de cincizeci de ani, nu se gândește la cuvinte, ci încearcă să le spună. Regiunea cortexului motor dedicată vorbirii nu este deteriorată. Acolo începe munca grupului de neurocercetători, ingineri și programatori de IA și acolo rezidă una dintre diferențele față de alte încercări de a reda capacitatea de a comunica celor care nu pot vorbi. Alte BCI acționează asupra zonei specifice a limbajului în timp ce pacienții se gândesc la un cuvânt sau își imaginează că îl scriu. Acest nou sistem înregistrează ce se întâmplă în creierul ei când vrea să spună „bună”. Gopala Anumanchipalli, profesor de inginerie electrică și informatică la Universitatea din California din Berkeley (Statele Unite) și coautor senior al acestei cercetări, recent publicată în Nature Neuroscience, explică într-un e-mail: „Este atunci când ea încearcă să spună `hello`, fără să se gândească. Datorită paraliziei lui Ann, nu poate articula sau vocaliza nimic. Cu toate acestea, semnalul neuronal al intenției sale este puternic, ceea ce îl face un indiciu fiabil pentru decodificare”, explică Anumanchipalli.

Decodificarea începe cu electrozii plasați pe cortexul motor al vorbirii. La o persoană sănătoasă, de aici pleacă conexiunile neuronale care ajung, prin trunchiul cerebral, la mușchii care controlează tractul vocal. Cu această conexiune pierdută, o echipă de aproximativ douăzeci de oameni de știință de la Berkeley și Universitatea din California din San Francisco, sprijiniți de mai multe lucrări anterioare, au proiectat un sistem de învățare bazat pe algoritmi care decodifică activitatea neuronală specifică a lui Ann atunci când vrea să articuleze un cuvânt.

Potrivit lui Cheol Jun Cho, de la Berkeley și coautor principal al studiului, „practic, interceptăm semnalul unde gândul se transformă în articulare”. Într-o notă a universității, Cho adaugă: „Ceea ce decodificăm este ulterior momentului în care a apărut ideea, după ce a decis ce să spună, după ce a decis ce cuvinte să folosească și cum să miște mușchii tractului vocal”. Pentru ca mașina și Ann să comunice, ea a trebuit să se antreneze cu un set de 1.024 de cuvinte pe care sistemul le prezenta sub formă de fraze (vezi videoclipul). De asemenea, au antrenat BCI cu o serie de 50 de fraze prestabilite. Imediat ce a văzut că încep să apară pe ecran, Ann a început să încerce să vorbească, iar sistemul a transformat semnalul cerebral atât în text, cât și în voce.

Imaginea arată momentul în care unul dintre cercetători conectează rețeaua de 253 de electrozi de pe creier la portul care duce semnalul neuronal către mașina care îl transformă în voce.

Ann păstra videoclipul de la nunta ei, lucru care le-a fost de mare ajutor. Cu el, au putut alege vocea sintetizatorului așa cum se alege vocea unui navigator sau a lui Siri. Ann le-a spus cercetătorilor că auzirea propriei voci o ajută să se conecteze cu mașina. Începe să devină o practică obișnuită înregistrarea persoanelor cu deficiențe cognitive sau boli care le amenință capacitatea de a vorbi mai târziu, în speranța că știința le va reda vocea în viitor.

A doua mare contribuție a acestei lucrări este viteza. Această BCI nu este singura care a reușit ca persoanele care și-au pierdut posibilitatea de a vorbi să revină la comunicare. Dar până acum erau sisteme foarte lente. Procesul prin care subiecții intenționau să vorbească sau să scrie trebuia să treacă prin mai mulți pași. Până când ceva inteligibil, fie voce, fie text, apărea la celălalt capăt al sistemului, dura câteva secunde, prea mult pentru o comunicare reală și fluidă. Această nouă BCI scurtează mult latența.

Aproximativ o secundă, măsurată din momentul în care decodorul nostru de voce detectează intenția ei de a vorbi în semnalele neuronale”, spune Anumanchipalli. Pentru acest neurocercetător, expert în procesarea limbajului și inteligența artificială, această nouă metodă de transmitere transformă semnalele cerebrale în vocea ei personalizată aproape în timp real. „Nu trebuie să aștepte să termine o frază sau un cuvânt, deoarece decodorul funcționează în sincronizare cu intenția ei de a vorbi, similar modului în care vorbesc persoanele sănătoase”, adaugă el.

Pentru a exclude faptul că Ann și BCI au învățat să repete ca papagalii frazele pe care le oferea sistemul (deși existau mii de combinații posibile), în faza finală a experimentelor, cercetătorii au făcut ca ecranul să afișeze cele 26 de cuvinte care formează așa-numitul alfabet fonetic NATO. Acest jargon a fost o metodă inițiată acum un secol și adoptată de organizația militară în anii 1950 pentru a facilita comunicațiile radio prin scrierea comenzilor. Începe cu cuvintele alfa, bravo, charlie, delta... Ann, care nu se antrenase cu ele, a putut să le spună fără mari diferențe față de vocabularul cu care se antrenase.

Ceea ce s-a realizat este doar o mică parte din ceea ce lipsește. Deja lucrează pentru ca IA lor să capteze dimensiunile non-formale ale comunicării, cum ar fi tonul, expresivitatea, exclamațiile, întrebările... „Avem o lucrare în curs pentru a încerca să vedem dacă putem decodifica aceste caracteristici paralingvistice din activitatea cerebrală”, spune într-o notă Kaylo Littlejohn, de asemenea coautor al acestei cercetări. „Aceasta este o problemă care vine din spate, chiar și în domeniile sintezei audio clasice, și [a cărei soluție] ar permite atingerea unei naturalețe complete”.

Alte probleme sunt, deocamdată, de asemenea, irezolvabile. Una este necesitatea de a deschide capul și de a pune 253 de electrozi pe creier. Anumanchipalli recunoaște: „Deocamdată, doar tehnicile invazive și-au demonstrat eficacitatea cu BCI de vorbire pentru persoanele cu paralizie. Dacă cele neinvazive îmbunătățesc captarea semnalului cu precizie, ar fi rezonabil să presupunem că vom putea crea un BCI neinvaziv”. Dar, acum, recunoaște expertul, încă nu sunt în acel punct.

Read in other languages

Про автора

Răzvan scrie despre tehnologie și inovații din Spania, el are abilitatea de a relata despre noutăți tehnice complexe într-un limbaj simplu și ușor de înțeles.