Megvan az eszköz, amivel akár a némák is beszélhetnek

Tudósok megtalálták a módját, hogy az emberi agy által kibocsátott jeleket beszéddé alakítsák, ez pedig sok embernek komoly segítséget jelenthet.

Sikerrel zárult az első olyan kísérlet, amely során a tudósok képesek voltak agyi jeleket közvetlenül érthető beszédre fordítani, erről pedig a Science Alert számolt be. Elsőre úgy tűnhet, mintha egy vad sci-fibe csöppentünk volna, pedig ez a felfedezés valóban sokaknak könnyítheti meg az életét.

Hogy működik? 

A rendszer kulcsa egy mesterségesintelligencia-algoritmus, amely az elektromos aktivitásmintákat érthető beszéddé alakítja. Korábbi kutatásokból tudjuk, hogy amikor beszélünk – vagy akár csak elképzeljük a beszédet –, az agy neurális hálózataiban különböző mintázatok rajzolódnak ki. Ebben az esetben azonban a rendszer inkább az agyi reakciókat dekódolja, de némi fejlesztéssel képes lehet akár a gondolatokat beszéddé alakítani.

„A hangunk nagy szerepet játszik abban, hogy kapcsolatot tudjunk kiépíteni a barátainkkal, családunkkal és a környezetünkkel. Emiatt nagy nehézség, ha valaki egy sérülés vagy betegség miatt elveszti a hangját” – mondja Nima Mesgarani, a New York-i Columbia Egyetem kutatója. „A tudomány mai állása lehetőséget biztosít arra, hogy helyreállítsuk ezt a képességet. Bebizonyosodott, hogy a megfelelő technika segítségével a sérült emberek gondolatai újra dekódolhatók, és bárki számára érthetővé válhatnak.”

Siri, Alexa, mesterséges intelligencia

Az alkalmazott algoritmust vokódernek nevezzük. Ugyanez az algoritmus képes emberi beszédet létrehozni például a Siri vagy az Amazon Alexa esetében is. Az Amazonnak vagy az Apple-nek nem kell minden egyes szót beprogramoznia a készülékekbe, hiszen azok a vokóder segítségével valós szöveges hangot képesek létrehozni.

A vizsgált esetben viszont nem az emberi beszéd, hanem az egyes mondatok hallgatása közben agyműtéten átesett betegek hallókérgének neurális aktivitása szolgált a vokóder alapjául. A hangosan felolvasott számjegyeket (0-tól 9-ig) meghallgatott páciensek rögzített agyi jeleit egy hangkódolón keresztülfuttatták, és több mesterségesintelligencia-elemzés segítségével tisztították meg. Az eredmények hasonlóak voltak az emberi beszédhez – még akkor is, ha egyelőre sokkal inkább hasonlít egy robotra, mint élő beszédre.

A technika sokkal hatékonyabbnak bizonyult, mint a korábbi próbálkozások, amelyek egyszerűbb számítógépes modelleket használtak a hangfrekvenciák vizuális ábrázolásához. „Megállapítottuk, hogy az emberek 75 százalékban megértik és képesek megismételni a hallottakat, ami jóval meghaladja a korábbi eredményeket” – említi Mesgarani. „Az érzékeny vokóder és az erőteljes ideghálózatok meglepő pontossággal adták vissza azokat a hangokat, amelyeket a betegek eredetileg hallgattak.”

Sokak problémáját oldhatja meg

Még mindig sok munka van a technológia tökéletesítésével, de rengeteg lehetőség nyílt a kutatók számára. Fontos kihangsúlyozni, hogy az algoritmus nem képes a gondolatokat szavakká alakítani, de a kutatók előbb-utóbb szeretnének erre is megoldást találni. Így képesek lennénk csupán a gondolatainkkal megírni egy e-mailt, vagy lekapcsolni az intelligens lámpánkat. Ez azonban még várat magára, nem utolsósorban azért, mert mindannyiunk agya egy kicsit másképp működik – emiatt pedig az egyes gondolatok értelmezéséhez rengeteg embertől nagy mennyiségű adatra van szükség.

Egyszer talán jelek nélkül, gondolatokkal is kommunikálhatunk
Egyszer talán jelek nélkül, gondolatokkal is kommunikálhatunkFotó: Ashley Corbin-Teich / Getty Images Hungary

A nem túl távoli jövőben lehetőség nyílhat arra, hogy olyan emberek is képesek legyenek beszédhanggal kommunikálni, akiknek valamilyen sérülés vagy betegség (például stroke) következtében eddig nem volt rá lehetőségük. „Ha az ember arra gondol, hogy kérne egy pohár vizet, az algoritmus az adott gondolatból generál agyi jeleket, ezt pedig verbális beszéddé alakíthatja, ami rengeteg embernek teheti könnyebbé a környezetéhez való kapcsolódást” – összegzi Mesgarani.

Mustra