W ramach przełomowego postępu w leczeniu pacjentów z ciężkim paraliżem naukowcy zUniwersytety Kalifornijskie w Berkeley i Uniwersytet w San Francisco opracowały innowacyjną technologię, która w czasie rzeczywistym przekształca sygnały mózgowe w mowę słyszalną. Ten rewolucjonistatechnologii interfejsu mózg-komputer (BCI).stanowi znaczący kamień milowy w pomaganiu osobom, które utraciły zdolność mówienia, odzyskać naturalne możliwości komunikacji.
Podejście strumieniowe radykalnie skraca czas reakcji
Jak wynika z artykułu opublikowanego naInżynieria Uniwersytetu Kalifornijskiego w Berkeleystronie internetowej, zespół badawczy stworzyłSystem oparty na sztucznej inteligencji, który dekoduje sygnałybezpośrednio zkora ruchowa mózgu, generując mowę niemal natychmiast. Ten "przesyłanie strumieniowe” stanowi radykalną poprawę w stosunku do poprzednich metod.
„Nasze podejście do przesyłania strumieniowego, które wykorzystuje technologie dekodowania głosu podobne do tych stosowanych w Alexa i Siri, może radykalnie skrócić czas od zamiaru mózgu do wypowiedzenia mowy” – wyjaśnia Gopala Anumanchipalli, współkierownik badania i adiunkt na Wydziale Elektrotechniki i Informatyki Uniwersytetu Kalifornijskiego w Berkeley.

Wpływ tegozwiększenie prędkości jest niezwykłe. Sercem nowej technologii jest rozwiązanieProblem opóźnienia tradycyjnego dekodowania głosu BCI.Podczas gdy poprzednia technika wymagała ok8 sekund na rozszyfrowanie pojedynczego zdania, nowa metoda może wypisać pierwszą sylabę w obrębie1 sekundapo tym, jak pacjent zamierza mówić.

Wyniki w świecie rzeczywistym: doświadczenia pacjentki Ann
Skuteczność technologii wykazano podczas pracy z pacjentką zidentyfikowaną jako Ann, która była w stanie wygenerować niemal naturalną mowę po prostu „myśląc” zdaniami bez wokalizacji.
Innowacyjne podejście zespołu do generowania mowy sprawia, że ta technologia jest szczególnie osobista.Kaylo Littlejohn, współpierwsza autorka badania i doktorantka na Uniwersytecie w Berkeley, powiedział, że zespół użyłModel zamiany tekstu na mowę wytrenowany przez sztuczną inteligencjęsymulować głos pacjenta sprzed urazu, aby dźwięk był bardziej spersonalizowany.
Wszechstronność i zdolność adaptacji
Badanie wykazało imponującą kompatybilność pomiędzy różnymi urządzeniami do pozyskiwania sygnałów mózgowych, w tym układami mikroelektrod i czujnikami EMG twarzy, co wskazuje na szerokie potencjalne zastosowania w różnych warunkach klinicznych.

Być może najbardziej imponujące jest to, że system wykazuje niezwykłe zdolności uogólniania. Kiedy pacjentka Ann próbowała „mówić,„W danych szkoleniowych nie uwzględniono 26 słów, w szczególności słów z alfabetu fonetycznego NATO, takich jak „Alfa” i"Brawo." Modelka dokładnie rozszyfrowała swoje intencje.
„To dowodzi, że nasz system nie opiera się tylko na dopasowywaniu wzorców, ale w rzeczywistości uczy się zasad składu mowy”zauważa Cheol Jun Cho, kolejny współautor i doktorant. „Ta umiejętność kładzie podwaliny pod przyszłą poprawę tonu, tonu i innych cech ekspresji mowy”
Przyszłe kierunki
Pacjentka Ann informuje, że to nowe podejście zapewnia jej większą kontrolę i wyrażanie siebie niż jej wcześniejsze doświadczenia eksperymentalne z 2023 r.
W przyszłości zespół badawczy planuje udoskonalić swoje algorytmy, aby zwiększyć naturalność mowy i ekspresję emocjonalną, jednocześnie badając zastosowania w szerszym zakresie scenariuszy klinicznych.
Ta technologia interfejsu neuronowego stanowi znaczący postęp w technologiach komunikacji wspomagającej. Pokazuje, jak można wykorzystać sztuczną inteligencję, aby przywrócić podstawowe zdolności człowieka, takie jak mowa, osobom, które utraciły je w wyniku urazu lub choroby.












