Ученые-нейробиологи, нейрохирурги и инженеры из Университета Дьюка создали уникальный речевой протез. Это устройство умеет преобразовывать нейронные сигналы в слова, которые человек намеревается произнести.
Что известно
«Множество пациентов сталкиваются с серьезными двигательными нарушениями, например, с боковым амиотрофическим склерозом или синдромом «заключенного», которые лишают их возможности разговаривать. Существующие же методы коммуникации неэффективны и малоудобны для них», — делится Грегори Коган, доктор философии, профессор неврологии в медицинской школе Университета Дьюка и ведущий исследователь проекта.
Попробуйте представить, что вы слушаете аудиокнигу на скорости вдвое меньше обычной. Сегодня это самый высокий показатель скорости распознавания речи, достигающий примерно 78 слов в минуту. Тем не менее, в обычной беседе люди говорят со скоростью около 150 слов в минуту.
Разрыв между реальной и распознаваемой скоростью речи частично связан с ограниченным числом датчиков мозговой активности, которые можно разместить на тончайшем материале, покрывающем поверхность мозга. Меньшее количество датчиков ведет к снижению точности расшифровки информации.
Для преодоления этих ограничений Грег Коган в сотрудничестве с доктором Джонатаном Вивенти из Института мозговых наук университета Дьюка, чья лаборатория биомедицинской инженерии занимается разработкой высокоплотных, ультратонких и гибких датчиков для мозга, предпринял ряд мер.
Детали
В ходе проекта команда Вивенти уместила 256 микроскопических сенсоров для мониторинга мозговой активности на кусочке гибкого медицинского пластика размером с марку. Учитывая, что нейроны, расположенные на близком расстоянии, могут демонстрировать совершенно различные модели активности при формировании речи, крайне важно различать сигналы отдельных мозговых клеток для точного предсказания предполагаемой речи.
После разработки нового имплантата Грег Коган и Джонатан Вивенти вступили в сотрудничество с несколькими нейрохирургами из Университетской больницы Дьюка. Среди них были Дерек Саутвелл, Нандан Лад и Аллан Фридман, которые оказали помощь в подборе 4 пациентов для испытаний имплантов. Исследование предусматривало временную установку аппарата пациентам, находящимся на операции по другим медицинским показаниям, например, при лечении болезни Паркинсона или удалении опухоли. Время для тестирования устройства в операционной было строго ограничено.
Задание состояло в простом повторении услышанного. Участники слышали серию невнятных слов, таких как «ава», «куг» или «вип», и повторяли их вслух. Устройство фиксировало активность речевого моторного кортекса у каждого пациента, который координировал движения почти ста мышц, задействованных в движении губ, языка, челюсти и гортани.
Затем Сусеендракумар Дураивел, ведущий автор исследования и аспирант кафедры биомедицинской инженерии в Дьюке, проанализировал нейронные и речевые данные, полученные в ходе операции. Он использовал алгоритм машинного обучения, чтобы оценить, насколько точно он сможет определить произносимые звуки, исходя исключительно из записей мозговой активности.
Почему это важно
В общем, декодер показывает точность в 40% случаев. Несмотря на то, что такой результат может показаться не высоким, он действительно впечатляет, учитывая, что для подобных технологий преобразования мозговых сигналов в речь обычно требуется несколько часов или даже дней для сбора данных. В свою очередь, алгоритм декодирования речи, который использовал Дураивел, работал только с 90 секундами голосовых данных, полученных в ходе 15-минутного теста.
Дураивел и его руководители полны энтузиазма по поводу создания беспроводной версии устройства, разработка которой стала возможной благодаря недавнему гранту в размере 2,4 млн долларов, полученному от Национальных институтов здравоохранения.
Исследование дает надежду людям с неврологическими нарушениями, потерявшим способность к речи. В перспективе они смогут вновь общаться, используя интерфейс «мозг-компьютер».