Бездротовий нейроінтерфейс для керування синтезатором мови

Коли Едвард Чанг і його колеги порівняли звуки мови з сигналами мозку, вони виявили, що однакові акустичні характеристики викликають однакову нейронну відповідь у зоні Вернику, одній з мовних зон мозку. Наприклад, серед згодних є так звані вибухові, які характеризуються однаковою манерою вимови і мають низку загальних звукових креслень. Ось саме такі загальні характеристики, що об'єднують згодні - вибухові, фрикативні або сонорні, - і реєстрували нейрони зони Вернику. Завдяки цьому вмінню мозку розрізняти систематичні ознаки звуків мови ми можемо дізнатися звук «б» незалежно від особливостей дикції мовця.


З'явилася нещодавно можливість реєстрації нейронної активності ділянок головного мозку дала вченим надію на створення в майбутньому імплантантів, які дадуть паралізованим людям можливість використовувати різні керовані «силою думки» протези, включаючи синтезатор мови. Перших успіхів у цій галузі вже досягнуто: проведені експерименти, в ході яких паралізовані люди керували роботизованими кінцівками. Технологія виявилася життєздатною і працює завдяки тому, що вчені з достатньою точністю здатні виявляти збудження нейронів у руховій області кори головного мозку і зіставляти їх з певними рухами рук або ніг.


Завдання створення пристрою, який детектуватиме мозкову діяльність, пов'язану з людською розмовою, все ще не вирішене. Над нею працюють багато наукових установ. Про попередні результати своєї роботи над побудовою бездротового нейрокомп'ютерного інтерфейсу, який може переводити сигнали мозку безпосередньо в чутну мову за допомогою голосового синтезатора повідомив нейрохірург з Каліфорнійського університету Едвард Чанг.

Чанг проводить операції на головному мозку людей, які страждають на епілепсію. Пластина з електродами поміщається під череп пацієнтів для запису електричної активності поверхні мозку. Пацієнти носять такий пристрій, відомий як «electrocorticography array», протягом декількох днів, для того, щоб лікарі могли знайти причину і джерело епілептичного нападу.

Крім основного завдання лікування епілепсії, Чанг має можливість вивчати активність головного мозку своїх пацієнтів у різних ситуаціях. У статті, опублікованій в журналі «Nature» минулого року, він і його колеги описали експеримент, в ході якого вони використовували матрицю електродів для побудови моделі електричної активності в області мозку, званої вентральною сенсомоторною корою, в той час, коли пацієнти вимовляли прості слова, схожі на просто звуки, на подобі «bah» («нісенітрохи»), «goo» («слизь») та ін.

Ідея полягає в тому, щоб записати електричну активність у руховій області кори головного мозку, яка приводить у рух губи, мову і голосові зв'язки, коли людина розмовляє. Математичні розрахунки дозволили команді Чанга стверджувати, що з цих даних вони можуть виділити «багато ключових фонетичних особливостей».

Один з найстрашніших наслідків захворювання, відомого як бічний (латеральний) аміотрофічний склероз (БАС) - параліч, при якому людина не тільки втрачає можливість до пересування, а й до мови. Деякі пацієнти використовують пристрої, які дозволяють використовувати залишкову здатність до спілкування. У випадку Стівена Гокінга, це програмне забезпечення, яке дозволяє дуже повільно по складах вимовляти слова, скорочуючи м'язи щоки. Інші пацієнти використовують пристрої відстеження руху ока («ай-трекери»), щоб керувати комп'ютерною мишкою.

Інше дослідження в цьому ж напрямку провів Марк Слуцький з Північно-Західного університету - він зробив спробу розшифрувати сигнали в руховій області кори головного мозку, в той час, коли пацієнти читають вголос слова, що містять всі 39 фонем англійської мови (згодних і гласних звуків, які складають мову). Команда визначила фонеми з середньою точністю в 36 відсотків. У дослідженні були використані ті ж типи поверхневих електродів, які використовує Чанг.


Слуцький каже, що хоча така точність може здатися дуже низькою, слід взяти до уваги, що вона була досягнута з відносно невеликою вибіркою слів, сказаних в обмежену кількість часу. «Ми очікуємо досягнення набагато кращих результатів декодування в майбутньому», - говорить він.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND