Доцент кафедры инженерной кибернетики Университета МИСИС, к.м.н., математик и врач Александра Бернадотт разработала алгоритмы, значительно повышающие точность распознавания ментальных команд роботами за счет оптимизации подбора словаря. Алгоритмы, имплементированные в роботизированные устройства, могут быть использованы для передачи информации в условиях повышенного уровня шума. Результаты были опубликованы в рецензируемом международном научном журнале Mathematics.
Задача повышения точности классификации объектов –аудио-, видео- или электромагнитных сигналов – при составлении так называемых «словарей» устройств стоит перед разработчиками самых различных систем, способных существенно улучшить качество жизни человека.
Самым понятным примером могут служить голосовые помощники, например, Салют от Сбера, Яндекс Алиса и др. Устройства передачи аудио или видео для дистанционного управления объектом в зоне прямой видимости, используют ограниченный набор команд. В то же время, важно, чтобы классификатор команд на основе нейронной сети точно понимал и не путал между собой команды, входящие в словарь устройства. При этом точность распознавания не должна опускаться ниже определенного значения при наличии посторонних шумов.
Подбор команд также очень важен для интерфейса мозг-компьютер (нейроинтерфейса), который используется людьми с нарушениями движения для дистанционного управления курсором или роботизированной рукой. Устройство воспринимает и распознает паттерны электрической активности мозга, когда человек думает о той или иной команде.
Сложность заключается в том, что эти паттерны схожи для слов с похожим значением или звучанием. В связи с этим, классификация ментальных или других команд из конкретного словаря для проектирования устройств ввода с использованием звукового или электромагнитного сигнала является серьезной проблемой. Однако на практике для управления большинством роботизированных устройств достаточно 16–20 команд, и приоритет отдается не многообразию объектов в словаре, а качеству их распознавания.
Алгоритмы Maximin и Maximal, предложенные Александрой Бернадотт в ее работе, позволяют подобрать набор объектов словаря для максимизации точности классификации при уменьшении времени подбора словаря команд на пять порядков по сравнению с полным их перебором.
«Существующие алгоритмы, как правило, работают на уровне увеличения точности классификации уже созданного словаря. Я же посмотрела на этот вопрос с точки зрения оптимизации самого процесса подбора команд словаря. Алгоритм Maximin эффективен, если словарь достаточно объемный и нужно, чтобы слова распознавались одинаково хорошо. Алгоритм Maximal же используется, если нужно увеличить точность распознавания, но на подбор словаря у нас значительно больше ресурсов. Алгоритмы основаны на представлении набора k команд в виде взвешенного k-дольного графа. Каждая доля графа соответствует семантическому классу эквивалентности. Ребра графа имеют веса, соответствующие значению статистического признака Колмогорова-Смирнова, полученного на распределениях n-мерных сигналов ментальных команд, относящихся к разным классам эквивалентности – к разным долям. Нахождение на данном графе клики с максимальным или максиминным суммарным весом даёт искомый словарь команд, которые классифицируются с точностью не ниже заданной. Использовать данный алгоритм можно не только для разработки нейроинтерфейса. Его можно использовать в широкой области передачи информации,– пояснила Александра Бернадотт, к.м.н., математик и врач, доцент кафедры инженерной кибернетики Университета МИСИС, сотрудница механико-математического факультета МГУ.
Исходный код предложенных алгоритмов размещен на GitHub, и с ним можно свободно ознакомиться и использовать для дальнейших исследований.
Следующим этапом исследований будет применение алгоритма на существующих данных и теоретическое обоснование более общей задачи.