Loading...

Российские ученые приблизились к созданию системы цифровой обработки речи в реальных звуковых условиях, например, при одновременном разговоре сразу нескольких людей. Они смоделировали процесс рецепторного кодирования звуков с помощью имитации работы периферической части нервной системы, которая отвечает за слух. Результаты работы опубликованы в журнале International Conference on Neuroinformatics.

Нервная система обрабатывает информацию в форме электрических сигналов. Восприятие внешней среды обеспечивается периферическими отделами нервной системы – анализаторами. Они отвечают за преобразование внешних воздействий в поток электрических импульсов для интерпретации высшими отделами центральной нервной системы. Благодаря этому преобразованию человек может без каких-либо значительных усилий распознать голос собеседника даже при сильном шуме. При этом существующие автоматизированные алгоритмы не справляются с этой задачей.

«Наша глобальная цель – приблизить возможности машины к способностям человека, достичь уровня машинного восприятия акустических сигналов в реальных условиях, ‒ говорит сотрудник отдела вычислительных систем Суперкомпьютерного центра «Политехнический» Антон Яковенко. – Нам уже удалось смоделировать значительную выборку образцов нервной деятельности для гласных фонем и предложить подход, сочетающий нейронные сети и теорию графов. Даннве обрабатывает специальный алгоритм, который осуществляет их анализ, чтобы описать каждую фонему. Как отмечают ученые, анализ реакции модели слухового нерва человека позволил идентифицировать гласные в шумной обстановке и превзошел по качеству наиболее распространенные на сегодняшний день методы параметризации акустических сигналов».

Методы, которые разрабатывают российские ученые в перспективе позволят создать нейрокомпьютерные интерфейсы нового поколения, а также обеспечить более качественное взаимодействие между человеком и машиной. Разработанные алгоритмы могут потенциально применяться во многих областях: кохлеарной имплантации (хирургическое восстановление слуха), разделении звуковых источников, создании новых бионических методов распознавания речи и акустических колебаний.

«Реализуемые в рамках исследования алгоритмы обработки и анализа больших данных сами по себе универсальны и могут применяться для решения прикладных задач, не связанных с акустическими сигналами», – добавил Антон Яковенко.


Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram, Одноклассники.