Loading...
Продолжая работу с сайтом, вы подтверждаете использование файлов cookies вашего браузера, чтобы гарантировать максимальное удобство, предоставляя персонализированную информацию. Если вы не согласны с тем, чтобы мы использовали данный тип файлов, то вы должны установить соответствующие настройки вашего браузера или не использовать сайт.
Больше информации...
«Мы смогли существенно увеличить количественные показатели распознавания паралингвистических явлений в речи благодаря правильному выбору предварительно обученных нейросетевых моделей с их последующим дообучением на имеющихся ограниченных данных, а также комплексированию различных архитектур нейронных сетей. Компьютерные технологии и системы, разработанные в рамках данного исследования, в дальнейшем могут применяться в медицине, например для контроля состояния здоровья и психоэмоционального состояния людей, а также для выявления больных пневмонией с целью предупреждения распространения пандемии», — объясняет руководитель проекта по гранту Российского научного фонда Алексей Карпов.
Паралингвистика — раздел языкознания, изучающий невербальные (внеязыковые) средства, передающие информацию в тексте или речи вместе с вербальными средствами. Компьютерная паралингвистика занимается автоматическим распознаванием естественных эмоциональных и психофизиологических состояний и характеристик говорящего человека, включая его возраст, пол, диалект, заболевания, эмоции и прочее.
Ученые из СПб ФИЦ РАН и Университета ИТМО совместно с коллегами из Ульмского и Утрехтского университетов приняли участие в международных соревнованиях ComParE, где решали задачи, касающиеся обработки разговорной речи, при помощи методов искусственного интеллекта, цифровой обработки сигналов, аффективных и поведенческих моделей. Ученые заняли первые места в конкурсах «Распознавание эмоций пожилых людей» и «Определение фазы дыхания человека по речи». Третьей задачей организаторы объявили «Распознавание наличия медицинской маски по речи диктора».
В рамках первой задачи становится возможным следить за психоэмоциональным состоянием людей пожилого возраста, чтобы при необходимости оперативно оказать медицинскую помощь. Ученые считают, что акустические особенности речевых сигналов и эмоциональных выражений у пожилых людей значительно отличаются от характеристик других возрастных групп. При решении второй задачи ученые искали способ анализа непрерывной речи для сопоставления с дыхательными сигналами от пьезоэлектрического ремня, закрепленного на человеке. Для решения третьей задачи был использован метод на основе ансамбля современных нейронных сетей глубокого обучения, обученных на предоставленных организаторами соревнований аудиоданных речи немецких врачей в хирургических масках.
Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram, Одноклассники.