Loading...

«Умный город» — это одно из направлений развития концепции интернета вещей, в задачи которого входит интеграция большого количества информационных потоков, исходящих от самых разных источников (начиная от сотовых телефонов жителей, заканчивая камерами видеонаблюдения), для мониторинга, а также повышения эффективности принятия управленческих решений. Для работы с данными из различных источников сегодня в сервисах «Умного города» активно применяются нейронные сети, которые могут анализировать значительные объемы информации. Важная задача в процессе обучения нейросетей — обеспечение безопасности персональных данных пользователей и служебной информации о городских системах.
Одним из новых подходов для этого является федеративное обучение — это метод машинного обучения, который позволяет «тренировать» нейросеть на множестве разрозненных устройств (клиентов) без необходимости передавать их локальные данные на какой-то единый сервер, то есть вместо того чтобы отправлять «сырые» данные (фотографии, показания датчиков, логи) в централизованное облако, каждое устройство обучает модель на своих данных локально. Затем устройства отправляют на сервер только обновления параметров нейросети. Центральный сервер лишь объединяет эти обновления, улучшая общую модель. Таким образом, федеративное обучение сохраняет конфиденциальность данных.
«Мы усовершенствовали один из широко используемых алгоритмов для федеративного обучения нейросетей FedBN (Federated via Local Batch Normalization). Его модифицированная версия MFedBN в экспериментах по обучению моделей на датасетах информации с датчиков "умного города" превосходит базовый FedBN. Работоспособность и превосходство предложенного алгоритма над базовыми аналогами были доказаны в ходе серии экспериментов на двух принципиально разных задачах — мониторинге поведения коммерческого транспорта и обеспечении сетевой безопасности. В частности, при тестировании на данных сенсоров грузовых автомобилей алгоритм достиг точности классификации 85%, а в задаче обнаружения киберугроз и сетевых вторжений — 99,98%», — рассказал руководитель исследовательского проекта, проректор по цифровой трансформации СПбГЭТУ «ЛЭТИ» Иван Холод.
Главная инновация MFedBN заключается в усовершенствовании механизма сбора информации на сервере: вместо традиционного усреднения данных моделей, полученных от клиентов, новый алгоритм использует градиентный подход с контролируемой скоростью обучения локальных моделей. Это позволяет глобальной модели более плавно и устойчиво адаптироваться к локальным особенностям данных, избегая резких колебаний, свойственных стандартным методам при работе с разнородной информацией.
Эксперименты по федеративному обучению с применением MFedBN проводились на двух наборах данных систем «Умного города»: на данных сенсоров грузовых автомобилей и данных по сетевым атакам. Также ученые разработали новую методологию генерации наборов данных, которая позволяет моделировать реалистичные сценарии распределения информации для более качественного тестирования систем федеративного обучения.
«Полученные результаты могут быть интересны компаниям, которые обучают нейросети для применения в транспортной отрасли, в системах промышленного интернета вещей, в сетевой инфраструктуре, в медтехнике и в других сферах на весьма разнородных данных. Другое перспективное направление — MFedBN позволит создавать более надежные модели обеспечения кибербезопасности, не нарушая требований к приватности данных», — отметила заведующая кафедрой информационных систем СПбГЭТУ «ЛЭТИ» Евгения Новикова.
Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram, Одноклассники.