Loading...

jcomp / Freepik

Исследователи из Сколтеха вместе с коллегами из других организаций нашли быстрый способ распознавания товаров на развес в магазинах с помощью искусственного интеллекта. Новая разработка позволит обучать нейросеть сразу, как только в магазин привезут новые виды продуктов. Работа опубликована в журнале IEEE Access.

В магазинах продолжают внедрять технологии, которые упрощают работу персонала и ускоряют процесс взвешивания товаров и их оплаты. Где-то покупатели должны запомнить код и самостоятельно взвесить товар на весах в зале, а где-то это делают кассиры. «Сложность в том, что в магазинах много визуально похожих сортов фруктов или овощей, часто появляются новые. Классические системы компьютерного зрения нужно переобучать каждый раз, когда появляется новый сорт. Это долго, поскольку нужно собирать много данных о нем, потом вручную размечать их», — объясняет первый автор работы, инженер-программист и аспирант Центра технологий искусственного интеллекта в Сколтехе Сергей Нестерук.

Однако на кассах самообслуживания со встроенными весами покупателю приходится запоминать все коды от своих товаров. При этом контролировать, правильно ли покупатель взвешивает товар, трудно. Российские ученые нашли способ упростить этот процесс с помощью системы компьютерного зрения.

Система PseudoAugment настраивает нейронную сеть для работы с новыми данными о продуктах без длительного процесса сбора и разметки данных. Ее можно настроить даже до того, как новые сорта окажутся на полке магазина. «Ящик с новым сортом можно поставить под камеру и сфотографировать. Далее, используя всего лишь несколько фотографий, алгоритм без ручной разметки извлекает отдельные объекты, потом мы аугментируем (дополняем) изображения, на основе которых можно дообучать нейронную сеть. Мы увидели, что при добавлении новых классов деградация качества распознавания гораздо меньше, чем при обучении без аугментации. Когда будет добавляться много классов, деградация качества все равно начнется, но систему можно переобучать всего раз в несколько недель. Самое главное, что она сможет работать сразу, как только в магазине появится новый продукт», — продолжает Сергей Нестерук.

Дополнить базу данных нужно синтезированными изображениями. Например,перевернутыми картинками или изображением с измененной яркостью. Так данные становятся более разнообразными, а сама модель — надежной.

Сейчас исследователи работают над тем, чтобы улучшить данные и применять их уже в готовых моделях. Специалисты также отмечают, что сфера применения алгоритма не ограничивается супермаркетами: он может помочь обучить системы распознавать однородные объекты (например, на конвейерах).


Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram, Одноклассники.