Группа специалистов из «Сколтеха» и других организаций создала новый способ распознавания товаров на развес в магазине. По словам создателей, новая разработка ускорит обучение нейронной сети, когда в магазин привезут новые виды товаров. Исследование уже опубликовано в журнале IEEE Access. Об этом информационной службе Хабра рассказали в пресс‑ службе «Сколтеха».
Исследователи из «Сколтеха» предлагают упростить процесс определения и взвешивания товара с помощью системы компьютерного зрения. По словам первого автора работы, инженера‑программиста и аспиранта Центра технологий искусственного интеллекта «Сколтеха» Сергея Нестерука у существующих инструментов есть ряд недостатков, например, в магазинах много визуально похожих сортов фруктов или овощей, часто появляются новые. Классические системы компьютерного зрения нужно переобучать каждый раз, когда появляется новый сорт. Это долго, поскольку нужно собирать много данных о нём, потом вручную размечать их.
Новый подход PseudoAugment позволяет настраивать нейронную сеть для работы с новыми классами без длительного процесса сбора и разметки данных. Систему можно настроить даже до того, как новые сорта окажутся на полке магазина. К примеру, ящик с новым сортом можно поставить под камеру и сфотографировать. Далее, используя всего лишь несколько фотографий, алгоритм без ручной разметки извлекает отдельные объекты, потом дополняет изображения, и на их основе можно дообучать нейронную сеть. Как заявили разработчики метода, при добавлении новых классов деградация качества распознавания гораздо меньше, чем при обучении без аугментации. Когда будет добавляться много классов, деградация качества всё равно начнётся, но систему можно переобучать всего раз в несколько недель. Самое главное, что она сможет работать сразу, как только в магазине появится новый продукт.
Процесс дообучения называется аугментация изображений. Она подразумевает дополнение снятых фото синтезированными изображениями (визуальной трансформацией исходных данных). К таким трансформациям относится, например, переворачивание изображений, изменение их яркости, добавление шума и так далее. С помощью аугментации повышается разнообразие данных, а сама модель становится надёжнее.
Создатели нового метода считают, что он вносит вклад в активное развитие датацентрического подхода, когда исследователи работают над улучшением данных и применяют их в уже готовых моделях. Сфера применения алгоритма не ограничивается супермаркетами. Его можно использовать для обучения распознавания однородных объектов, например на конвейерах для сортировки семян или твёрдых бытовых отходов.
Источник новости: habr.com