Ранняя остановка нейросети ускоряет распознавание изображений

12 май, 2021 - 15:43

Сотрудник Национального исследовательского университета в Нижнем Новгороде (ННГУ), разработал алгоритм, способный ускорить обработку видео в системах распознавания изображений в реальном времени почти вдвое, благодаря оптимизации функционирования нейронной сети (CNN).

Чем больше глубина (количество слоёв) в свёрточной нейронной сети (CNN), широко используемой в компьютерном зрении, тем точнее она предсказывает тип объекта на изображении. Однако, с увеличением количества слоёв растёт и время, требуемое для распознавания объектов.

В статье, опубликованной в журнале Information Sciences, её автор, профессор Андрей Савченко, поделился результатами экспериментов по ускорению предварительно натренированных CNN произвольной архитектуры, содержащих от 90 до 780 слоёв нейронов. Предложенный им классификационный алгоритм в зависимости от сложности входного изображения решал, продолжить распознавание или завершить его.

Чтобы распознать «простые» изображения, классификатору было достаточно проанализировать данные (выходы) из первых слоев нейронной сети. Для более «сложных», если проверочной процедурой решение классификатора было объявлено ненадёжным, вычисления в нейронной сети продолжались на промежуточном уровне, после чего проверка надежности повторялась.

«Нет смысла терять время, если мы уже уверены в достоверности принятого решения», – пояснил профессор Савченко.

Результатом применения такого подхода стало увеличение скорости распознавания вплоть до 40% , причём потеря точности из-за «ранней остановки» не превышала 0,5-1%.

Как подчеркнул учёный, наиболее точные решения получаются на последних слоях, поэтому классификаторы необходимо специально обучать удерживать рост погрешности, допустим, в пределах одного процента.