Mindtech выпускает генератор данных и пакет ИИ-инструментов

17 сентябрь, 2019 - 15:05
Mindtech выпускает генератор данных и пакет ИИ-инструментов

Британский стартап Mindtech представил решение Mindtech Chameleon Simulator, ориентированное на создание массивов синтетических визуальных данных для обучения нейронных сетей.

Эффективное обучение нейронных сетей для обработки видеоинформации требует чрезвычайно больших массивов изображений с реальными аннотациями, и доступ к этим массивам является основным препятствием для большинства компаний, желающих выйти на рынок. Chameleon Simulator представляет собой весьма экономичный инструмент для создания неограниченных объемов объективных данных обучения. Инструмент позволяет с легкостью генерировать широкий спектр абсолютно достоверных аннотаций, включая маски Pixel Perfect, точные данные диапазона и их производные — например, сведения о скорости.

Реальная информация подвержена многочисленным ограничениям, преодолеть которые позволяют синтетические данные Chameleon. Продукт способен моделировать сложные пограничные случаи, осуществлять высокоточный синтез целевой системы заказчика (искажения линз, датчиков, процессов обработки информации) и создавать массивы данных, не обремененных вопросами конфиденциальности/GDPR.

Разработчики подготовили оптимальные рыночноориентированные пакеты, позволяющие клиентам оперативно создавать рабочую среду, подходящую для прикладных сценариев автомобильной отрасли, автоматизированного машинного производства, розничной торговли и систем безопасности. По желанию клиентов компания может предоставлять индивидуальные пакеты.

ИИ-инструменты Chameleon прощают задачи первичной обработки больших объемов данных. Они управляют процессами слияния, верификации и дополнения массивов информации для их дальнейшего использования в таких стандартных отраслевых фреймворках, как TensorFlow и Caffe2. Инструменты предоставляют отчеты и визуализируют статистические данные для итогового анализа.

Использование синтетических данных повышает точность нейронных сетей, позволяет активно сокращать процент искажений, а также значительно сокращает объём необходимых «реальных» данных, эконом время и деньги.

«Достаточное количество разнообразных, высококачественных, маркированных изображений имеет решающее значение для обучения и валидации современных визуальных ИИ-решений, — подчеркнул основатель Embedded Vision Alliance Джефф Бьер (Jeff Bier). — Синтетические изображения, вроде тех, что создаются инструментами Mindtech Chameleon, способны упростить сложную задачу сорсинга больших объемов маркированных реальных визуальных данных. Подобный подход особенно перспективен для прикладных сценариев, в которых разработчикам нужны кадры, получить которые в физическом мире крайне затруднительно, — например, по причине чрезвычайной дороговизны их постановки».