Baidu открыла код программы машинного обучения

18 январь, 2016 - 13:45

Baidu открыла код программы машинного обучения

Следуя по стопам за своим конкурентом, Google, открывшим в ноябре исходники TensorFlow, ведущая китайская веб-компания Baidu выложила в репозитории открытого кода GitHub свои программные реализации алгоритмов искусственного интеллекта (ИИ). Разработанное в её калифорнийской лаборатории SVAIL (Silicon Valley AI lab) ПО WARP-CTC предназначено для улучшения распознавания речи более комплексным программным движком Deep Speech 2.

Функцией WARP-CTC в Deep Speech 2 было распознавание английского и северокитайского (путунхуа) языков, причём, в некоторых случаях, программа справляется с этой задачей лучше людей. «Для коротких фраз, вырванных из контекста, мы, по всей видимости, превосходим человеческие уровни распознавания», — подтвердил научный директор Baidu, Эндрю Нг (Andrew Ng).

В основу WARP-CTC положена фундаментальная технология искусственного интеллекта CTC (Connectionist Temporal Classification). Посчитав существующие реализации CTC слишком медленными и сложными, команда разработчиков Baidu распараллелила этот алгоритм, что добавило ему быстродействия и функциональности.

Baidu открыла код программы машинного обучения

Опубликованное вчера ПО включает в себя простой интерфейс для языка C и связующие компоненты для пакета научных расчётов Torch. Это упростит интеграцию WARP-CTC в существующие проекты глубокого обучения. Фирма Nervana также использует WARP-CTC в neon — библиотеке глубокого обучения, базирующейся на Python.

В секции вопросов и ответов на своём сайте Baidu пишет: «... мы хотим упростить и ускорить глубокое обучение, чтобы обеспечить исследователям более быстрый прогресс ... мы хотим начать делать вклад в сообщество машинного обучения, предоставив важную часть созданного нами кода».

Baidu приглашает к общению всех, использующих открытое ПО WARP-CTC и рассчитывает в будущем опубликовать и другие средства ИИ.