NVIDIA создала открытую платформу для анализа Big Data и машинного обучения

11 октябрь, 2018 - 11:10

NVIDIA создала открытую платформу для анализа Big Data и машинного обучения

Компания NVIDIA анонсировала платформу GPU-ускорения для обработки больших массивов данных и машинного обучения, получившую широкую поддержку у лидеров индустрии. Новая платформа позволяет анализировать огромные массивы данных и молниеносно делать точные прогнозы для бизнеса.

Открытое ПО Rapids обеспечивает аналитикам большой прирост производительности в бизнес-задачах высокой сложности, таких, как предсказание мошенничества в операциях с кредитными картами, прогноз запаса товаров на складе, прогнозирование покупательского поведения потребителей. Rapids уже получила широкую поддержку – от новичков в области разработки открытого ПО, таких, как Databricks и Anaconda, до технологических лидеров индустрии, таких, как Hewlett Packard Enterprise, IBM и Oracle.

Аналитики оценивают ежегодный объем серверного рынок анализа данных и машинного обучения в 20 млрд долл. Вместе с рынком решений для научных исследований и глубокого обучения совокупный объем рынка высокопроизводительных вычислений оценивается примерно в 36 млрд долл.

Rapids включает набор открытых библиотек для анализа, машинного обучения и, совсем скоро, визуализации данных с GPU-ускорением. Эта платформа разрабатывалась инженерами NVIDIA более двух лет в тесном сотрудничестве с ключевыми разработчиками открытого ПО.

Специалисты впервые получают необходимые инструменты, чтобы целиком запустить конвейер обработки данных на GPU. Первые тесты Rapids с алгоритмом машинного обучения XGBoost для обучения на системе NVIDIA DGX-2 показали 50-кратный прирост производительности по сравнению с системами на базе CPU. Это позволяет сократить время обучения с нескольких дней до нескольких часов и с нескольких часов до нескольких минут в зависимости от объема набора данных.

Платформа Rapids базируется на популярных открытых проектах, включая Apache Arrow, pandas и scikit-learn, наделяя GPU-ускорением самые популярные инструменты для обработки данных на Python.