`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Виталий Кобальчинский

Точность классификации ИИ-моделью ошибок в ПО приближается к 100%

+33
голоса

Компьютерные баги остаются на слуху уже 75 лет, с того дня когда программист Грейс Хоппер (Grace Brewster Murray Hopper) обнаружила источник неполадок в работе Harvard Mark II — бабочку, замкнувшую контакты.

За прошедшее с тех пор время «жучки» стали причиной множества происшествий, зачастую, имевших катастрофические последствия. В 80-х ошибка программиста привела к гибели как минимум, пяти пациентов, проходивших курс лучевой терапии на не вовремя забарахлившей установке Therac-25. В 1962 г., как сейчас полагают, из-за допущенной опечатки при вводе кода, едва начавшись, бесславно закончилась на дне Атлантики миссия посланного к Венере космического зонда Mariner 1.

Стартап Coralogix, предлагающий SaaS-платформу мониторинга программных процессов, утверждает, что на каждые 1000 строк кода приходится, в среднем, 70 ошибок. При этом, на исправление каждой из ошибок уходит в 30 раз больше времени, чем заняло написание самого кода. Только в США на выявление и устранение багов, по оценкам Coralogix, ежегодно тратится 113 млрд долл.

Из сказанного понятно то повышенное внимание, с которым было встречено недавнее заявление компании Microsoft. Она анонсировала успешное создание модели машинного обучения, которая способна точно идентифицировать особо опасные недоработки безопасности в 97 случаях из 100.

В докладе, опубликованном онлайн, Скотт Кристиансен (Scott Christiansen), старший менеджер программы безопасности Microsoft сообщил: «Мы обнаружили, что, сочетая модели машинного обучения с опытом экспертов, можем значительно улучшить выявление и классификацию проблем безопасности».

Ещё более впечатляющую эффективность — 99% — модель Microsoft, демонстрирует определяя, представляет ли найденная ошибка риск для безопасности.

В основу новой системы обнаружения багов Microsoft заложила два статистических алгоритма. Один, под названием частотность терминов — обратная частотность документов (TF-IDF), ведёт поиск в больших собраниях документов по ключевым словам и вычисляет релевантность результатов. Другой — модель логической регрессии (логит) — определяет вероятность возникновения определённого события.

В первую очередь программа разделяет ошибки на безопасные и представляющие угрозу. Затем, для второго класса проблем следует уточнение степени риска с распределением на под-категории: критических, важных и незначительных угроз.

По словам Кристиансена, Microsoft поставила перед ними задачу, создать систему, которая максимально приблизилась бы по точности выявления ошибок к эксперту безопасности.

«Каждый день разработчики ПО видят длинный список функций и ошибок, которые необходимо устранить, — говорит Кристиансен. — Специалисты по безопасности пытаются помочь, используя автоматизированные инструменты для распределения ошибок по приоритетности, но слишком часто инженеры тратят время на ложные срабатывания или упускают критическую уязвимость безопасности из-за ошибочной классификации. Для решения этой проблемы, команды по аналитике данных и безопасности собрались вместе, чтобы исследовать, как тут может пригодиться машинное обучение».

Модель вобрала в себя почти 20 лет исторических данных Microsoft о 13 миллионах программных продуктов и ошибок. Она также постоянно переучивается с учётом новой информации, проверенной экспертами безопасности компании: ведь каждый месяц в репозиториях GitHub и AzureDevOps добавляется почти 30 тысяч свежих ошибок, генерируемых 47 тысячами разработчиков Microsoft.

В конечном итоге Microsoft планирует выложить результаты этой работы с открытым исходным кодом на GitHub.


Вы можете подписаться на наш Telegram-канал для получения наиболее интересной информации

+33
голоса

Напечатать Отправить другу

Читайте также

Пока практика показывает, что подобные победные реляции несколько преждевременны, пример - https://habr.com/ru/company/pvs-studio/blog/496536/

 
 
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT