`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Google сформулировала рекомендации по разработке систем масштабируемого машинного обучения

0 
 

В блоге научных разработок Google опубликованы основные характеристики системы машинного обучения Seti и представлены первые выводы о том, на что следует обратить внимание при создании таких проектов. Масштабируемое машинное обучение – важная область исследования и разработки, его можно применить к большому спектру практических задач.

Система машинного обучения Seti разрабатывается уже несколько лет, сейчас она умеет обрабатывать большие выборки и стала самой широко используемой системой классификации в Google. Точность Seti сопоставима (на малых выборках) с другими широко используемыми классификаторами. Но, в отличие от них, в среднем в выборках, для анализа которых используется Seti, содержится 100 млрд объектов и 1 млрд признаков. При этом медианы числа объектов и числа характеристик по выборкам равны 1 млрд и 10 млн соответственно.

При разработке Seti было сделано немало ошибок, но некоторые технические решения оказались очень удачными. Основываясь на опыте разработки Seti, можно дать несколько рекомендаций по созданию точных масштабируемых классификаторов.

1. Делайте систему простой, даже если это приведет к небольшой потере точности. Высокая точность очень важна, однако не менее актуальны простота в использовании и надежность. Ранние версии Seti обладали большей точностью на больших наборах данных, но были очень сложны и создавали большую нагрузку на сеть и на GFS –немногие команды разработчиков хотели их опробовать.

2: Начните с разработки под несколько конкретных задач. Создать общецелевую систему машинного обучения, которая не нацелена на конкретные приложения, весьма заманчиво. Но в Google решили сосредоточиться на ограниченном круге конкретных задач классификации – это позволило отсечь ненужные части будущей реализации. Реальные задачи направляют процесс принятия решений, иначе, например в Seti сложно было бы даже определиться с форматом входного файла. В то же время, система, хорошо работающая с небольшим числом задач, вероятно может оказаться полезной и при решении других задач.

3. Умейте сказать «Нет». Используя систему машинного обучения, подвергаешься соблазну советовать её использование каждому. Нужно учесть, что при всех достоинствах использование машинного обучения добавляет сложности, непрозрачности и непредсказуемости в систему. Часто более простые технологии оказываются эффективнее только за счет того, что работают стабильнее. А в долгосрочной перспективе может оказаться, что инвестиции в интеграцию, поддержку, исправление ошибок в системе машинного обучения могли быть использованы более эффективно.

Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365

0 
 

Напечатать Отправить другу

Читайте также

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT