Компания, которая добавляет в свое аналитическое ХД 3 ТБ/день

19 февраль, 2010 - 20:28Дмитрий Гудков

Из какой индустрии может быть компания, которая добавляет в свое аналитическое хранилище данных ни много ни мало 3 ТБ/день? Нет, это не Google. А вот ни за что не догадаетесь :)

Для аналитических хранилищ данных объем в 30-50 ТБ обычно считается уже достаточно большим. Причем этот объем накапливается в течении нескольких лет. Как правило, в первых рядах рекордсменов по объемам хранилищ данных идут телекомы. Потом идут (или шли?) инвестиционные банки (которые еще остались на плаву). Потом ритейлеры. Огромные организации. Но 3 ТБ в день в хранилище из них не загружает никто. Или почти никто.

И тем более удивительно встретить в рядах рекордсменов ... разработчика софта. Это компания Zynga, которая разработывает игры для iPhone, а также Facebook и других сетей. Хранилище данных является краеугольным камнем инфраструктуры Zynga, так как собирает в режиме реального времени игровую информацию от 40 млн игроков, что составляет за сутки более 3 ТБ, моментально раскладываемых на колонки в аналитической СУБД Vertica в кластере из 200 Linux-серверов. Собранная информация анализируется по определенным алгоритмам и тут же предоставляется игрокам в виде рекоммендаций. Все это работает 24 часа в день, 7 дней в неделю, 365 дней в году без остановки.

Разработчики игр. 3 ТБ/день. Кто бы мог подумать.