Из какой индустрии может быть компания, которая добавляет в свое аналитическое хранилище данных ни много ни мало 3 ТБ/день? Нет, это не Google. А вот ни за что не догадаетесь :)
Для аналитических хранилищ данных объем в 30-50 ТБ обычно считается уже достаточно большим. Причем этот объем накапливается в течении нескольких лет. Как правило, в первых рядах рекордсменов по объемам хранилищ данных идут телекомы. Потом идут (или шли?) инвестиционные банки (которые еще остались на плаву). Потом ритейлеры. Огромные организации. Но 3 ТБ в день в хранилище из них не загружает никто. Или почти никто.
И тем более удивительно встретить в рядах рекордсменов ... разработчика софта. Это компания Zynga, которая разработывает игры для iPhone, а также Facebook и других сетей. Хранилище данных является краеугольным камнем инфраструктуры Zynga, так как собирает в режиме реального времени игровую информацию от 40 млн игроков, что составляет за сутки более 3 ТБ, моментально раскладываемых на колонки в аналитической СУБД Vertica в кластере из 200 Linux-серверов. Собранная информация анализируется по определенным алгоритмам и тут же предоставляется игрокам в виде рекоммендаций. Все это работает 24 часа в день, 7 дней в неделю, 365 дней в году без остановки.
Разработчики игр. 3 ТБ/день. Кто бы мог подумать.