Big Data – «большая волна в заливе»

19 август, 2014 - 15:38Александр Черников

«Большая волна в заливе» – это примерный перевод японского «tsunami». Учитывая, что редко кто ставит в своей операционной системе поддержку иероглифического письма, приведу ниже заголовок (каким он должен бы быть) в виде картинки. Однако суть от этого не меняется – что сегодня думают люди, когда слышат о больших данных или читают о них?

Big Data – «большая волна в заливе»

Например, что вы получаете, когда вводите «большие данные» в строку поиска Google Live Search? Интересно, как люди воспринимают этот термин, – подумал Тимо Эллиотт (см. ниже), – и попробовал это сделать. В результате получилось забавное и довольно ехидное небольшое исследование, результаты которого я здесь и предлагаю вниманию читателей.

Big Data – «большая волна в заливе»

Обратим внимание на каждую из пяти первых ссылок, которые дала Google.

1. «Big Data is Like Teenage Sex»

Это высказывание приписывается Дэну Арили (Dan Ariely) из MIT, который еще 6 января 2013 г. написал крошечный пост в своем Facebook:

«Разговоры о больших данных походят на разговоры подростков о сексе: все они говорят об этом, но никто в действительности не знает точно, как это делается. Все думают, что все остальные это делают, и поэтому утверждают, что они также делают это…»

Это провокационное заявление вызвало много откликов, которые продолжают поступать до сих пор.

Год спустя, 3 февраля 2014 г. упомянутый выше Тимо Эллиотт (Timo Elliott), – который, кстати, в свое время был в первой десятке сотрудников SAP Business Object, – провел указанное исследование «The Google Live Search Summary of Big Data», подчеркнув, что это – его личное мнение и никак не зависит и может не совпадать с мнением его работодателя.

Будучи серьезным специалистом, он не преминул отметить также, что подростки имеют тенденцию быстро взрослеть, и, возможно, теперь они уже достигли уровня «не по наслышке». С другой стороны, год для любой быстро развивающейся технологии – это тоже немало. Все больше крупных предприятий сообщают о том, что они «реально работают с большими данными». И тут же Эллиотт делает еще одну оговорку: «конечно, в зависимости от того, как они определяют их».

И это дает нам повод перейти к рассмотрению следующей сентеции в списке поисковых запросов Google.

2. «Big Data Is Bullshit»

Прекрасно задуманный и действительно очень интересный сайт The Global Language Monitor внес термин «Big Data» в список с длинным, но точным названием: «Технические термины, которые все употребляют, но не все понимают». А многие люди просто ненавидят его. Автор этого блога, скажем так, относится к данному термину с некоторым подозрением.

В частности, критики указывают, что термин «Big Data» применяется чуть ли с Рождества Христова. Вот, например, фрагмент страницы журнала «Marketing Communications» за 1913 г. (любезно предоставленный службой Google Books).

Big Data – «большая волна в заливе»

Далее, наиболее распространенное определение больших данных, известное как «3Vs», было предложено аналитиком Дугом Лэни (Doug Laney) в 2001 г.

Согласно ему, подразумевается, что Big Data представляют информацию большого объема, с высокими скоростями потоков данных и больших изменений в последних (high-volume, high-velocity and high-variety – отсюда 3V), которая требует рентабельных, инновационных форм обработки информации для лучшего ее понимания и принятия обоснованных решений.

New York Times, со своей стороны, считает, что современный смысл Big Data лучше всего сформулировал Джон Р.Мэши (John R.Mashey), руководитель исследовательских работ в Silicon Graphics в середине 1990-х гг.

Одну из своих презентаций 1998 г. он назвал «Big Data and the Next Wave of Infrastress», имея в виду ожидаемые проблемы с «перевариванием» данных, объемы которых уже тогда росли в геометрической прогрессии.

Сам термин «Infrastress», Мэши, по его словам, употребил, чтобы единым словом передать воздействие больших данных на человечество.

3. «Big Data is The Future»

Не будет преувеличением сказать, что существует много различных определений больших данных, с которыми просто невозможно согласиться большинству специалистов. Но одна позиция кажется достаточно четкой и общепринятой: новые информационные технологии увеличили наши возможности сохранять и анализировать большие массивы данных. К ним в первую очередь, как правило, относят Hadoop и базы данных класса «NoSQL», а также быструю обработку данных в оперативной памяти (fast in-memory processing).

Если вы заинтересовались примерами того, как люди используют большие данные сегодня, обратитесь к книге «The Human Face of Big Data» Рика Смолана (Rick Smolan). Этот сайт, безусловно, любопытно полистать и, по крайней мере, представить уровень проблем, связанных с большими данными.

4. «Big Data is Dead»

Gartner полагает, что технология, само понятие, термин и вся, связанная с ними информационная инфраструктура в 2013 г. достигли пика «больших ожиданий» и теперь готовы к спуску в неизбежную «пропасть крушения иллюзий».

Big Data – «большая волна в заливе»

Другими словами, ожидается, что скоро всеядные около-IT журналисты потеряют живой интерес к пока еще горячей теме больших данных (специалисты уже прошли этот этап). И все будут говорить только о «данных», старательно избегая замусоленной приставки, чтобы не прослыть простаком или ретроградом.

5. «Big Data is Watching You»

Ну, это – вечная и беспроигрышная тема – «Большой Брат наблюдает за вами». Казалось бы, здесь все уже сказали Евгений Замятин («Мы») и Рэй бредбери («451 по Фаренгейту»). Однако сама идея так сладостно-противна, что многим людям очень нравится воображать, что за ними и в самом деле есть смысл кому-то постоянно следить.

Какой ужас! Наш мобильный телефон и платежные транзакции по кредитной карте могут дать страшно-подробный вид того, как мы тратим свою жизнь каждую минуту. Вот еще несколько типичных страшилок.

RFID-чипы в наших паспортах, банковских кредитных карточках, и одежде постоянно автоматически считываются, как только мы оказываемся рядом с чувствительным элементом.

Ваш автомобиль фиксирует текущую скорость и другие данные, которые могут быть использованы против вас в случае аварии (кстати, в Европе серьезно обдумывают возможность принудительной остановки и блокирования любого автомобиля при необходимости).

Камеры и соответствующее ПО распознавания лиц постоянно отслеживает вас на улице.

Сетевые бытовые приборы (или «умный дом» в хужшем смысле этого слова) всегда сообщат в реальном времени, кто сейчас дома и что делает. За вами следят стиральная машина, микроволновка и даже сливной бачок в туалете.

Это мы еще не говорим о носимых (wearable) технологиях типа Google Glass, где достаточно просто подмигнуть в нужном случае.

Видели ли вы кнопку «Login with Facebook»? Вот данные, которые при этом передаются на третьи сайты.

Big Data – «большая волна в заливе»

И, конечно, в соответствующие службы во всем мире, которые хранят эту информацию. И гигантские хранилища данных, где можно осуществить соответствующий поиск за многие прошедшие годы.

Большие данные? Ну полно, полно вам…

Таким образом, большие данные – сегодня это в первую очередь мощное оружие. Использование их предприятиями выглядит детской забавой по сравнению с некоторыми уже реализованными правительственными проектами.

Каково резюме? Люди должны в первую очередь научиться использовать большие данные мудро, а разработчики – рассматривать связанные с ними этические проблемы.