MapReduce против баз данных

25 января 2008 г., 11:11

Если есть свободное время и интерес к последним течениям в области баз данных, то можно ознакомиться со статьей MapReduce: a major step backwards Дэвида Дьюуитта, и несколько ответов на нее - от Грега Линдена, который теперь в Microsoft, и от Марка Чу-Каролла, который в Google, однако поддерживает MapReduce не из-за работодателя, а по собственной инициативе.

Авторы статьи в Database Column утверждают, что MapReduce - это шаг назад, т.к. вместо дизайна кластера баз данных инженеры занялись изобретением велосипеда, отказавшись от реляционной модели хранения данных, и положившись на файлы, таким образом отказавшись от индексации и прочих благ. Их оппоненты утверждают, что существует ряд задач, для которых MapReduce практически идеален, а вот базы данных трудно адаптировать.

Из своего опыта все-таки соглашусь с оппонентами. В моей нынешней компании приходится работать как с распределенными базами данных, так и с обширными обьемами данных, которые хранятся в файлах. Мы используем MySQL для баз данных и написанную в домашних условиях утилиту для прогона запросов по нескольким тысячам БД и аггрегации результатов в единое целое, что в принципе работает неплохо. Для распределенных подсчетов используется Hadoop, для которого написание сценариев map и reduce занимает в среднем полчаса, и в итоге тоже работает неплохо.

Стратегія охолодження ЦОД для епохи AI

Напечатать Отправить другу

Читайте также

Як OpenAI обслуговувує 800 млн користувачів ChatGPT
[29 января] – Євген Куліков
Серверы могут получать данные намного быстрее
[22 февраля 2020 г.] – Леонід Бараш
Зачем 68% компаний директор по данным?
[26 июля 2019 г.] – Євген Куліков
Дорога в облака
[10 июля 2019 г.] – Артем Юрченко
Intel Optane SSD и коммуналка
[23 февраля 2018 г.] – Юрий Жуковский

Александр Москалюк - все записи блога
Войдите или зарегистрируйтесь, чтобы вы могли писать комментарии
Подписаться на тип материалов: блог
Подписаться на обсуждение сообщения
Подписаться на этот блог

Андрей Ясинецкий | 17 сентября 2010 г., 14:26 | ссылка

Я считаю не совсем корректно сравнивать именно в таком контексте как "MapReduce ПРОТИВ баз данных".

Речь ведь не идет о том, чтобы заменить одно другим. Google предложил концепцию MapReduce для решения конкретных задач, связанных с обработкой большого кол-ва данных. В этом сегменте данная концепция отлично работает, но она НЕ заменяет ни реляционные базы данных, ни любые другие.

В частности, Google для поддержания технологии пришлось разработать собственное хранилище BigTable, потому что реляционная модель тут плохо ложится.

В Apache Hadoop, например, для тех же целей присутствует HBase.

Я что хочу сказать – MapReduce и сопутствующие решения не предназначены для хранения данных и тем более для интерактивного взаимодействия с пользователем. Это решения исключительно для расчета/аггрегации/обработки данных, которые потом куда-то можно уже аккуратненько сложить.

Войдите или зарегистрируйтесь, чтобы вы могли писать комментарии

Чи використовує ваша компанія ChatGPT в роботі?

Колонка

BEST CIO

Человек года

Продукт года

Александр Москалюк

MapReduce против баз данных

Читайте также

Останні обговорення

ТОП-новости

ТОП-блоги

ТОП-статьи