Logo    
Деловая газета CitCity.ru citforum.ck.ua - все об Open Source Форумы Все публикации Учебный центр Курилка
CitForum    CITForum на CD    Подписка на новости портала Море(!) аналитической информации! :: citforum.ck.ua
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

Monday, 03-Mar-2008 10:59:11 EET

Google
WWW citforum.ck.ua
2007 г.

Конец архитектурной эпохи, или Наступило время полностью переписывать системы управления данными

Майкл Стоунбрейкер, Сэмюэль Мэдден, Дэниэль Абади, Ставрос Харизопулос, Набил Хачем, Пат Хеллэнд

Пересказ: Сергей Кузнецов

Оригинал: , , , , , . The End of an Architectural Era (It's Time for a Complete Rewrite). Proceedings of VLDB, 2007, Vienna, Austria

Аннотация

В статьях [SC05, SBC+07] некоторые авторы данной статьи предсказывали конец парадигмы «безразмерности» («one size fits all») коммерческих реляционных СУБД. В этих статьях показывалось, что производительность основных РСУБД в областях хранилищ данных, обработки потоков данных, обработки текстовых данных и научных баз данных может быть превзойдена специализированными программными средствами на один-два порядка величин.

В предположении, что специализированные программные средства будут со временем доминировать в перечисленных областях, для линий кода существующих реляционных СУБД оставались бы открытыми рынок обработки бизнес-данных (OLTP) и гибридные рынки, на которых одновременно требуется несколько возможностей. В настоящей статье демонстрируется, что специализированные программные средства могут превзойти почти на два порядка производительность существующих РСУБД и на рынке OLTP. Приводятся результаты сравнения производительности на эталонном транзакционном тестовом наборе TPC-C прототипа H-Store, разработанного в MIT, с производительностью популярной РСУБД.

Авторы приходят в заключению, что линии кода существующих РСУБД, претендующие на «безразмерность», в действительности ни в чем не могут превзойти специализированные решения. Поэтому эти унаследованные линии кода 25-летней давности следует отправить в отставку и заменить их набором разработанных с нуля специализированных программных средств. Компании, производящие СУБД (и исследовательское сообщество), должны начать свою работу заново с чистого листа и приступить к разработке систем, удовлетворяющих завтрашним требованиям, вместо того, чтобы продолжать проталкивать на рынке линии кода и архитектуры, разработанные с учетом вчерашних потребностей.

Содержание

1. Введение
2. Архитектурные соображения по поводу СУБД, ориентированных на OLTP
2.1 Основная память
2.2 Многопотоковость и управление ресурсами
2.3 Grid-компьютинг и массивная модернизация (Fork-lift Upgrade)
2.4 Высокий уровень доступности
2.5 Никаких ручек управления
3. Предположения о транзакциях, обработке и среде
3.1 Характеристики транзакций и схем
4. Краткий обзор H-Store
4.1 Архитектура системы
4.2 Выполнение запросов
4.3 Дизайнер баз данных
4.4. Управление транзакциями, репликация и восстановление
5. Сравнение производительности
5.1 Классы запросов
5.2 Реализация
5.3 Результаты
6. Некоторые комментарии по поводу мира, в котором один размер не является пригодным для всех
6.1 Реляционная модель не обязательно является решением
6.2 SQL также не является решением
7. Резюме и планы на будущее
Ссылки

1. Введение

Все популярные реляционные СУБД берут свое начало от системы System R, разработанной в 70-е годы прошлого века. Например, СУБД DB2 является прямой наследницей System R, и на первый выпуск этой системы оказала сильнейшее влияние подсистема RDS System R. Аналогично, MS SQL Server – это непосредственный наследник Sybase System 5, на разработку которой очень сильно повлияла System R. Наконец, в первом выпуске Oracle был напрямую реализован пользовательский интерфейс System R.

Все три перечисленные системы были построены более 25 лет тому назад, когда характеристики аппаратуры существенно отличались от тех, которые имеются сегодня. Процессоры обладают тысячекратно большей мощностью, а память – тысячекратно большей емкостью. Невероятно возросли объемы дисковой памяти, позволяющие теперь долговременно сохранять все, что заблагорассудится. Однако пропускная возможность канала между диском и основной памятью растет гораздо медленнее. Можно было ожидать, что скорость развития компьютерных технологий в последней четверти минувшего столетия приведет к существенным изменениям архитектуры систем баз данных, но, как это не странно, архитектура большинства СУБД, по существу, остается идентичной архитектуре System R.

Кроме того, в то время, когда задумывались реляционные СУБД, существовал единственный рынок СУБД – рынок систем обработки бизнес-данных. За прошедшие 25 лет образовался ряд других рынков: хранилищ данных, обработки текстовых данных, обработки потоковых данных. В этих областях имеются совсем другие требования, чем в области обработки бизнес-данных.

Наконец, во времена разработки РСУБД основным устройством, поддерживающим интерфейс с конечными пользователями, являлся алфавитно-цифровой терминал, и в качестве конечных пользователей производители имели в виду операторов, вводящих в интерактивном режиме запросы по приглашению, появляющемуся на экране терминала. Теперь конечные пользователи имеют дело с мощными персональными компьютерами, подключенными к Web. На Web-сайтах, на которых используются транзакционные СУБД, редко выполняются интерактивные транзакции, а их пользователям вряд ли предоставляются интерфейсы на основе SQL.

Итак, существующие сегодня РСУБД разрабатывались в расчете на рынок обработки бизнес-данных в то время, когда имелись совсем другие интерфейсы пользователей, а аппаратура обладала совсем другими характеристиками. Эти РСУБД обладают рядом архитектурных черт, унаследованных от System R:

  • структуры хранения данных и индексов, ориентированные на дисковую память;
  • использование многопотоковости для сокрытия временных задержек;
  • механизмы управления параллельным доступом на основе блокировок;
  • восстановление на основе журналов.

Конечно, с годами в этих архитектурах появились некоторые расширения, включающие поддержку сжатия данных, параллельное управление данными с использованием общей дисковой памяти, битовые индексы (bitmap index), поддержка определяемых пользователями типов данных и операций и т.д. Однако ни одна система не разу не подверглась полному перепроектированию после ее исходного изготовления. В данной статье авторы утверждают, что пришло время полностью переписывать СУБД.

В статье [SBC+07] приводились результаты тестовых испытаний, в ходе которых основные РСУБД показали производительность, на два порядка уступающую производительности специализированных программных средств в нескольких прикладных областях:

  • в области управления текстовыми данными (специализированные программные средства от Google, Yahoo и т.д.);
  • в области хранилищ данных (системы с хранением данных по столбцам, такие как Vertica, Monet [Bon02] и т.д.);
  • в области обработки потоковых данных (системы обработки потоковых данных, такие как StreamBase и Coral8);
  • научные базы данных (системы хранения массивов данных, такие как MATLAB и ASAP [SBC+07]).

Эти результаты позволили одному из авторов (по всей видимости, Майклу Стоунбрейкеру) придти к следующим выводам:

  1. РСУБД разрабатывались в расчете на рынок обработки бизнес-данных, и именно эта область является их лакомым куском;
  2. их производительность можно превзойти почти в любой другой области, которая является достаточно широкой для того, чтобы можно было гарантированно окупить тщательную разработку специализированных программных средств.

В данной статье авторы дополняют результаты, представленные в [SBC+07], демонстрируя, что сегодняшние архитектуры РСУБД не подходят даже и для обработки бизнес-данных. Для этого используется методология, аналогичная той, которая применялась в [SBC+07]. Авторами разрабатывается новая СУБД H-Store, предназначенная для OLTP. H-Store уже работает достаточно устойчиво, чтобы позволить сравнить ее производительность с производительностью популярных РСУБД. Результаты экспериментов показывают, что H-Store на эталонном тестовом наборе TPC-C работает в 82 раза быстрее РСУБД.

Поскольку удается превзойти производительность РСУБД почти на два порядка на стандартном тестовом наборе OLTP, не остается рынка, на котором РСУБД являются конкурентоспособными. К этим системам теперь следует относиться, как унаследованной технологии с возрастом более четверти века, следующим шагом по отношению к которой является полное перепроектирование.

Во втором разделе данной статьи обсуждаются архитектурные соображения, которые удалось использовать для достижения упомянутого показателя 82 на тестовом наборе TPC-C. В разд. 3 приводятся характеристики приложений, на поддержку которых ориентировано данное специализированное программное средство. В разд. 4 описываются некоторые детали разработки H-store. В разд. 5 содержатся экспериментальные данные, полученные при прогоне тестового набора TPC-C на H-Store и одной из популярных РСУБД. Наконец, в заключительном шестом разделе статьи приводятся некоторые радикальные предложения по поводу текущих исследовательских задач сообщества баз данных.

далее

 

\

Подписка на новости IT-портала citforum.ck.ua
(библиотека, citforum.ck.ua, CitCity)

Новые публикации:

28 февраля

  • Подбор и развитие команд
    Глава из книги «Руководство командой разработчиков программного обеспечения. Прикладные мысли» (С.Архипенков)
  • citforum.ck.ua:

    Дискуссия об анонимусах:

  • К комментаторам
  • Windows против Linux - психологический портрет участников форумов
  • Новые Блогометки:

  • Nokia N810 - Linux Inside
  • LiMo - стандарты Linux для сотовых телефонов
  • timer-applet: таймер для панели GNOME
  • Debfoster: удалите пакет и все его зависимости
  • GPW: генератор произносимых паролей
  • AMOR: общество для рабочего стола
  • 20 февраля

    citforum.ck.ua:

    Новые Блогометки:

  • Кое-что о приложениях KDE 4
  • Инструкция по установке KDE 4 в Ubuntu
  • Настоящие мужчины ставят KDE из SVN!
  • Начат переход Amarok на Qt 4.4
  • Marble
  • Dillo - сверхбыстрый браузер
  • Создаем резервные копии настроек программ и важных файлов в Ubuntu LInux
  • NTP: всегда вовремя
  • VYM - простое средство зарисовки мыслей и планирования
  • KBibTeX: простой и гибкий редактор библиографий для KDE
  • Дискуссия Windows vs Linux:

  • Жил-был Мальчик, или Сказочка о Том, Откуда Берутся "КУЛХАЦКЕРЫ", ненавидящие Линукс и Юникс
  • 13 февраля

  • Терминологический словарь Wi-Fi
  • Задача проектирования базы данных методом нормализации
  • CitCity:

  • Лучшие смартфоны начала 2008 года
  • citforum.ck.ua:

  • Первый взгляд на Firefox 3.0
  • Open Source на Белгородщине: семинар в Старом Осколе
  • Что такое KDE?
  • Цикл о Slackware:

  • Русский в консоли
  • Быстрая настройка Иксов
  • xorgconfig - консольный подход
  • 6 февраля

    citforum.ck.ua:

  • Мобильный Linux – вчера, сегодня, завтра
  • Чем записать диски в Linux? Попробуй Brasero!
  • Консольные команды
  • Рецепты. Кое-что о программе mplayer
  • Slackware:
    • Что такое Slackware?
    • Установка Slackware - Загрузка
    • Категории программного обеспечения
    • Структура файловой системы
    • Система инициализации Slackware Linux
    • Скрипты инициализации уровня запуска

    30 января

  • Обзор алгоритмов MOLAP
  • CitCity:

  • BI-технологии 2007. Итоги года
  • Рынок СУБД для Хранилищ данных 2007. Итоги года, тенденции
  • Обзор рынка BI (по результатам исследований IDC, OLAP Report, Gartner)
  • Модель зрелости BI
  • citforum.ck.ua:

  • Владимир Попов: За что я люблю Linux
  • Священные войны
  • 23 января

  • Data Mining от Oracle: настоящее и будущее
  • Комментарии к статье Ч.Бергера «Data Mining от Oracle: настоящее и будущее»
  • Байесовский классификатор и регрессионная модель в ORTD: практический пример
  • citforum.ck.ua:

    Дискуссия Windows vs Linux:

  • Программисты и фирмы: кто кого
  • О "чистых пользователях"
  • Новые Блогометки:

    • Почему Jabber, а не ICQ?
    • Archlinux install quick
    • Arch на IBM Z60m
    • Arch + IBM R50e
    • OpenBSD - сборка E17-cvs (или ещe одна маленькая победа разума)
    • OpenBSD - всe для Человека и ради Человека...
    • PekWM
    • E17 и "прозрачность"
    • E17 - приятные мелочи (multimedia)
    • SuSE + Enlightenment = угробил целый день

    16 января

  • Вьетнам компьютерной науки (пересказ - С.Кузнецов)
  • Пример построения автоматизированного управления дисками (ASM) (В. Пржиялковский)
  • CitCity:

  • 2008 год: антипрогноз
  • citforum.ck.ua:

    Новые Блогометки:

    Сети и Интернет:

    • Mozilla firefox. Шрифты в меню
    • Screen tips
    • Liferea: программа чтения RSS для GNOME
    • HTTrack: скачивание и зеркалирование сайтов
    • Clusterssh: работа с несколькими сеансами SSH через общий интерфейс

    Десктопы:

    • Fluxbox & xinitrc. Some new tips
    • Как я конфигурировал xdm

    Системы:

    • SuSE 10.2: zypper - еще один способ установки пакетов
    • cpipe: определите пропускную способность конвейера команд
    • gddrescue: средство восстановления данных с поврежденных носителей
    • VirtualBox: ваш виртуальный ПК

    Приложения:

    • MyTop: top для MySQL

    10 января

    citforum.ck.ua:

    Дискуссионный клуб:

  • Краткое руководство по общению с никсофилами (Интенсификация Малаховна Сергина-Гейтс)
  • О троллях
  • Пещера горного короля: заметки о троллинге
  • Новые Блогометки:

    Сети и Интернет:

    • Делаем блог на Drupal
    • Использование lftp
    • Устанавливаем FTP сервер ProFTPd с TLS шифрованием
    • Управляем файлами на FTP сервере с помощью FileZilla

    Десктопы:

    • fluxbox.autorun
    • 15 человек на сундук мертвеца! (или песнь о зарытых сокровищах)

    Системы:

    • Живой Debian или рабочее место в кармане
    • Разбивка hdd

    Приложения:

    • Cat Excel files
    • Vim: меню выбора кодировок

    26 декабря

    citforum.ck.ua:

  • В Блогометках открыты разделы:
    • Софт для Windows
    • Сети и Интернет
  • dwm. От статики к динамике
  • Установил Solaris
  • Новая Дискуссия:
    • Нужен ли русский Linux?

    19 декабря

  • SQL Anywhere: встраиваемая СУБД
  • citforum.ck.ua:

  • В разделе Блогометки появились рубрики:
    • Десктопы
    • Приложения
    • Системы
  • Подробно о разделе: Блоги и блогометки: открываем сезон промывки
  • 13 декабря

    CitCity:

  • Microsoft и Барселона: сюрреализм?
  • citforum.ck.ua:

  • Открыт новый раздел Блогометки
  • ZFS в подробностях. 1. Былое и ныне
  • 5 декабря

  • Архитектура предприятия: основные определения
  • Архитектуры для государственных ведомств. Примеры
  • Обзор журнала Computer:

  • Высокопроизводительные встроенные системы
  • citforum.ck.ua:

  • Продолжение цикла Linux для начинающих:
    • Пользовательские интерфейсы
    • Файлы
    • Системы настройки

    29 ноября

    CitCity:

  • На пути к динамической IT-инфраструктуре предприятия: Платформа 2008
  • Трио "двенашек": Fujitsu Siemens AMILO Pro V3205, Lenovo 3000 V100 и RoverBook Navigator V211
  • От мала до велика: обзор четырех ноутбуков с диагональю 12, 13 и 14 дюймов
  • Мобильная зарядка... Или подзарядочный F.A.Q.
  • 21 ноября

  • Управление рисками: обзор употребительных подходов
  • Практическое руководство по созданию центра сертификации
  • citforum.ck.ua:

  • Возможности симбиоза
  • 13 ноября

    citforum.ck.ua:

  • Краткая справка по командам для работы с ZFS
  • Linux для начинающих:
    1. Дистрибутивы системы
    2. Разделы и каталоги
    3. Установка приложений
    4. Завершение установки
    5. Использование консоли
    6. Консольные приложения
    7. Загрузчики системы
    8. Графическая подсистема

    8 ноября

    CitCity:

  • Российский старт Oracle 11g
  • Майкл Стоунбрейкер: вопросы, ответы и комментарии
  • Роль поставщиков BI-услуг. Требования к выбору консультантов и внедренцев
  • Тенденции в области BI. Мнение отраслевых экспертов
  • citforum.ck.ua:

  • FreeBSD 7.0: доводим до ума
  • 1 ноября

    CitCity:

  • Глобализация мира технологий
  • Шаг леопарда
  • Куда ведут окна
  • CITForum:

  • DMR - новый стандарт радиосвязи
  • Обзор журнала Computer:

  • Планшетные ПК на службе образования
  • 30 октября

  • Универсальность и специализация: время разбивать камни?
  • Конец архитектурной эпохи, или Наступило время полностью переписывать системы управления данными
  • citforum.ck.ua:

  • FreeBSD 7.0 и ZFS
  • 25 октября

  • Антипаттерны руководства командами разработки ПО
  • Мониторинг загрузки канала интернет-шлюза на FreeBSD
  • Преобразование программ на языке Scheme для облегчения компиляции в язык C
  • CitCity:

  • ИнфоКом-2007 и аналогичный ИнфоЛинукс
  • 23 октября

    CitCity:

  • Третья сенсация осени
  • Тайны Linux-скандала: суды, кражи и самоубийства
  • citforum.ck.ua:

  • Ubuntu 7.10 Gutsy Gibbon: родословная Бесстрашного Гиббона
  • Блеск и нищета Ajax
  • 18 октября

  • PostgreSQL 8.3
  • citforum.ck.ua:

  • И снова о массовом Linux'е
  • ОСТОРОЖНО: ВИНДОФИЛИЯ!
  • Все публикации >>>




IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

Информация для рекламодателей Пресс-релизы -
Послать комментарий
Информация для авторов
Rambler's Top100 хостинг от .masterhost This Web server launched on February 24, 1997
Copyright © 1997-2000 CIT, © 2001-2007 CIT Forum
Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...