Logo    
Деловая газета CitCity.ru CITKIT.ru - все об Open Source Форумы Все публикации Учебный центр Курилка
CitForum    CITForum на CD    Подписка на новости портала Море(!) аналитической информации! :: CITFORUM.RU
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

24.03.2017

Google
WWW CITForum.ru
С Новым годом!
2008 г.

Критика критики критики Дейта

Сергей Кузнецов

Проблема представления в базах данных отсутствующей (missing) информации настолько же стара, как и сами базы данных. Решение, которое принято в SQL, обладает массой недостатков, которые описаны в разнообразных источниках, в том числе, в многочисленных статьях Криса Дейта и его сподвижников. В свое время к этому анализу приложил свою руку и я. Здесь стоит лишь дополнительно заметить, что ситуация с трехзначной логикой в SQL, на мой взгляд, еще более ухудшилась после введения в стандарте SQL:1999 «булевского» типа данных, в котором NULL является третьим истинностным значением (сохраняя при этом смысл обозначения неопределенного значения).

Поэтому трудно предполагать, как это делает Клод Рубинсон в своей заметке «NULL, трехзначная логика и неопределенность в SQL: критика критики Дейта», что Дейт плохо понимает смысл трехзначной логики SQL. Скорее Рубинсон плохо понимает Дейта. Фактически, в своих последних критических замечаниях по поводу неопределенных значений и трехзначной логики в SQL Дейт приводит примеры запросов, при формальном вычислении которых в соответствии с прямолинейной трактовкой неопределенных значений получаются результаты, противоречащие смыслу. На мой взгляд, логика Дейта, в отличие от логики SQL, безупречна.

Если NULL используется в каком-то столбце таблицы для обозначения некоторого неизвестного значения, то, конечно, в этом столбце NULL обозначает какое-то значение типа данных этого столбца. Конечно, если сравнивать неизвестные значения одного и того же атрибута двух разных сущностей (одного столбца двух разных строк таблицы), то мы должны получить логическое значение unknown (или опять-таки NULL по странным правилам SQL). Но если сравнивать неизвестное значение некоторого атрибута некоторой сущности с ним же самим, то мы по смыслу получим true, поскольку это не зависит от реального значения атрибута, которое нам неизвестно. Т.е., на самом деле, поскольку NULL – это не значение, а обозначение значения, при сравнении «неопределенных значений» нужно учитывать, откуда они берутся. Обратимся еще раз к примерной базе данных, представленной на рис. 1 заметки Рубинсона:

S SNO* CITY P PNO* CITY
  S1 London   P1 NULL

По отношению к своему второму примеру

SELECT P.PNO
FROM P
WHERE P.CITY = P.CITY

Дейт совершенно прав. Результатом этого запроса должно быть значение P1, поскольку так будет при любом допустимом значении столбца CITY. Можно сказать, что этот запрос является надуманным. Но вот немного более осмысленный запрос, который должен привести к тому же результату: «выдать номера всех деталей, располагающихся в том же городе, что и деталь P1». Вот возможная формулировка запроса на SQL:

SELECT P.PNO
FROM PARTS P, PARTS Q 
WHERE P.PNO = P1 AND P.CITY = Q.CITY

Понятно, что, поскольку мы не знаем города, в котором располагается деталь P1, для всех деталей, кроме P1, результат сравнения P.CITY = Q.CITY должен быть равен unknown, и ни одна деталь, кроме детали P1, в результат попасть не должна. Но деталь P1 заведомо всегда находится в том же городе, что она сама, и поэтому результатом запроса должно быть множество из одного значения P1. В соответствии с правилами SQL запрос должен произвести пустой результат, и это неправильно.

Первый пример Дейта

SELECT S.SNO, P.PNO
FROM S, P
WHERE S.CITY <> P.CITY
OR P.CITY <> ‘Paris’

немного более сложен. Но если посмотреть на разъяснение Дейта того, что условие по своему смыслу всегда принимает значение true, то можно заметить, что это, фактически, вытекает из наличия в обоих простых сравнениях имени столбца P.CITY. Т.е. снова мы имеем дело с обозначением неизвестного значения, происходящего из одного и того же места. И снова Дейт прав. Результатом этого запроса должно быть множество, состоящее из пары S1, P1. В SQL не учитывается происхождение неопределенных значений, и в результате выдается пустой результат, формально соответствующий правилам вычисления условий с неопределенными значениями, но противоречащий здравому смыслу. Заметим, что если бы в базе данных и столбец S.CITY содержал бы NULL, то условие действительно вычислялось бы в unknown, и результат должен был бы быть пустым.

Вот более интересный пример. Рассмотрим следующую примерную базу данных:
DEPT DNO* NAME EMP ENO* DNO
  D1 NULL   E1 D1
        E2 D1

Предположим, что мы определяем представление

CREATE VIEW DEMP AS
(SELECT *
FROM DEPT, EMP
WHERE DEPT.DNO = EMP.DNO)

Очевидно, что это представление материализуется следующим образом:
DEMP DNO* NAME ENO*
  D1 NULL E1
  D1 NULL E2

Тогда можно утверждать, что результатом запроса

SELECT DISTINCT *
FROM DEMP DE1, DEMP DE2
WHERE DE1.NAME = DE2.NAME

должна быть таблица, содержащая обе строки исходной таблицы DEMP, поскольку в обеих строках используется неизвестное имя одного и того же отдела.

В результате мы видим, что критика критики Дейта, приведенная в заметке Рубинсона, является несостоятельной. Нельзя пытаться заменять механистической трактовкой трехзначной логики логику здравого смысла, даже не пытаясь ее понять. Кроме того, как видно, сама трехзначная логика здесь совсем не виновата. Виновато неправильное понимание обозначения NULL. И здесь, как мне кажется, не совсем прав уже Дейт. По-моему, можно понять, в каких случаях неправильно работают SQL-запросы к базам данных, содержащим NULL в качестве обозначения неизвестных значений. Так происходит тогда (не берусь утверждать, что только тогда), когда известно, что сравнивается неизвестное значение одного и того же атрибута одной и той же сущности, т.е. NULL происходит из одного столбца одной и той же таблицы. Похоже, что соответствующую коррекцию поведения запросов можно было бы возложить на компиляторы SQL.

Другой вопрос, что NULL в языке SQL служит не только для обозначения неизвестных значений, но также и для выражения неприменимости атрибута к конкретному экземпляру сущности и т.д. Очевидно, что правила трехзначной логики, поддерживаемые в SQL, недостаточны для корректной формулировки запросов при использовании одного вида неопределенных значений во всех возможных ситуациях. Как и Клод Рубинсон, я воздержусь здесь от обсуждения нетривиальных последствий этого состояния дел.

В заключение замечу, что буду рад любой критике в адрес своей критики критики Рубинсона критики Дейта. Кто знает, может быть, в результате нам удастся совместными усилиями разобраться в том, что же все-таки следует делать с управлением в базах данных отсутствующей информацией.

Размещение рекламы — тел. +7 495 4119920, ICQ 232284597

Подписка на новости IT-портала CITForum.ru
(библиотека, CITKIT.ru, CitCity)

Новые публикации:

24 декабря

CITKIT.ru:

  • Новогодние поздравления
  • Сергей Кузнецов. Цикл Операционные системы: Ностальгия по будущему:

  • Алексей Федорчук. OpenSolaris 2008.11 Release

  • Сергей Голубев:

  • Евгений Чайкин aka StraNNik (Блогометки):

    17 декабря

  • С.Д.Кузнецов. Базы данных. Вводный курс

    10 декабря

    CITKIT.ru:

  • OpenSolaris 2008.11 Release

  • Альтернативные ОС: две грустные истории (С.Кузнецов)
  • Nokia N810 — доведение до ума
  • CitCity:

  • Платформа 2009: заоблачные перспективы Microsoft

    4 декабря

  • Лекция С.Д.Кузнецова Понятие модели данных. Обзор разновидностей моделей данных

    CITKIT.ru:

  • OpenSolaris 2008.11 Release. Первые впечатления

  • Linux vs FreeBSD: продолжим "Священные войны"?

  • Nokia N810 as is

  • Индульгенция для FOSS

  • Друзья СПО'2008

    26 ноября

  • Нечеткое сравнение коллекций: семантический и алгоритмический аспекты

    CitCity:

    CITKIT.ru:

  • Глава из книги А.Федорчука
    Сага о FreeBSD:
  • 19 ноября

  • Проблемы экономики производства крупных программных продуктов

  • Язык модификации данных формата XML функциональными методами

    CITKIT.ru:

  • Главы из книги А.Федорчука
    Сага о FreeBSD:

    Заметки к книге:

  • FreeBSD: монтирование сменных устройств и механизм HAL
  • Текстовый редактор ee

    12 ноября

  • Правило пяти минут двадцать лет спустя, и как флэш-память изменяет правила (Гоц Грейф, перевод: Сергей Кузнецов)

    CITKIT.ru:

  • Главы из книги А.Федорчука
    Сага о FreeBSD:
  • OSS в России: взгляд правоведа (В.Житомирский)

  • Новая статья из цикла С.Голубева "Железный марш":

    29 октября

  • О некоторых задачах обратной инженерии

  • Веб-сервисы и Ruby

  • Тестирование web-приложений с помощью Ruby

    CITKIT.ru:

  • Главы из книги А.Федорчука
    Сага о FreeBSD:

  • PuppyRus Linux - беседа с разработчиком (С.Голубев)

  • Сергей Кузнецов. Заметка не про Linux

    22 октября

  • Обзор методов описания встраиваемой аппаратуры и построения инструментария кросс-разработки

    CITKIT.ru:

  • Сергей Кузнецов. Почему я равнодушен к Linux

  • Глава из книги А.Федорчука
    Сага о FreeBSD:
  • Что надо иметь
    3. Базовые познания

    CitCity:

  • Управление IT-инфраструктурой на основе продуктов Microsoft

    15 октября

  • Методы бикластеризации для анализа интернет-данных

    CitCity:

  • Разъемы на ноутбуках: что они дают и зачем их так много?
  • AMD Puma и Intel Centrino 2: кто лучше?

    CITKIT.ru:

  • Новый цикл статей С.Голубева
    Железный марш:

  • Главы из книги А.Федорчука
    Сага о FreeBSD:

    8 октября

  • Автоматизация тестирования web-приложений, основанных на скриптовых языках
  • Опыт применения технологии Azov для тестирования библиотеки Qt3

    Обзоры журнала Computer:

  • SOA с гарантией качества
  • Пикоджоуль ватт бережет
  • ICT и всемирное развитие

    CitCity:

  • Пиррова победа корпорации Microsoft

    CITKIT.ru:

  • Главы из книги А.Федорчука
    Сага о FreeBSD:

    Статья из архива:

  • Я живу в FreeBSD (Вадим Колонцов)

    Новые Блогометки:

  • Перекройка шаблона Blogger или N шагов к настоящему
  • Blogger. Comment style
  • Screenie или глянцевый снимок экрана

    2 октября

    CITKIT.ru:

  • Сага о FreeBSD (А. Федорчук)

    Zenwalk: пакет недели

  • Банинг — интеллектуальное развлечение (С.Голубев)

    CitCity:

    25 сентября

  • Клермонтский отчет об исследованиях в области баз данных

    CITKIT.ru:

  • Пользователям просьба не беспокоиться... (В.Попов)

  • Снова про ZFS: диск хорошо, а два лучше
  • Командная оболочка tcsh (А.Федорчук)

    Zenwalk: пакет недели

    17 сентября

  • T2C: технология автоматизированной разработки тестов базовой функциональности программных интерфейсов
  • Технология Azov автоматизации массового создания тестов работоспособности

    CITKIT.ru:

  • FreeBSD: ZFS vs UFS, и обе-две — против всех (А.Федорчук)

    Zenwalk: пакет недели

  • Дачнет — практика без теории (С.Голубев)

    10 сентября

  • За чем следить и чем управлять при работе приложений с Oracle
  • Планировщик заданий в Oracle
    (В.Пржиялковский)

    CITKIT.ru:

  • Microsoft: ответный "боян" (С.Голубев)

  • Причуды симбиоза, или снова "сделай сам" (В.Попов)

  • Файловые системы современного Linux'а: последнее тестирование
  • Zsh. Введение и обзор возможностей
    (А.Федорчук)

    Описания пакетов Zenwalk: Zsh, Thunar, Thunar-bulk-rename, Xfce4-places-plugin, Xfce4-fsguard-plugin

    Блогометки:

  • Google Chrome
  • Лончер для ASUS Eee PC 701

    3 сентября

    CITKIT.ru:

  • Заметки о ядре (А.Федорчук):

    Добавлены описания пакетов Zenwalk: Galculator, Screenshot, Gnumeric, Pidgin

    В дискуссинном клубе:

  • И еще о Википедии и Google Knol

  • Лекция для начинающего линуксоида (С.Голубев)

    26 августа

  • Транзакционная память (Пересказ: С. Кузнецов)

    CITKIT.ru:

  • Открыт новый проект Zenwalk: пакет недели

  • Статья Текстовые процессоры и их быстродействие: конец еще одной легенды?

    21 августа

    CITKIT.ru:

  • Почему школам следует использовать только свободные программы (Ричард Столлман)
  • Беседа Сергея Голубева с учителем В.В.Михайловым

  • Википедия или Гуглезнание? Приглашение к обсуждению (Алексей Федорчук)
  • Народная энциклопедия от Google (StraNNik)

  • Обзор Mandriva 2009.0 Beta 1 Thornicrofti
  • Новичок в Линукс: Оптимизируем Mandriva 2008.1

  • Книга Zenwalk. Приобщение к Linux:

    13 августа

    CitCity:

  • Мирный Atom на службе человеку. Обзор платы Intel D945GCLF с интегрированным процессором
  • Обзор процессоров Intel Atom 230 на ядре Diamondville

  • iPhone - год спустя. Скоро и в России?

    CITKIT.ru:

  • Интермедия 3.4. GRUB: установка и настройка (из книги Zenwalk. Приобщение к Linux)

    6 августа

  • СУБД с хранением данных по столбцами и по строкам: насколько они отличаются в действительности? (Пересказ: С. Кузнецов)

    CITKIT.ru:

  • Интермедия 2.2. Что неплохо знать для начала (из книги Zenwalk. Приобщение к Linux)

  • И снова про шрифты в Иксах (А.Федорчук)

  • 20 самых быстрых и простых оконных менеджеров для Linux

  • Дело о трех миллиардах (С.Голубев)

    30 июля

  • OLTP в Зазеркалье (Пересказ: С. Кузнецов)

    CitCity:

  • Будущее BI в облаках?
  • Тиражные приложения и заказная разработка. Преимущества для заказчика
  • Дискуссия со сторонниками заказной разработки

    CITKIT.ru:

  • Новые главы книги Zenwalk. Приобщение к Linux:
  • Глава 8. Пакеты: средства установки, системы управления, системы построения
  • Глава 9. Zenwalk: репозитории, пакеты, методы установки

    23 июля

    CITKIT.ru:

  • Все против всех. 64 vs 32, Intel vs AMD, tmpfs vs ext3
  • Две головы от Intel

  • Zenwalk: обзор штатных приложений (глава из книги "Zenwalk. Приобщение к Linux")

  • Нормально, Григорий...

    16 июля

    Обзоры журнала Computer:

  • Перспективы и проблемы программной инженерии в XXI веке
  • Большие хлопоты с большими объемами данных
  • Перспективы наноэлектроники

    CITKIT.ru:

  • Интермедия о лицензиях (А.Федорчук. "Zenwalk. Приобщение к Linux")

  • Есть ли будущее у KDE?

  • Linux в школе: альтернативный вариант в задачах

  • Шифр (приключения агента Никодима)

    10 июля

    CITKIT.ru:

  • Новые разделы книги А. Федорчука Zenwalk. Приобщение к Linux:
  • Интермедия вступительная. Linux или GNU/Linux? Как вас теперь называть?
  • Глава 5. Среда Xfce
  • Глава 6. Xfce: приложения и плагины

  • ZUR (Zenwalk User Repository) FAQ

    2 июля

  • Персистентность данных в объектно-ориентированных приложениях (С. Кузнецов)

    CITKIT.ru:

  • Новые разделы книги А. Федорчука Zenwalk. Приобщение к Linux:
  • Интермедия 1.2. Дорога к Zenwalk'у. Период бури и натиска
  • Интермедия 3.3. Немного о Linux'е и "железе"
  • Глава 4. Настройка: инструментами и руками
  • Интермедия 4.1. Zenpanel и конфиги: поиски корреляции

  • Интервью с Жан-Филиппом Гийоменом, создателем дистрибутива Zenwalk

  • Linux в школе: первые итоги (С. Голубев)

    25 июня

    CITKIT.ru:

  • Zenwalk. Приобщение к Linux (А. Федорчук)

  • Логика и риторика (С.Голубев)

  • Технология Tru64 AdvFS

  • Ханс Райзер предлагает отвести полицейских к телу Нины

    18 июня

  • Проекты по управлению данными в Google (Пересказ: С. Кузнецов)

    CITKIT.ru:

  • ОС и поддержка "железа": мифы и реальность (А. Федорчук)

  • Linux в школе: другие дистрибутивы

  • Пинок (С. Голубев)

    4 июня

  • Ландшафт области управления данными: аналитический обзор (С. Кузнецов)

    CITKIT.ru:

  • Linux в школе: слово заинтересованным лицам

  • SlackBuild: пакеты своими руками

  • Linux от компании Novell. Установка и обзор openSUSE Linux

    Все публикации >>>




  • IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

    Информация для рекламодателей PR-акции, размещение рекламы — тел. +7 495 4119920, ICQ 232284597 Пресс-релизы — pr@citcity.ru
    Послать комментарий
    Информация для авторов
    Rambler's Top100 TopList liveinternet.ru: показано число просмотров за 24 часа, посетителей за 24 часа и за сегодня This Web server launched on February 24, 1997
    Copyright © 1997-2000 CIT, © 2001-2007 CIT Forum
    Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...