Связь с логикой предикатов
Опишем два различных способа, с помощью которых реляционная модель может быть связана с логикой предикатов. Предположим, что мы рассматриваем первоначально базу данных как некоторое множество формул логики предикатов первого порядка. Предположим также, что каждая такая формула не имеет свободных переменных и находится в максимально возможной атомарной форме (например в A & B были бы замещены составляющие формулы A и B). Допустим теперь, что большинство формул является простыми утверждениями вида Pab ... z (где P – предикат, а a, b, .., z
– константы), и что количество различных предикатов в базе данных мало по сравнению с количеством простых утверждений. Такую базу данных называют обычно форматированной, поскольку ее основная часть поддается вполне регулярной структуризации. Один из очевидных способов состоит в том, чтобы факторизовать предикат, общий для некоторого множества простых утверждений, и затем интерпретировать это множество как экземпляр n-арного отношения, а предикат – как имя этого отношения. Структурированная таким образом база данных будет далее состоять из двух частей: регулярной части, состоящей из совокупности изменяющихся во времени отношений соответствующей степени (которая иногда называется экстенсионалом (extension)), и нерегулярной части, состоящей из формул логики предикатов, которые являются относительно устойчивыми во времени (ее называют иногда интенсионалом (intension), хотя это, возможно, и не то, что логики Рассел (Russell) и Уайтхед (Whitehead) первоначально подразумевали под этим термином). Можно также рассматривать интенсионал как множество ограничений целостности (т. е. условий, которые определяют все допустимые экстенсионалы) и таким образом отделить эти понятия от изменчивости во времени.
Возможны альтернативы при интерпретации отсутствия некоторого кортежа в базовом отношении, которое может рассматриваться как утверждение о том, что истинностное значение соответствующей атомарной формулы является (1) неизвестным или (2) ложным.
Если принимается альтернатива (1), мы имеем интерпретацию, соответствующую гипотезе открытого мира. Если же принимается альтернатива (2), то мы имеем интерпретацию, соответствующую гипотезе замкнутого мира (см. [28]). Хотя интерпретация, соответствующая гипотезе замкнутого мира, обычно принимается для коммерческих баз данных, существует случай, когда следует допустить, чтобы некоторые отношения (например P-отношения из разд. 7) имели интерпретацию, соответствующую гипотезе открытого мира, в то время как другие отношения (скажем E-отношения для стержневых типов сущностей, обсуждаемых в разд. 5 и 6) имеют интерпретацию, соответствующую гипотезе замкнутого мира.
Независимо от того, принимается ли интепретация открытого или замкнутого мира, реляционная модель весьма близка к логике предикатов. Эта близость является причиной существования большого числа реляционных подъязыков данных, основанных на логике предикатов. Исследование и основательное сравнение таких языков можно найти в работах [20, 27].
В результате неаккуратного применения логики предикатов при проектировании базы данных можно получить непонятное и не поддающееся управлению множество утверждений. Некоторые из проблем, которые возникают при попытках ввести в этой сфере некоторую дисциплину, сводятся к следующему.
- Можем ли мы более точно определить, из чего образуется простое утверждение?
- Какие другие виды регулярности могут быть полезными в форматированной базе данных?
- В какой степени эти дополнительные виды регулярности могут быть представлены в легко анализируемых структурах данных, а не в процедурах?
Пытаясь дать ответы на эти вопросы, мы будем использовать для мотивации расширений реляционной модели такие популярные неформальные термины, как "сущность", "свойство" и "ассоциация". В конце концов, мы приходим к формальной системе, названной RM/T (здесь T означает "Тасманию", где эти идеи впервые были представлены [9]). Эта система может интерпретироваться многими различными способами.Некоторые интерпретации должны удовлетворять так называемой школе двух концепций в семантическом моделировании, в то время как другие должны удовлетворять школе трех концепций (см. [25, стр. 27]).