Расширение реляционной модели для лучшего отражения семантики

  35790931      

Безусловное обобщение


Другим важным измерением для формирования более крупных смысловых единиц является измерение обобщения. Оно привлекает большое внимание в контексте семантических сетей [18, 31, 35]. Мы рассмотрим их здесь в контексте n-арных отношений. Смит и Смит (Smith) определили обобщение (generalization) как абстракцию, при которой множество схожих объектов рассматривается как родовой объект. Это понятие имеет два аспекта: инстанциацию (instantiation) и подтипизацию. Оба они являются некоторыми формами специализации (specialization), а их инверсии – формами обобщения. Экстенсиональным двойником инстанциации является принадлежность множеству, а подтипизации – включение множества. Как показывает рис. 7, чтобы получить конкретных инженеров из родового объекта (или типа) инженер, следует применить инстанциацию. Каждый из типов инженер, секретарь и водитель грузовика

являются подтипами типа служащий. Тип сущностей e вместе с его непосредственными подтипами, их подтипами и т. д. образуют иерархию обобщения e. Эта иерархия является еще одним молекулярным типом.

Рис. 7. Безусловное обобщение

Почему нам следует разделять членов иерархии обобщения на различные типы сущностей? Мы делаем это только в том случае, если о разных членах иерархии должны регистрироваться разные виды фактов. Если бы эти типы не были представлялись раздельно, мы имели бы единое большое отношение с многими вхождениями специального неопределенного значения, интерпретируемого как "значение неприменимо". С иерархией обобщения ассоциируется правило наследования свойств (property inheritance rule): к любому подтипу e применимы все свойства его родительского(-их) типа(-ов). Например, все свойства служащих вообще применимы к служащим-продавцам в частности.

Введенные выше E-отношения поддерживают обобщение по членству. Для поддержки обобщения по включению мы вводим отношение безусловного обобщения по включению (unconditional gen inclusion relation, или UGI-отношение) – тернарное отношение, представляющее помеченный граф.


Два атрибута UGI-отношения определяются на RN-домене (один с ролью SUB, а другой – с ролью SUP), а третий – на домене меток категорий, называемом PER. Триплет (SUB:m, SUP:n, PER:p) принадлежит UGI-отношению, если сущность типа e(m) является непосредственным подтипом типа сущности e(n) по категории p. Иными словами, E-отношение, имя которого представляется символьной строкой m, принудительно включается (вследствие обобщения по категории p) в E-отношение с именем, представленным символьной строкой n. Заметим, что UGI-отношение поддерживает только ограничения непосредственного безусловного включения, которые ассоциируются с семантическим понятием обобщения. Таким образом, если (SUB:m, SUP:n, PER:p) и (SUB:n, SUP:k, PER:p) принадлежат UGI, то (SUB:m, SUP:k, PER:p) ему не принадлежит.

Транзитивное замыкание UGI-отношения представляет собой отношение частичного порядка на типах сущностей, но не обязательно совокупность деревьев, поскольку тип сущностей может быть обобщен по включению в два или более типов сущностей. Например, инженеры-женщины могут быть обобщены в инженеров, с одной стороны, и в служащих-женщин – с другой.

Рассмотрим семейство типов сущностей в некоторой иерархии обобщения. Обычно хорошим был бы проект базы данных, в котором общие свойства и характеристики этих типов сущностей были бы представлены на возможно более высоком уровне такой иерархии, что позволяло бы в полной мере получать преимущества правила наследования свойств. Однако сама RM/T не налагает такого ограничения на иерархии обобщения – этот подход считается всего лишь дисциплиной проектирования, которую пользователь RM/T может по своему усмотрению принимать или отвергать.

Следующее правило регулирует вставки и удаления суррогатов.

Правило 7 (целостность подтипов): Если суррогат (например, s) принадлежит E-отношению для сущности типа e, то s должен также принадлежать E-отношению для каждого типа сущностей, для которого e является подтипом.


Содержание раздела