Реферат: Методы формализации знаний о предметной области понятийная структура предметной области
Глава 2
МЕТОДЫ ФОРМАЛИЗАЦИИ ЗНАНИЙ О ПРЕДМЕТНОЙ ОБЛАСТИ
2.1. Понятийная структура предметной области
При построении описания выделенного фрагмента реальной действительности (предметной области — ПО) одним из основных допущений является предположение о том, что мир состоит из независимых объектов (предметов, процессов, вещей или сущностей), которые могут быть уникально идентифицированы. В дальнейшем при обозначении реальных объектов ПО для однозначности будем использовать термин сущность.
Напомним, что термин «проблемная область» включает понятие «предметная область» (т.е. множество сущностей, описывающих область экспертизы) плюс решаемые в ней задачи (представляемые в виде исполняемых утверждений типа правил, процедур, формул и т.д.).
Определение 2.1. Сущность — это объект произвольной природы, принадлежащий реальному или воображаемому (виртуальному) миру. На самом общем уровне сущности делятся на следующие категории (классы): предмет, свойство (атрибут), состояние, процесс, событие, оценка, модификатор, квантификатор, модальность. Любое понятие относится к одной из этих категорий [54].
Сущность ПО необходимо адекватным образом представить в памяти вычислительной машины, чтобы с ее помощью обеспечить поиск, анализ, обработку и выдачу накопленной информации в форме, удобной для принятия решений. Эта задача может быть решена путем использования соответствующих средств описания ПО, предоставляющих необходимые базовые понятия, инвариантные по отношению к любым ПО, и правила, позволяющие строить более сложные синтаксические конструкции на основе базовых. Средства предоставления информации о ПО различные исследователи называют по-разному.
45
Под понятием (концептом) понимается класс сущностей, объединяемых на основе общности признанных (атрибутивных) структур.
Следует отметить, что наиболее естественным для человека способом описания любых сущностей ПО является соотнесение с ними в собственной памяти совокупности определенных понятий (простых и сложных), образующих понятийную структуру предметной области, а в памяти ЭВМ — как правило, некоторых объектов, состоящих из атрибутов со значениями (хотя это, безусловно, не единственный способ реализации описания понятий в памяти ЭВМ).
В ряде случаев вообще не делается попыток различения понятийной структуры и объектов предметной области, а сразу отмечается, что предметную область можно характеризовать совокупностью объектов, характеристик объектов и отношений между объектами [40]. Справедливость подобных утверждений будет вполне очевидна после рассмотрения некоторых приведенных ниже определений [24, 25].
Определение 2.2. Под простым понятием понимается тройка, состоящая из имени, интенсионала и экстенсионала понятия.
Имя понятия — любой идентификатор; интенсионал понятия — множество атрибутов (свойств) понятия с областями их определения; экстенсионал понятия — совокупность кортежей значений, удовлетворяющих интенсионалу; атрибуты — первичные характеристики данной ПО, не подлежащие дальнейшей структуризации.
^ Определение 2.3. Сложные понятия — это понятия, образованные из ранее определенных понятий применением некоторых правил.
Следует добавить, что простота или сложность понятий является явлением относительным и изменяющимся с развитием науки, причем изменение статуса понятия возможно и в процессе разработки конкретной ИнС. Отметим также, что для определения понятийной структуры области необходимо выявление отношений на множестве понятий, которые являются отражением объективных законов ПО или субъективных мнений специалистов.
Напомним, что классические модели данных (иерархические и сетевые) базируются на таких понятиях, как запись, атрибут и связь. Современные модели данных (реляционные и семантические) используют математическое понятие отношение, которое задается на множествах, и понятие объекта для представления сущностей ПО в БД.
46
В соответствии с данными определениями отметим следующее. Структура признаков — это совокупность взаимосвязанных признаков (атрибутов), характеризующих понятие и выделяющих его среди других понятий. Признаки, входящие в [указанную] совокупность, называются существенными. Их состав определяется исходя из множества понятий, в котором необходимо выделить рассматриваемое [понятие] [55].
Совокупность существенных признаков, характеризующих понятие, называется его содержанием (интенсионалом). В силу ограниченного числа существенных признаков A1,...,Ai,...,Ak будем представлять содержание понятия А множеством А = {A1,...,Aj,...,Ak}. При этом содержание понятия должно отвечать взаимнопротиво-положным требованиям полноты и неизбыточности. Совокупность существенных признаков можно рассматривать как координаты k-мерного признакового пространства. Оно должно отличаться от признакового пространства, характеризующего другое понятие. Если отойти от двух градаций i-гo признака — его наличия, либо отсутствия в анализируемом понятии — и определить меру схожести, то можно решать задачу выявления аналогии понятий.
Класс сущностей, объединяемых в понятие, называется его объемом (экстенсионалом). Сущности, входящие в объем понятия и называемые экземплярами, вариантами или фактами, задаются перечислением. Объем понятия, в отличие от его содержания, может варьироваться заданием ограничений. По этой причине объем понятия, как правило, задается перечислением не экземпляров Ai, i= 1, 2, ..., а признаков, которым они удовлетворяют: А = {Аi:Aj A,j = 1,...,k}.
Знаковое представление понятий. Понятия именуются с помощью слов или словосочетаний естественного языка, которые играют роль знаков или имен. Таким образом, носителем знаковой формы представления знания является естественный язык. Он позволяет с применением символов (букв и цифр) зафиксировать любую информацию, в том числе и графическую. Такая специфическая форма информации, как музыкальная, записывается с помощью знаков специального вида (нотная запись).
Для представления понятия в естественном языке используется
слово или словосочетание, называемое именем. Оно играет роль
идентификатора, выделяя понятие среди остальных. Имя или знак
(sign) — единица языка, отражающая семантически сущность ото-
бражаемого мира, а синтаксически — субъект или объект высказы-
вания. В пропозициональной функции имя представляется предмет-
ной переменной или константой.
47
Иными словами, знак — это заменитель некоторого объекта, явления или процесса, используемый для накопления, хранения, переработки и передачи информации или знаний.
Пара, состоящая из имени и обозначаемого, в семиотике называется знаковой ситуацией. Сущности ПО, на которые можно ссылаться с помощью имени или знака, как уже упоминалось, называются денотатами.
Денотат знака — это конкретная сущность или предмет, на которые указывает данный знак. Другими словами, денотат знака является способом интерпретации данного знака в рамках некоторой ситуации, рассматриваемой в ПО. Денотат знака — это значение, которое может иметь знак в рамках данной знаковой ситуации [46].
Можно указать на следующие основные свойства знаковой ситуации:
имена способны замещать денотаты. Например, имя понятия
АВТОМОБИЛЬ может использоваться в качестве заместителя лю-
бого конкретного автомобиля;
имя нетождественно денотату, оно не может полностью за-
менить денотат. Так, при алгебраических преобразованиях мы мо-
жем использовать буквенные обозначения чисел. Однако, если не
обходимо вычислить числовое значение выражения, то требуется
подставить конкретные числа (денотаты) вместо букв;
связь «имя — денотат» многозначна, т. е. некоторое имя мо-
жет обозначать множество денотатов — омонимия, и наоборот, од-
ному денотату можно поставить в соответствие несколько имен —
синонимия.
Отношение, связывающее обозначаемую сущность (denotat), отражающее ее понятие (consept) и его имя (designat), графически выражается треугольником Фреге (рис. 2.1). Сплошными линиями изображен базовый треугольник Фреге, характеризующий одно-1значное отношение. Оно является желательным, но не всегда дос- тижимым. Пунктирными линиями изображены два треугольника, представляющие два случая неоднозначности отношения [44].
Треугольник «сущность 1, понятие 1, имя 2» в сочетании с ба-
зовым иллюстрирует случай синонимии. Сущности 1 и понятию 11
ставятся в соответствие два имени, называемые синонимами. Это
слова или словосочетания, тождественные или близкие по своему
значению, например булева алгебра и алгебра логики.
Источниками синонимии являются:
русское и иностранное происхождение (рынок и маркет);
полное и краткое обозначение (килограмм и кг);
фамильный и отражающий существенные признаки (метод
Парето и метод недоминируемых альтернатив);
48
именование сущности по разным признакам (северный и хо-
лодный климат);
различное авторское именование на этапе формирования но-
вой терминологии (рабочее и функциональное диагностирование).
Треугольник «сущность 2, понятие 2, имя 1» в сочетании с базовым иллюстрирует случаи омонимии и полисемии. Сущностям 1 и 2 и понятиям 1 и 2 ставится в соответствие одно и то же имя, что свидетельствует о его многозначности. В случае полисемии понятия 1 и 2 характеризуются общим происхождением (одна статья в толковом словаре), например сферы — небесная и интересов. При омонимии понятия 1 и 2 имеют различное происхождение. Например, в бытовом значении слово ключ характеризует предмет, связанный с безопасностью помещений, а в программировании под ключом понимают программный код, используемый для поиска данных. Смысл таких слов можно распознать только по контексту. К частному случаю омонимии можно отнести омографы — слова, различающиеся звучанием и обозначающие разные понятия (замок и замок).
Определения понятий являются результатом соглашения. Оно достигается, например, при разработке терминологических стандартов. Такие определения называются нормативными. Однако в реальной жизни могут использоваться и ненормативные определения. Наиболее подверженным изменению в определении является признак, характеризующий роль или назначение понятия, т.е. его прагматику. В связи с этим Д.А. Поспелов предложил дополнить треугольник Фреге 4-й вершиной, характеризующей прагматику понятия (четырехугольник Поспелова). Он изображен на рис. 2.2.
^ Схема и формулы понятий. Как уже отмечалось, сущности, со-
ставляющие объем понятия, различаются с помощью признаков.
Признаковые отношения предписывают одним понятиям выпол-
нять роль некоторых качественных свойств по отношению к дру-
гим понятиям. Признаки понятий могут быть отнесены к одному
49
из следующих типов: дифференциальные, характеристические и валентные [46].
^ Дифференциальные признаки используются в качестве характеристики содержания понятия.
Характеристические — это признаки, которые позволяют отличить сущности, относящиеся к объему одного и того же понятия.
Валентные — это признаки, обеспечивающие связь между различными понятиями. Без потери общности можно считать такие связи бинарными.
Признак характеризуется именем и значением. Можно выделить несколько типов значений признаков: логические, числовые, символьные и др. Имя признака вместе с его значением образует полное наименование соответствующего признака. Например, признак ВОЗРАСТ вместе со значением «30 лет» образует наименование признака «возраст 30 лет».
Имя признака позволяет указать ту семантическую роль, которую играет его значение в организации связи между сущностью и признаком, ее характеризующим. Так, в предыдущем примере имя признака ВОЗРАСТ характеризует определенную роль понятия «30 лет» по отношению к некоторой сущности, в качестве которой выступает конкретный человек.
Совокупность имен дифференциальных, характеристических и валентных признаков составляет схему понятия, обозначаемую как shm P. Таким образом, схему понятия Р можно представить в виде тройки
shm P = , (2.1)
Имена признаков будем обозначать прописными буквами латинского алфавита (возможно, с индексами) А, В, С, D, ...., а значения — строчными буквами.
Тот факт, что признак А, данного понятия принимает одно из возможных значений a] GdomA;, будем выражать в виде пары (А;,
aj). Здесь dom А обозначает множество (домен) всех возможных значений признака А- Тогда каждая сущность е, принадлежащая
50
P(X) Ai(zi1,X) v Ai(zi2,X) v... v Ai(zim,X), (24)
где v, & — знаки дизъюнкции и конъюнкции соответственно.
Признаки, которые могут принимать несколько значений, называются множественными.
Более сложный класс понятий описывается дизъюнктивно-конъюнктивными логическими выражениями вида
Р(Х) Q1 (X) V Q2(X)...VQm (X), (2.5)
n
где Qk = & Рki(Х) и Pki(X) — предикаты, входящие в k-й дизъюнкт.
i=l
Выражение вида (2.5) фактически определяет понятие Р(Х) через m-альтернативных понятий Qk(X), каждое из которых является конъюнкцией предикатов Рki (X).
В связи с этим без потери общности можно считать, что любое понятие может быть представлено формулой
Р(Х) Рi(Х), (2.6)
где Рi(Х) — предикаты, которые могут интерпретироваться как другие понятия или как признаки понятия Р(Х).
Если учесть деление признаков понятия Р(Х) на дифференциальные, характеристические и валентные, то логическое выражение (2.6) можно представить в виде
n m 1
P(X)& Di(dij,X)&Hj(X)&Vk(X), (2.7)
i=1 j=1 k=1
где dij domDi — значения дифференциальных признаков Di.
Устанавливая различные значения дифференциальных признаков, мы получаем класс понятий с однородной структурой: все понятия данного класса обладают одинаковой схемой.
Так как для импликации (2.6) справедлива эквивалентная форма записи
Р1 (X) vP2(X) v... v Pn (X) v Р(Х), (2.8)
где — знак отрицания, то это означает, что широкий класс понятий может быть представлен в виде хорновских дизъюнктов.
Хорновским называют дизъюнкт, который содержит не более одного позитивного компонента.
52
Мы не вводим для описания понятий более сложные логические выражения, а ограничиваемся лишь такими, которые могут быть представлены в виде хорновских дизъюнктов. Как показал Ковальски [74], применение хорновских дизъюнктов по своим изобразительным возможностям эквивалентно логике предикатов первого порядка, но позволяет реализовать эффективные алгоритмы обработки.
В тех случаях, когда понятие определяется альтернативными логическими выражениями, целесообразно использовать термин процедура.
Под процедурой понимают множество хорновских дизъюнктов, заголовки которых содержат одинаковые имена предикатов и одно и то же количество аргументов. Так, понятие Р(Х, Y) может быть определено процедурой вида
P(X,Y) R,(X,a1)&Q1(Y,b1),
P(X,Y) R2(X,a2)&Q2(Y,b2), <2-9)
которая означает, что для определения понятия Р(Х, Y) сначала следует использовать предикаты Ri(Y, а1) и Qi(Y, b1), а затем — предикаты R2(Y, a2) и Q2(Y, b2).
Например, если необходимо определить понятие ПРЕДОК (X, Y), то это можно сделать с помощью следующей процедуры:
^ ПРЕДОК (X, Y) РОДИТЕЛЬ (X, Y),
ПРЕДОК (X, Y) РОДИТЕЛЬ (X, Z) & ПРЕДОК (Z, Y).
Здесь первая формула содержит утверждение, что субъект X является предком Y, если он является его родителем. Вторая формула определяет понятие ПРЕДОК (X, Y) рекурсивно: субъект X является предком Y, если существует некоторый Z, для которого X является родителем и, кроме того, Z является предком Y.
Таким образом, наиболее удобным аппаратом формализации понятий, используемых для представления знаний о фактах, действиях, событиях, ситуациях и т. д., является логика исчисления предикатов. Ограничиваясь правилами, формулируемыми на основе хорновских дизъюнктов, мы получим простой и достаточно общий способ выражения связей как между признаками и понятиями, так и между различными понятиями.
^ Экстенсионал и интенсионал понятия. В семиотике для характеристики понятия и знаковой ситуации получили распространение категории денотата и концепта, а в логике для тех же целей служат термины «экстенсионал» и «интенсионал».
53
Одно и то же понятие может обозначать разные денотаты. Множество всех объектов, предметов или сущностей, являющихся денотатами понятия, составляет объем, или экстенсионал понятия. Если экстенсионал понятия Р обозначить через extP, то может записать следующее выражение [46]:
ExtP = [е1 е2,...,еn], (2.10)
где е1, е2, ..., еn — сущности, являющиеся денотатами понятия Р.
Экстенсионал понятия — это совокупность всех его допустимых денотатов, соответствующих концепту этого понятия.
Так, чтобы описать экстенсионал понятия АВТОМОБИЛЬ, следует рассмотреть класс всех автомобилей. Мы полагаем, что в БЗ используются только конечные экстенсионалы понятия.
Если ограничиться понятиями, которые допускают не более одного значения некоторого признака, то между экстенсионалом понятия и его признаками может быть установлена функциональная связь вида
fi:extPdomAi, (2.11)
сопоставляющая каждой сущности eij extP некоторое значение признака zij domAi.
Разные понятия могут иметь один и тот же экстенсионал. Так, понятия «множество точек, равноудаленных от сторон данного угла» и «прямая, делящая угол на два равных угла», имеют одно и то же множество точек в качестве денотатов (биссектрису данного угла). Эти понятия имеют общий экстенсионал, но выражают различный смысл, который мы связываем с их интенсионалами. Следовательно, понятие не полностью характеризуется экстенсионалом. Необходимо учитывать также интенсиональный аспект понятия, который связан с его концептом.
Интенсионал понятия — это тот смысл, который мы вкладываем в данное понятие, т. е. интенсионал характеризует концепт данного понятия, его содержание. Интенсионал понятия Р будем обозначать intP.
Возможны два подхода к формальному представлению интен-сионала: теоретико-множественный и логический. При теоретико-множественной формализации в интенсионал обычно включают множество всех дифференциальных признаков, характеризующих понятие.
Так, если понятие Р обладает некоторой совокупностью дифференциальных признаков (D1, d1) (D2, d2 ), ..., (Dn, dn), где Di — это
54
имя дифференциального признака, a dn — соответственно его значение, то интенсионал понятия Р можно представить в виде множества пар
intsP = {(D,d1),(D2,d2),...,(Dn,dn). (2.12)
Здесь индекс S (от английского слова Set) у интенсионала означает его теоретико-множественную трактовку. Данный способ чаще всего используется для формального представления интен-сионалов простых понятий. При этом под интенсионалом простого понятия Р понимают совокупность признаков, необходимых и достаточных для принятия решения о принадлежности некоторой сущности экстенсионалу данного понятия.
Очевидно, что при таком способе представления схема понятия не содержится в его интенсионале, так как имена характеристических и валентных признаков в выражении (2.12) отсутствуют.
Для сложных понятий более естественна логическая форма представления интенсионала. Так как широкий класс понятий может быть описан логическими формулами в виде хорновских дизъюнктов, то под интенсионалом понятия в этом случае обычно понимают правую часть импликации (2.6), т. е.
n
intLP(X)=&Pi(X). (2.13)
i=1
Здесь индекс L (от английского слова Logic) у интенсионала означает его логическую формализацию.
Соответственно, если понятие представлено логической формулой (2.7), то интенсионал может быть определен выражением
n m 1
intLP(X)=&Di(di,X)&Cj(X)&Vk(X). (2.14)
i=l j=l k=l
Очевидно, что при таком представлении интенсионал включает также информацию о схеме понятия, хотя и не выделенную явным образом.
Логическая форма представления интенсионала допускает следующую интерпретацию: интенсионал понятия Р принимает истинное значение на всех сущностях ei extP. Так, на множестве точек «биссектриса утла» истинны оба утверждения: «равноудалены от сторон данного угла» и «делят данный угол на два равных».
Связи между различными категориями, используемыми для описания понятий в логике и семиотике, представлены на рис. 2.3.
55
Суммируя вышеизложенное, можно представить понятие в виде тройки:
Р = . (2.15)
В зависимости от характера деятельности внимание проектировщиков ИнС концентрируется на различных составляющих понятия: системные аналитики и администраторы задач приложений, создающие формальную модель ПО, больше должны опираться на интенсионал понятий ПО, а администраторы базы данных — на их схему. Тем самым понятие становится чрезвычайно удобным средством, которое позволяет, с одной стороны, путем использования интенсионала выразить семантические отношения для некоторого фрагмента реального мира, а с другой стороны, с помощью схемы обеспечить возможность перехода к менее детальному описанию и представлению этой информации в базе знаний.
^ Абстрагирование понятий. Абстракция понятий представляет собой основной механизм, с помощью которого человек познает окружающий мир.
Абстракция — это выделение существенных признаков и связей понятий, используемых при решении данной задачи, и игнорирование несущественных. Абстрагирование является основным методологическим приемом при разработке программного обеспечения. Оно позволяет разбить решаемую задачу на подзадачи, каждая из которых проще исходной задачи. Причем при рассмотрении начальной задачи нет необходимости учитывать те детали и ту более подробную информацию, которые используются на этапе рассмотрения подзадач. В поле зрения должны находиться только те сведения, которые позволяют охватить проблему целиком и осуществить ее декомпозицию на более простые подзадачи.
Абстрагирование обеспечивает упорядочение, структуризацию и понимание информации о реальном мире. Поэтому методы абстракции широко используются в формальном описании предметной области.
56
Известны следующие основные типы абстрагирования понятий: агрегация, обобщение, типизация и ассоциация [46].
Перечисленным типам абстрагирования соответствуют определенные логические приемы, с помощью которых может быть достигнут необходимый результат. К таким приемам образования понятий обычно относят:
синтез и анализ понятий;
объединение понятий на основе их сходства или подобия;
сравнение и сопоставление конкретных сущностей с целью выявления общих признаков;
связывание двух или более понятий.
Синтез и анализ понятий используются в абстракции агрегации. В процессе объединения понятий на основе их сходства или выявленного подобия порождается новое понятие, которое является обобщением исходных понятий. При установлении определенного сходства сущностей в процессе сравнения или сопоставления их признаков может порождаться новое более общее понятие, которое объединяет целый класс подобных понятий, что соответствует абстракции типизации. Если в процессе связывания понятий образуется новое понятие, а исходные понятия выступают в виде членов вновь порожденного понятия, то это абстракция ассоциации.
Вследствие того, что для каждого метода абстрагирования возможно как повышение уровня абстракции, так и его понижение, мы имеем дело с парами: агрегация — декомпозиция, обобщение — специализация, типизация — конкретизация, ассоциация — индивидуализация. Данные виды абстракций фиксируют простейшие базовые отношения между понятиями и поэтому более подробно рассматриваются ниже.
Агрегация понятий используется в тех случаях, когда вновь порожденное понятие включает исходные понятия в качестве своих компонент или составных частей. Например, понятие АВТОМОБИЛЬ включает в качестве своих составных частей такие компоненты, как КУЗОВ, ШАССИ, ДВИГАТЕЛЬ.
Агрегация понятий — это такая форма связи понятий, при которой на основе исходных понятий Р и Q образуется понятие агрегат R более высокого уровня.
При агрегации вновь образованное понятие R наследует все признаки входящих в него понятий Р и Q, так что для интенсиона-лов при их логической формализации и экстенсионалов выполняются следующие соотношения:
intLRintLR∫LQ, (2.16)
57
extR = extP x extQ. (2.17)
Выражение (2.16) можно интерпретировать следующим образом. Для принятия решения о принадлежности некоторой сущности экстенсионалу понятия-агрегата R необходимо, чтобы эта сущность удовлетворяла как интенсионалу понятия Р, так и интенсио-налу понятия Q.
Легко видеть, что это требование удовлетворяется, если экстен-сионал понятия-агрегата R определяется в соответствии с выражением (2.17).
Действительно, если сущность ер Е extP, а сущность е Е extQ, то intLP(ep) = intLQ(eq) = true. Но сущность er Е extP x extQ в соответствии с правилом наследования обладает одновременно признаками обеих сущностей ер и eq, поэтому intLP(er) = intLQ(er) = true, что приводит к истинности выражения
intLR(er) = intLP(er)∫LQ(er).
Очевидно, что для теоретико-множественной формы представления интенсионалов будем иметь
intsR = intsPUintsQ. (2.18)
Из выражения (2.18) непосредственно следует, что сущность er Е extR обладает дифференциальными признаками обоих понятий Р и Q, что соответствует сформулированному выше правилу наследования признаков для абстракции агрегации. Так, понятие АБТОМОБИЛЬ наследует все признаки, относящиеся к понятиям ДВИГАТЕЛЬ, КУЗОВ и ШАССИ. При этом множество признаков понятия АВТОМОБИЛЬ является объединением признаков своих составных частей.
Пример иерархии агрегации представлен на рис. 2.4.
Так как признаки составляющих понятий наследуются понятием-агрегатом, то схемы понятий при абстракции агрегации связаны между собой выражением
shmR = shmP U shmQ. (2.19)
Допустима, в частности, точка зрения, когда признаки также рассматриваются как составные части понятия. Это означает, что понятие является агрегатом, состоящим из своих признаков. Семантическое отличие агрегации признаков от агрегации понятий заключается в том, что признаки не определяются как независимые понятия ПО и, следовательно, могут быть представлены в мо-
58
дели знаний только в том случае, когда описаны соответствующие базовые понятия.
Абстракция агрегации выражает такую связь понятий, которая семантически обозначается как «часть — целое».
Процессом, противоположным абстракции агрегации, является декомпозиция. При декомпозиции исходное понятие расчленяется на ряд независимых компонент, каждая из которых обладает лишь частью признаков исходного понятия.
Абстракция агрегации используется в тех случаях, когда необходимо синтезировать сложное понятие, состоящее из совокупности более простых понятий. Если в результате данного процесса мы получим понятия, состоящие из других понятий, то можно говорить об иерархии агрегации. Так, понятие КУРС может включать понятие ГРУППА, которое в свою очередь включает понятие СТУДЕНТ.
Таким образом, абстракция агрегации позволяет выразить семантику внутренних связей, существующих между отдельными элементами системы. При этом структура сложного понятия раскрывается путем его декомпозиции на совокупность составляющих понятий, называемых компонентами. Такая декомпозиция приводит к представлению анализируемого понятия в виде многоуровневой иерархической системы компонент, дающих описание внутреннего устройства сложного понятия.
^ Обобщение понятий — это такая форма порождения нового понятия R на основе одного или нескольких подобных понятий Р и Q. когда порождаемое понятие К сохраняет общие признаки исходных понятий Р и Q, но игнорирует их более тонкие различи-
59
тельные признаки. Для интенсионалов и экстенсионалов понятий Р, Q и R, участвующих в данном процессе абстракции, справедливы следующие соотношения:
ints R = ints P ints Q. С2-20)
intLRintLPVintLQ, (2.21)
extR = extPΠextQ. (2.22)
Здесь знак Ц означает операцию размеченного объединения множеств. Выражение (2.20) непосредственно следует из определения, так как пересечение интенсионалов понятий Р и Q обеспечивает выделение их общих признаков. Так как любая сущность ег extR в соответствии с выражением (2.22) является либо сущностью ер extP, либо сущностью eq extQ, то всегда один из интенсионалов intLP или intLQ истинен, а это значит, что будет истинен и интенсионал понятия R, если он определен логической формулой (2.21).
Напомним, что в отличие от операции обычного объединения множеств, когда любые различия между элементами объединяемых множеств игнорируются, при выполнении операции размеченного объединения существовавшие различия элементов исходных множеств сохраняются. Это означает, что для обобщения возможен противоположный процесс, когда исходное понятие может делиться на несколько более узких понятий. Такой процесс называется специализацией, или ограничением понятий. Следовательно, при обобщении подобные видовые понятия соотносятся с родовым понятием более высокого уровня, а при специализации, наоборот, родовые понятия делятся на два или более видовых понятия низшего уровня. Это означает, что объем (экстенсионал) понятия в процессе обобщения увеличивается и содержит в качестве своей части объемы (экстенсионалы) исходных понятий, что и находит свое выражение в формуле (2.22).
Особенностью примера иерархии обобщений, представленного на рис. 2.5, является наличие для понятия ЗАВЕДУЮЩИЙ КАФЕДРОЙ двух понятий более высокого уровня, с которыми данное понятие связано отношением ЕСТЬ — НЕКОТОРЫЙ. Если понятия более низкого уровня связаны отношением обобщения только с одним понятием более высокого уровня, тогда возникает древовидная структура обобщений.
Для схемы понятия-обобщения R и обобщаемых понятий Р и Q, которые называют также категориями, выполняется соотношение
shmR = shmP ∩ shmQ. (2.23)
60
1 Использование абстракций обобщения и агрегации и правил наследования признаков обеспечивает мощные механизмы накопления и обработки информации, хранящейся в БД и в БЗ, о фрагменте действительности.
Абстракции агрегации и обобщения обеспечивают возможность структурированного описания предметной области без дублирования информации и возникновения противоречий и вместе с тем позволяют путем использования процедур логического вывода, основанных на правилах наследования признаков, произвести ее корректную переработку.
Группировка объектов на основе соответствия их интенсионалов некоторому эталону называется типизацией, а полученный при этом класс объектов именуется типом. Например, класс объектов ЛИЧНОСТЬ может быть создан путем объединения таких понятий-сущностей, как Петров, Сидоров, Александров и т. д., при том условии, что совокупности основных признаков этих понятий совпадают. Обратным по отношению к процессу типизации является процесс порождения экземпляров.
Понятие-тип обычно выражает то общее, что присуще некоторой совокупности сущностей ПО. Причем это общее в первую очередь выражает однородность, однотипность сущностей и игнорирует индивидуальные отличия сущностей друг от друга, определяемые значениями признаков.
Идентифицировать определенную сущность внутри типа можно только в том случае, когда заданы значения ее признаков. Набор признаков, единственным образом идентифицирующий сущность внутри экстенсионала данного типа, обычно называют ключом.
Таким образом, понятие-тип можно интерпретировать как отношение эквивалентности, которое задается на экстенсионале данного понятия. Так как всякое отношение эквивалентности может быть выражено через отношение БЫТЬ ЭТАЛОНОМ, то отсюда
61
следует, что сущности принадлежат одному типу в том случае, когда они имеют общий эталон, который может быть отождествлен с их интенсионалом [46].
Если в процессе абстракции типизации понятий-сущностей Р и Q порождается понятие-тип R, то для интенсионалов, схем и экс-тенсионалов должны выполняться следующие соотношения:
intsR = intsP = intsQ, (2.24)
intLR = intLP = intLQ, (2.25)
shmR = shmP = shmQ, (2.26)
extR = extPextQ. (2.27)
Принадлежность сущностей одному типу позволяет переносить знания с одной сущности на другую. Так, можно утверждать, что сущности, принадлежащие экстенсионалу одного типа, имеют одинаковое внутреннее устройство, а значит, и обладают одной и той же схемой. Сопоставление абстракции типизации с абстракцией обобщения показывает, что типизация является частным случаем обобщения. Семантически типизация позволяет выразить отношение ЕСТЬ ЭКЗЕМПЛЯР между понятием-сущностью и понятием-типом и абстрагироваться от различий между описываемыми экземплярами.
Ранее мы рассматривали такие отношения между понятиями, для которых определены специальные правила, позволяющие по интенсионалам исходных понятий перейти к интенсионалу искомого понятия, а также указать формулы, позволяющие определить его схему на основе схем базовых понятий. Однако при формальном описании очень часто встречается ситуация, когда нет необходимости в такой сильной интеграции понятий, хотя определенные связи между понятиями следует отразить. Данная возможность обеспечивается путем использования абстракции ассоциации. Связь между двумя независимыми понятиями, при которой необходимо учесть соответствие между экземплярами сущностей, принадлежащих экстенсионалам понятий одного или разных типов, называется ассоциацией. Для ассоциации одним из основных моментов является выделение того обстоятельства, что экстенсионал понятия-ассоциации R является подмножеством декартова произведения экстенсионалов исходных понятий Р и Q:
extR = extP x extQ. (2.28)
Связи между интенсионалами и схемами для ассоциации в общем случае не определяются, однако в каждом конкретном приложении они должны быть специфицированы. Наиболее подходящей формой для указания данной информации является использование правил в виде хорновских дизъюнктов. Спецификация соотношений, связывающих интенсионалы понятий ассоциации в виде хорновских дизъюнктов, позволяет применять стандартные методы логического вывода.
Если от ассоциации понятий осуществляется переход к отдельным понятиям, то такой процесс называют индивидуализацией. При этом происходит абстрагирование от имеющихся связей между двумя понятиями, что позволяет рассматривать их независимо друг от друга и, следовательно, значительно упростить представление ПО при формировании БЗ.
Обычно в ассоциации различают три вида связей между отдельными сущностями 1:1, 1:М и N:M.
При взаимооднозначном отображении сущностей возникает ассоциация типа 1:1. Примером служит связь между понятиями ЛИЧНОСТЬ и АВТОМОБИЛЬ, если не разрешается иметь более одного автомобиля. Ассоциация вида 1:М возникает в тех случаях, когда одна из сущностей позволяет идентифицировать несколько других сущностей. Однако если рассматривать данную связь в другом направлении, то можно указать только одну сущность, с которой связана каждая из сущностей ассоциации. Например, между понятиями СЛУЖАЩИЙ и ОТДЕЛ может быть определена ассоциация типа 1:М.
Ассоциация вида N:M возникает в тех случаях, когда в обоих направлениях ассоциации можно указать более одной сущности, с которой возможна связь, т. е. связи в ассоциации в обоих направлениях не уникальны. Примером такой ассоциации служит связь между ИЗДЕЛИЯМИ и ПОСТАВЩИКАМИ, когда одно ИЗДЕЛИЕ поставляется несколькими ПОСТАВЩИКАМИ и ПОСТАВЩИК может поставлять несколько ИЗДЕЛИЙ.
Сопоставление различных методов абстрагирования понятий показывает, что фундаментальными видами абстракций являются агрегация и обобщение. Абстракция типизации — лишь частный случай абстракции обобщения, когда игно
еще рефераты
Еще работы по разное
Реферат по разное
Перевод с английского под редакцией Я. А. Рубакина ocr козлов М. В
17 Сентября 2013
Реферат по разное
Міністерство аграрної політики та продовольства україни мінагрополітики
17 Сентября 2013
Реферат по разное
Актуальність теми
17 Сентября 2013
Реферат по разное
Робоча програма навчальної дисципліни для студентів за напрямом підготовки психологія, спеціальністю " психологія " : 2010 р с. Розробник: доцент кафедри психології, к психол н. Гупаловська В. А
17 Сентября 2013