Реферат: Методы формализации знаний о предметной области понятийная структура предметной области


Глава 2

МЕТОДЫ ФОРМАЛИЗАЦИИ ЗНАНИЙ О ПРЕДМЕТНОЙ ОБЛАСТИ

2.1. Понятийная структура предметной области

При построении описания выделенного фрагмента реальной действительности (предметной области — ПО) одним из основных допущений является предположение о том, что мир состоит из не­зависимых объектов (предметов, процессов, вещей или сущно­стей), которые могут быть уникально идентифицированы. В даль­нейшем при обозначении реальных объектов ПО для однозначно­сти будем использовать термин сущность.

Напомним, что термин «проблемная область» включает поня­тие «предметная область» (т.е. множество сущностей, описываю­щих область экспертизы) плюс решаемые в ней задачи (представ­ляемые в виде исполняемых утверждений типа правил, процедур, формул и т.д.).

Определение 2.1. Сущность — это объект произвольной приро­ды, принадлежащий реальному или воображаемому (виртуальному) миру. На самом общем уровне сущности делятся на следующие ка­тегории (классы): предмет, свойство (атрибут), состояние, процесс, событие, оценка, модификатор, квантификатор, модальность. Лю­бое понятие относится к одной из этих категорий [54].

Сущность ПО необходимо адекватным образом представить в памяти вычислительной машины, чтобы с ее помощью обеспечить поиск, анализ, обработку и выдачу накопленной информации в форме, удобной для принятия решений. Эта задача может быть ре­шена путем использования соответствующих средств описания ПО, предоставляющих необходимые базовые понятия, инвариант­ные по отношению к любым ПО, и правила, позволяющие строить более сложные синтаксические конструкции на основе базовых. Средства предоставления информации о ПО различные исследова­тели называют по-разному.

45

Под понятием (концептом) понимается класс сущностей, объ­единяемых на основе общности признанных (атрибутивных) структур.

Следует отметить, что наиболее естественным для человека способом описания любых сущностей ПО является соотнесение с ними в собственной памяти совокупности определенных понятий (простых и сложных), образующих понятийную структуру предмет­ной области, а в памяти ЭВМ — как правило, некоторых объектов, состоящих из атрибутов со значениями (хотя это, безусловно, не единственный способ реализации описания понятий в памяти ЭВМ).

В ряде случаев вообще не делается попыток различения поня­тийной структуры и объектов предметной области, а сразу отмеча­ется, что предметную область можно характеризовать совокупно­стью объектов, характеристик объектов и отношений между объек­тами [40]. Справедливость подобных утверждений будет вполне очевидна после рассмотрения некоторых приведенных ниже опре­делений [24, 25].

Определение 2.2. Под простым понятием понимается тройка, со­стоящая из имени, интенсионала и экстенсионала понятия.

Имя понятия — любой идентификатор; интенсионал поня­тия — множество атрибутов (свойств) понятия с областями их оп­ределения; экстенсионал понятия — совокупность кортежей значе­ний, удовлетворяющих интенсионалу; атрибуты — первичные ха­рактеристики данной ПО, не подлежащие дальнейшей структури­зации.

^ Определение 2.3. Сложные понятия — это понятия, образованные из ранее определенных понятий применением некоторых правил.

Следует добавить, что простота или сложность понятий являет­ся явлением относительным и изменяющимся с развитием науки, причем изменение статуса понятия возможно и в процессе разра­ботки конкретной ИнС. Отметим также, что для определения по­нятийной структуры области необходимо выявление отношений на множестве понятий, которые являются отражением объективных законов ПО или субъективных мнений специалистов.

Напомним, что классические модели данных (иерархические и сетевые) базируются на таких понятиях, как запись, атрибут и связь. Современные модели данных (реляционные и семантиче­ские) используют математическое понятие отношение, которое за­дается на множествах, и понятие объекта для представления сущ­ностей ПО в БД.

46

В соответствии с данными определениями отметим следую­щее. Структура признаков — это совокупность взаимосвязанных признаков (атрибутов), характеризующих понятие и выделяющих его среди других понятий. Признаки, входящие в [указанную] совокупность, называются существенными. Их состав определяется исходя из множества понятий, в котором необходимо выделить рассматри­ваемое [понятие] [55].

Совокупность существенных признаков, характеризующих поня­тие, называется его содержанием (интенсионалом). В силу ограни­ченного числа существенных признаков A1,...,Ai,...,Ak будем пред­ставлять содержание понятия А множеством А = {A1,...,Aj,...,Ak}. При этом содержание понятия должно отвечать взаимнопротиво-положным требованиям полноты и неизбыточности. Совокупность существенных признаков можно рассматривать как координаты k-мерного признакового пространства. Оно должно отличаться от признакового пространства, характеризующего другое понятие. Если отойти от двух градаций i-гo признака — его наличия, либо отсутствия в анализируемом понятии — и определить меру схоже­сти, то можно решать задачу выявления аналогии понятий.

Класс сущностей, объединяемых в понятие, называется его объемом (экстенсионалом). Сущности, входящие в объем понятия и называе­мые экземплярами, вариантами или фактами, задаются перечислени­ем. Объем понятия, в отличие от его содержания, может варьироваться заданием ограничений. По этой причине объем понятия, как правило, задается перечислением не экземпляров Ai, i= 1, 2, ..., а признаков, которым они удовлетворяют: А = {Аi:Aj  A,j = 1,...,k}.

Знаковое представление понятий. Понятия именуются с помо­щью слов или словосочетаний естественного языка, которые игра­ют роль знаков или имен. Таким образом, носителем знаковой формы представления знания является естественный язык. Он по­зволяет с применением символов (букв и цифр) зафиксировать лю­бую информацию, в том числе и графическую. Такая специфиче­ская форма информации, как музыкальная, записывается с помо­щью знаков специального вида (нотная запись).

Для представления понятия в естественном языке используется
слово или словосочетание, называемое именем. Оно играет роль
идентификатора, выделяя понятие среди остальных. Имя или знак
(sign) — единица языка, отражающая семантически сущность ото-­
бражаемого мира, а синтаксически — субъект или объект высказы­-
вания. В пропозициональной функции имя представляется предмет-­
ной переменной или константой.

47

Иными словами, знак — это заменитель некоторого объекта, явления или процесса, используемый для накопления, хранения, переработки и передачи информации или знаний.

Пара, состоящая из имени и обозначаемого, в семиотике назы­вается знаковой ситуацией. Сущности ПО, на которые можно ссы­латься с помощью имени или знака, как уже упоминалось, называ­ются денотатами.

Денотат знака — это конкретная сущность или предмет, на кото­рые указывает данный знак. Другими словами, денотат знака является способом интерпретации данного знака в рамках некоторой ситуа­ции, рассматриваемой в ПО. Денотат знака — это значение, которое может иметь знак в рамках данной знаковой ситуации [46].

Можно указать на следующие основные свойства знаковой ситуации:

имена способны замещать денотаты. Например, имя понятия
АВТОМОБИЛЬ может использоваться в качестве заместителя лю-­
бого конкретного автомобиля;

имя нетождественно денотату, оно не может полностью за­-
менить денотат. Так, при алгебраических преобразованиях мы мо­-
жем использовать буквенные обозначения чисел. Однако, если не­
обходимо вычислить числовое значение выражения, то требуется
подставить конкретные числа (денотаты) вместо букв;

связь «имя — денотат» многозначна, т. е. некоторое имя мо­-
жет обозначать множество денотатов — омонимия, и наоборот, од­-
ному денотату можно поставить в соответствие несколько имен —
синонимия.

Отношение, связывающее обозначаемую сущность (denotat), отражающее ее понятие (consept) и его имя (designat), графически выражается треугольником Фреге (рис. 2.1). Сплошными линиями изображен базовый треугольник Фреге, характеризующий одно-1значное отношение. Оно является желательным, но не всегда дос- тижимым. Пунктирными линиями изображены два треугольника, представляющие два случая неоднозначности отношения [44].

Треугольник «сущность 1, понятие 1, имя 2» в сочетании с ба-
зовым иллюстрирует случай синонимии. Сущности 1 и понятию 11
ставятся в соответствие два имени, называемые синонимами. Это
слова или словосочетания, тождественные или близкие по своему
значению, например булева алгебра и алгебра логики.

Источниками синонимии являются:

русское и иностранное происхождение (рынок и маркет);

полное и краткое обозначение (килограмм и кг);

фамильный и отражающий существенные признаки (метод
Парето и метод недоминируемых альтернатив);

48



именование сущности по разным признакам (северный и хо-
лодный климат);

различное авторское именование на этапе формирования но-­
вой терминологии (рабочее и функциональное диагностирование).

Треугольник «сущность 2, понятие 2, имя 1» в сочетании с ба­зовым иллюстрирует случаи омонимии и полисемии. Сущностям 1 и 2 и понятиям 1 и 2 ставится в соответствие одно и то же имя, что свидетельствует о его многозначности. В случае полисемии поня­тия 1 и 2 характеризуются общим происхождением (одна статья в толковом словаре), например сферы — небесная и интересов. При омонимии понятия 1 и 2 имеют различное происхождение. Напри­мер, в бытовом значении слово ключ характеризует предмет, свя­занный с безопасностью помещений, а в программировании под ключом понимают программный код, используемый для поиска данных. Смысл таких слов можно распознать только по контексту. К частному случаю омонимии можно отнести омографы — слова, различающиеся звучанием и обозначающие разные понятия (замок и замок).

Определения понятий являются результатом соглашения. Оно достигается, например, при разработке терминологических стан­дартов. Такие определения называются нормативными. Однако в реальной жизни могут использоваться и ненормативные определе­ния. Наиболее подверженным изменению в определении является признак, характеризующий роль или назначение понятия, т.е. его прагматику. В связи с этим Д.А. Поспелов предложил дополнить треугольник Фреге 4-й вершиной, характеризующей прагматику понятия (четырехугольник Поспелова). Он изображен на рис. 2.2.

^ Схема и формулы понятий. Как уже отмечалось, сущности, со­-
ставляющие объем понятия, различаются с помощью признаков.
Признаковые отношения предписывают одним понятиям выпол-­
нять роль некоторых качественных свойств по отношению к дру-­
гим понятиям. Признаки понятий могут быть отнесены к одному
49



из следующих типов: дифференциальные, характеристические и валентные [46].

^ Дифференциальные признаки используются в качестве характери­стики содержания понятия.

Характеристические — это признаки, которые позволяют отли­чить сущности, относящиеся к объему одного и того же понятия.

Валентные — это признаки, обеспечивающие связь между раз­личными понятиями. Без потери общности можно считать такие связи бинарными.

Признак характеризуется именем и значением. Можно выде­лить несколько типов значений признаков: логические, числовые, символьные и др. Имя признака вместе с его значением образует полное наименование соответствующего признака. Например, при­знак ВОЗРАСТ вместе со значением «30 лет» образует наименова­ние признака «возраст 30 лет».

Имя признака позволяет указать ту семантическую роль, кото­рую играет его значение в организации связи между сущностью и признаком, ее характеризующим. Так, в предыдущем примере имя признака ВОЗРАСТ характеризует определенную роль понятия «30 лет» по отношению к некоторой сущности, в качестве которой вы­ступает конкретный человек.

Совокупность имен дифференциальных, характеристических и валентных признаков составляет схему понятия, обозначаемую как shm P. Таким образом, схему понятия Р можно представить в виде тройки

shm P = , (2.1)



Имена признаков будем обозначать прописными буквами ла­тинского алфавита (возможно, с индексами) А, В, С, D, ...., а зна­чения — строчными буквами.

Тот факт, что признак А, данного понятия принимает одно из возможных значений a] GdomA;, будем выражать в виде пары (А;,

aj). Здесь dom А обозначает множество (домен) всех возможных значений признака А- Тогда каждая сущность е, принадлежащая

50

P(X) Ai(zi1,X) v Ai(zi2,X) v... v Ai(zim,X), (24)

где v, & — знаки дизъюнкции и конъюнкции соответственно.

Признаки, которые могут принимать несколько значений, на­зываются множественными.

Более сложный класс понятий описывается дизъюнктив­но-конъюнктивными логическими выражениями вида

Р(Х) Q1 (X) V Q2(X)...VQm (X), (2.5)

n

где Qk = & Рki(Х) и Pki(X) — предикаты, входящие в k-й дизъюнкт.

i=l

Выражение вида (2.5) фактически определяет понятие Р(Х) че­рез m-альтернативных понятий Qk(X), каждое из которых является конъюнкцией предикатов Рki (X).

В связи с этим без потери общности можно считать, что любое понятие может быть представлено формулой

Р(Х) Рi(Х), (2.6)

где Рi(Х) — предикаты, которые могут интерпретироваться как дру­гие понятия или как признаки понятия Р(Х).

Если учесть деление признаков понятия Р(Х) на дифференци­альные, характеристические и валентные, то логическое выражение (2.6) можно представить в виде

n m 1

P(X)& Di(dij,X)&Hj(X)&Vk(X), (2.7)

i=1 j=1 k=1

где dij domDi — значения дифференциальных признаков Di.

Устанавливая различные значения дифференциальных призна­ков, мы получаем класс понятий с однородной структурой: все по­нятия данного класса обладают одинаковой схемой.

Так как для импликации (2.6) справедлива эквивалентная фор­ма записи

Р1 (X) vP2(X) v... v Pn (X) v Р(Х), (2.8)

где  — знак отрицания, то это означает, что широкий класс поня­тий может быть представлен в виде хорновских дизъюнктов.

Хорновским называют дизъюнкт, который содержит не более одного позитивного компонента.

52

Мы не вводим для описания понятий более сложные логиче­ские выражения, а ограничиваемся лишь такими, которые могут быть представлены в виде хорновских дизъюнктов. Как показал Ковальски [74], применение хорновских дизъюнктов по своим изо­бразительным возможностям эквивалентно логике предикатов пер­вого порядка, но позволяет реализовать эффективные алгоритмы обработки.

В тех случаях, когда понятие определяется альтернативными логическими выражениями, целесообразно использовать термин процедура.

Под процедурой понимают множество хорновских дизъюнктов, заголовки которых содержат одинаковые имена предикатов и одно и то же количество аргументов. Так, понятие Р(Х, Y) может быть определено процедурой вида

P(X,Y)  R,(X,a1)&Q1(Y,b1),
P(X,Y)  R2(X,a2)&Q2(Y,b2), <2-9)

которая означает, что для определения понятия Р(Х, Y) сначала следует использовать предикаты Ri(Y, а1) и Qi(Y, b1), а затем — пре­дикаты R2(Y, a2) и Q2(Y, b2).

Например, если необходимо определить понятие ПРЕДОК (X, Y), то это можно сделать с помощью следующей процедуры:

^ ПРЕДОК (X, Y)  РОДИТЕЛЬ (X, Y),

ПРЕДОК (X, Y)  РОДИТЕЛЬ (X, Z) & ПРЕДОК (Z, Y).

Здесь первая формула содержит утверждение, что субъект X яв­ляется предком Y, если он является его родителем. Вторая формула определяет понятие ПРЕДОК (X, Y) рекурсивно: субъект X являет­ся предком Y, если существует некоторый Z, для которого X явля­ется родителем и, кроме того, Z является предком Y.

Таким образом, наиболее удобным аппаратом формализации понятий, используемых для представления знаний о фактах, дейст­виях, событиях, ситуациях и т. д., является логика исчисления пре­дикатов. Ограничиваясь правилами, формулируемыми на основе хорновских дизъюнктов, мы получим простой и достаточно общий способ выражения связей как между признаками и понятиями, так и между различными понятиями.

^ Экстенсионал и интенсионал понятия. В семиотике для характе­ристики понятия и знаковой ситуации получили распространение категории денотата и концепта, а в логике для тех же целей служат термины «экстенсионал» и «интенсионал».

53

Одно и то же понятие может обозначать разные денотаты. Множество всех объектов, предметов или сущностей, являющихся денотатами понятия, составляет объем, или экстенсионал понятия. Если экстенсионал понятия Р обозначить через extP, то может за­писать следующее выражение [46]:

ExtP = [е1 е2,...,еn], (2.10)

где е1, е2, ..., еn — сущности, являющиеся денотатами понятия Р.

Экстенсионал понятия — это совокупность всех его допустимых денотатов, соответствующих концепту этого понятия.

Так, чтобы описать экстенсионал понятия АВТОМОБИЛЬ, следует рассмот­реть класс всех автомобилей. Мы полагаем, что в БЗ используются только конечные экстенсионалы понятия.

Если ограничиться понятиями, которые допускают не более од­ного значения некоторого признака, то между экстенсионалом по­нятия и его признаками может быть установлена функциональная связь вида

fi:extPdomAi, (2.11)

сопоставляющая каждой сущности eij  extP некоторое значение признака zij domAi.

Разные понятия могут иметь один и тот же экстенсионал. Так, понятия «множество точек, равноудаленных от сторон данного угла» и «прямая, делящая угол на два равных угла», имеют одно и то же множество точек в качестве денотатов (биссектрису данного угла). Эти понятия имеют общий экстенсионал, но выражают раз­личный смысл, который мы связываем с их интенсионалами. Сле­довательно, понятие не полностью характеризуется экстенсиона­лом. Необходимо учитывать также интенсиональный аспект поня­тия, который связан с его концептом.

Интенсионал понятия — это тот смысл, который мы вкладываем в данное понятие, т. е. интенсионал характеризует концепт данного понятия, его содержание. Интенсионал понятия Р будем обозна­чать intP.

Возможны два подхода к формальному представлению интен-сионала: теоретико-множественный и логический. При теорети­ко-множественной формализации в интенсионал обычно включа­ют множество всех дифференциальных признаков, характеризую­щих понятие.

Так, если понятие Р обладает некоторой совокупностью диффе­ренциальных признаков (D1, d1) (D2, d2 ), ..., (Dn, dn), где Di — это

54

имя дифференциального признака, a dn — соответственно его значе­ние, то интенсионал понятия Р можно представить в виде множе­ства пар

intsP = {(D,d1),(D2,d2),...,(Dn,dn). (2.12)

Здесь индекс S (от английского слова Set) у интенсионала озна­чает его теоретико-множественную трактовку. Данный способ чаще всего используется для формального представления интен-сионалов простых понятий. При этом под интенсионалом простого понятия Р понимают совокупность признаков, необходимых и дос­таточных для принятия решения о принадлежности некоторой сущности экстенсионалу данного понятия.

Очевидно, что при таком способе представления схема понятия не содержится в его интенсионале, так как имена характеристиче­ских и валентных признаков в выражении (2.12) отсутствуют.

Для сложных понятий более естественна логическая форма представления интенсионала. Так как широкий класс понятий мо­жет быть описан логическими формулами в виде хорновских дизъ­юнктов, то под интенсионалом понятия в этом случае обычно по­нимают правую часть импликации (2.6), т. е.

n

intLP(X)=&Pi(X). (2.13)

i=1

Здесь индекс L (от английского слова Logic) у интенсионала оз­начает его логическую формализацию.

Соответственно, если понятие представлено логической форму­лой (2.7), то интенсионал может быть определен выражением

n m 1

intLP(X)=&Di(di,X)&Cj(X)&Vk(X). (2.14)

i=l j=l k=l

Очевидно, что при таком представлении интенсионал включает также информацию о схеме понятия, хотя и не выделенную явным образом.

Логическая форма представления интенсионала допускает сле­дующую интерпретацию: интенсионал понятия Р принимает ис­тинное значение на всех сущностях ei  extP. Так, на множестве точек «биссектриса утла» истинны оба утверждения: «равноудалены от сторон данного угла» и «делят данный угол на два равных».

Связи между различными категориями, используемыми для описания понятий в логике и семиотике, представлены на рис. 2.3.

55



Суммируя вышеизложенное, можно представить понятие в виде тройки:

Р = . (2.15)

В зависимости от характера деятельности внимание проекти­ровщиков ИнС концентрируется на различных составляющих по­нятия: системные аналитики и администраторы задач приложений, создающие формальную модель ПО, больше должны опираться на интенсионал понятий ПО, а администраторы базы данных — на их схему. Тем самым понятие становится чрезвычайно удобным сред­ством, которое позволяет, с одной стороны, путем использования интенсионала выразить семантические отношения для некоторого фрагмента реального мира, а с другой стороны, с помощью схемы обеспечить возможность перехода к менее детальному описанию и представлению этой информации в базе знаний.

^ Абстрагирование понятий. Абстракция понятий представляет со­бой основной механизм, с помощью которого человек познает ок­ружающий мир.

Абстракция — это выделение существенных признаков и связей понятий, используемых при решении данной задачи, и игнориро­вание несущественных. Абстрагирование является основным мето­дологическим приемом при разработке программного обеспечения. Оно позволяет разбить решаемую задачу на подзадачи, каждая из которых проще исходной задачи. Причем при рассмотрении на­чальной задачи нет необходимости учитывать те детали и ту более подробную информацию, которые используются на этапе рассмот­рения подзадач. В поле зрения должны находиться только те сведе­ния, которые позволяют охватить проблему целиком и осуществить ее декомпозицию на более простые подзадачи.

Абстрагирование обеспечивает упорядочение, структуризацию и понимание информации о реальном мире. Поэтому методы абст­ракции широко используются в формальном описании предметной области.

56

Известны следующие основные типы абстрагирования понятий: агрегация, обобщение, типизация и ассоциация [46].

Перечисленным типам абстрагирования соответствуют опреде­ленные логические приемы, с помощью которых может быть дос­тигнут необходимый результат. К таким приемам образования по­нятий обычно относят:

синтез и анализ понятий;

объединение понятий на основе их сходства или подобия;

сравнение и сопоставление конкретных сущностей с целью вы­явления общих признаков;

связывание двух или более понятий.

Синтез и анализ понятий используются в абстракции агрега­ции. В процессе объединения понятий на основе их сходства или выявленного подобия порождается новое понятие, которое являет­ся обобщением исходных понятий. При установлении определен­ного сходства сущностей в процессе сравнения или сопоставления их признаков может порождаться новое более общее понятие, ко­торое объединяет целый класс подобных понятий, что соответству­ет абстракции типизации. Если в процессе связывания понятий об­разуется новое понятие, а исходные понятия выступают в виде чле­нов вновь порожденного понятия, то это абстракция ассоциации.

Вследствие того, что для каждого метода абстрагирования воз­можно как повышение уровня абстракции, так и его понижение, мы имеем дело с парами: агрегация — декомпозиция, обобще­ние — специализация, типизация — конкретизация, ассоциа­ция — индивидуализация. Данные виды абстракций фиксируют простейшие базовые отношения между понятиями и поэтому более подробно рассматриваются ниже.

Агрегация понятий используется в тех случаях, когда вновь по­рожденное понятие включает исходные понятия в качестве своих компонент или составных частей. Например, понятие АВТОМОБИЛЬ включает в качестве своих составных частей такие компоненты, как КУЗОВ, ШАССИ, ДВИГАТЕЛЬ.

Агрегация понятий — это такая форма связи понятий, при ко­торой на основе исходных понятий Р и Q образуется понятие агре­гат R более высокого уровня.

При агрегации вновь образованное понятие R наследует все признаки входящих в него понятий Р и Q, так что для интенсиона-лов при их логической формализации и экстенсионалов выполня­ются следующие соотношения:

intLRintLR∫LQ, (2.16)

57



extR = extP x extQ. (2.17)

Выражение (2.16) можно интерпретировать следующим обра­зом. Для принятия решения о принадлежности некоторой сущно­сти экстенсионалу понятия-агрегата R необходимо, чтобы эта сущ­ность удовлетворяла как интенсионалу понятия Р, так и интенсио-налу понятия Q.

Легко видеть, что это требование удовлетворяется, если экстен-сионал понятия-агрегата R определяется в соответствии с выраже­нием (2.17).

Действительно, если сущность ер Е extP, а сущность е Е extQ, то intLP(ep) = intLQ(eq) = true. Но сущность er Е extP x extQ в соот­ветствии с правилом наследования обладает одновременно призна­ками обеих сущностей ер и eq, поэтому intLP(er) = intLQ(er) = true, что приводит к истинности выражения

intLR(er) = intLP(er)∫LQ(er).

Очевидно, что для теоретико-множественной формы представ­ления интенсионалов будем иметь

intsR = intsPUintsQ. (2.18)

Из выражения (2.18) непосредственно следует, что сущность er Е extR обладает дифференциальными признаками обоих понятий Р и Q, что соответствует сформулированному выше правилу насле­дования признаков для абстракции агрегации. Так, понятие АБТОМОБИЛЬ наследует все признаки, относящиеся к понятиям ДВИГАТЕЛЬ, КУЗОВ и ШАССИ. При этом множество признаков понятия АВТОМОБИЛЬ является объединением признаков своих составных частей.

Пример иерархии агрегации представлен на рис. 2.4.

Так как признаки составляющих понятий наследуются поняти­ем-агрегатом, то схемы понятий при абстракции агрегации связаны между собой выражением

shmR = shmP U shmQ. (2.19)

Допустима, в частности, точка зрения, когда признаки также рассматриваются как составные части понятия. Это означает, что понятие является агрегатом, состоящим из своих признаков. Се­мантическое отличие агрегации признаков от агрегации понятий заключается в том, что признаки не определяются как независи­мые понятия ПО и, следовательно, могут быть представлены в мо-

58

дели знаний только в том случае, когда описаны соответствующие базовые понятия.

Абстракция агрегации выражает такую связь понятий, которая семантически обозначается как «часть — целое».

Процессом, противоположным абстракции агрегации, является декомпозиция. При декомпозиции исходное понятие расчленяется на ряд независимых компонент, каждая из которых обладает лишь частью признаков исходного понятия.

Абстракция агрегации используется в тех случаях, когда необхо­димо синтезировать сложное понятие, состоящее из совокупности более простых понятий. Если в результате данного процесса мы получим понятия, состоящие из других понятий, то можно гово­рить об иерархии агрегации. Так, понятие КУРС может включать понятие ГРУППА, которое в свою очередь включает понятие СТУДЕНТ.

Таким образом, абстракция агрегации позволяет выразить се­мантику внутренних связей, существующих между отдельными эле­ментами системы. При этом структура сложного понятия раскры­вается путем его декомпозиции на совокупность составляющих по­нятий, называемых компонентами. Такая декомпозиция приводит к представлению анализируемого понятия в виде многоуровневой иерархической системы компонент, дающих описание внутреннего устройства сложного понятия.

^ Обобщение понятий — это такая форма порождения нового по­нятия R на основе одного или нескольких подобных понятий Р и Q. когда порождаемое понятие К сохраняет общие признаки ис­ходных понятий Р и Q, но игнорирует их более тонкие различи-

59



тельные признаки. Для интенсионалов и экстенсионалов понятий Р, Q и R, участвующих в данном процессе абстракции, справедли­вы следующие соотношения:

ints R = ints P ints Q. С2-20)

intLRintLPVintLQ, (2.21)

extR = extPΠextQ. (2.22)

Здесь знак Ц означает операцию размеченного объединения мно­жеств. Выражение (2.20) непосредственно следует из определения, так как пересечение интенсионалов понятий Р и Q обеспечивает выделе­ние их общих признаков. Так как любая сущность ег  extR в соот­ветствии с выражением (2.22) является либо сущностью ер  extP, либо сущностью eq  extQ, то всегда один из интенсионалов intLP или intLQ истинен, а это значит, что будет истинен и интенсионал понятия R, если он определен логической формулой (2.21).

Напомним, что в отличие от операции обычного объединения множеств, когда любые различия между элементами объединяемых множеств игнорируются, при выполнении операции размеченного объединения существовавшие различия элементов исходных мно­жеств сохраняются. Это означает, что для обобщения возможен противоположный процесс, когда исходное понятие может делить­ся на несколько более узких понятий. Такой процесс называется специализацией, или ограничением понятий. Следовательно, при обобщении подобные видовые понятия соотносятся с родовым по­нятием более высокого уровня, а при специализации, наоборот, родовые понятия делятся на два или более видовых понятия низ­шего уровня. Это означает, что объем (экстенсионал) понятия в процессе обобщения увеличивается и содержит в качестве своей части объемы (экстенсионалы) исходных понятий, что и находит свое выражение в формуле (2.22).

Особенностью примера иерархии обобщений, представленного на рис. 2.5, является наличие для понятия ЗАВЕДУЮЩИЙ КА­ФЕДРОЙ двух понятий более высокого уровня, с которыми данное понятие связано отношением ЕСТЬ — НЕКОТОРЫЙ. Если поня­тия более низкого уровня связаны отношением обобщения только с одним понятием более высокого уровня, тогда возникает древо­видная структура обобщений.

Для схемы понятия-обобщения R и обобщаемых понятий Р и Q, которые называют также категориями, выполняется соотношение

shmR = shmP ∩ shmQ. (2.23)

60

1 Использование абстракций обобщения и агрегации и правил наследования признаков обеспечивает мощные механизмы накоп­ления и обработки информации, хранящейся в БД и в БЗ, о фраг­менте действительности.

Абстракции агрегации и обобщения обеспечивают возможность структурированного описания предметной области без дублирова­ния информации и возникновения противоречий и вместе с тем позволяют путем использования процедур логического вывода, ос­нованных на правилах наследования признаков, произвести ее корректную переработку.

Группировка объектов на основе соответствия их интенсиона­лов некоторому эталону называется типизацией, а полученный при этом класс объектов именуется типом. Например, класс объектов ЛИЧНОСТЬ может быть создан путем объединения таких поня­тий-сущностей, как Петров, Сидоров, Александров и т. д., при том условии, что совокупности основных признаков этих понятий сов­падают. Обратным по отношению к процессу типизации является процесс порождения экземпляров.

Понятие-тип обычно выражает то общее, что присуще некото­рой совокупности сущностей ПО. Причем это общее в первую оче­редь выражает однородность, однотипность сущностей и игнориру­ет индивидуальные отличия сущностей друг от друга, определяе­мые значениями признаков.

Идентифицировать определенную сущность внутри типа можно только в том случае, когда заданы значения ее признаков. Набор признаков, единственным образом идентифицирующий сущность внутри экстенсионала данного типа, обычно называют ключом.

Таким образом, понятие-тип можно интерпретировать как от­ношение эквивалентности, которое задается на экстенсионале дан­ного понятия. Так как всякое отношение эквивалентности может быть выражено через отношение БЫТЬ ЭТАЛОНОМ, то отсюда

61

следует, что сущности принадлежат одному типу в том случае, ко­гда они имеют общий эталон, который может быть отождествлен с их интенсионалом [46].

Если в процессе абстракции типизации понятий-сущностей Р и Q порождается понятие-тип R, то для интенсионалов, схем и экс-тенсионалов должны выполняться следующие соотношения:

intsR = intsP = intsQ, (2.24)

intLR = intLP = intLQ, (2.25)

shmR = shmP = shmQ, (2.26)

extR = extPextQ. (2.27)

Принадлежность сущностей одному типу позволяет переносить знания с одной сущности на другую. Так, можно утверждать, что сущности, принадлежащие экстенсионалу одного типа, имеют оди­наковое внутреннее устройство, а значит, и обладают одной и той же схемой. Сопоставление абстракции типизации с абстракцией обобщения показывает, что типизация является частным случаем обобщения. Семантически типизация позволяет выразить отноше­ние ЕСТЬ ЭКЗЕМПЛЯР между понятием-сущностью и поняти­ем-типом и абстрагироваться от различий между описываемыми экземплярами.

Ранее мы рассматривали такие отношения между понятиями, для которых определены специальные правила, позволяющие по интенсионалам исходных понятий перейти к интенсионалу иско­мого понятия, а также указать формулы, позволяющие определить его схему на основе схем базовых понятий. Однако при формаль­ном описании очень часто встречается ситуация, когда нет необхо­димости в такой сильной интеграции понятий, хотя определенные связи между понятиями следует отразить. Данная возможность обеспечивается путем использования абстракции ассоциации. Связь между двумя независимыми понятиями, при которой необ­ходимо учесть соответствие между экземплярами сущностей, при­надлежащих экстенсионалам понятий одного или разных типов, называется ассоциацией. Для ассоциации одним из основных мо­ментов является выделение того обстоятельства, что экстенсионал понятия-ассоциации R является подмножеством декартова произ­ведения экстенсионалов исходных понятий Р и Q:

extR = extP x extQ. (2.28)

Связи между интенсионалами и схемами для ассоциации в об­щем случае не определяются, однако в каждом конкретном прило­жении они должны быть специфицированы. Наиболее подходящей формой для указания данной информации является использование правил в виде хорновских дизъюнктов. Спецификация соотноше­ний, связывающих интенсионалы понятий ассоциации в виде хор­новских дизъюнктов, позволяет применять стандартные методы логического вывода.

Если от ассоциации понятий осуществляется переход к отдель­ным понятиям, то такой процесс называют индивидуализацией. При этом происходит абстрагирование от имеющихся связей между дву­мя понятиями, что позволяет рассматривать их независимо друг от друга и, следовательно, значительно упростить представление ПО при формировании БЗ.

Обычно в ассоциации различают три вида связей между отдель­ными сущностями 1:1, 1:М и N:M.

При взаимооднозначном отображении сущностей возникает ас­социация типа 1:1. Примером служит связь между понятиями ЛИЧНОСТЬ и АВТОМОБИЛЬ, если не разрешается иметь более одного автомобиля. Ассоциация вида 1:М возникает в тех случаях, когда одна из сущностей позволяет идентифицировать несколько других сущностей. Однако если рассматривать данную связь в дру­гом направлении, то можно указать только одну сущность, с кото­рой связана каждая из сущностей ассоциации. Например, между понятиями СЛУЖАЩИЙ и ОТДЕЛ может быть определена ассо­циация типа 1:М.

Ассоциация вида N:M возникает в тех случаях, когда в обоих направлениях ассоциации можно указать более одной сущности, с которой возможна связь, т. е. связи в ассоциации в обоих направ­лениях не уникальны. Примером такой ассоциации служит связь между ИЗДЕЛИЯМИ и ПОСТАВЩИКАМИ, когда одно ИЗДЕ­ЛИЕ поставляется несколькими ПОСТАВЩИКАМИ и ПОСТАВ­ЩИК может поставлять несколько ИЗДЕЛИЙ.

Сопоставление различных методов абстрагирования понятий показывает, что фундаментальными видами абстракций являются агрегация и обобщение. Абстракция типизации — лишь частный случай абстракции обобщения, когда игно
еще рефераты
Еще работы по разное