Реферат: Інформаційна технологія класифікації клінічних діагнозів на основі семантико синтаксичної моделі

--PAGE_BREAK--Семантикою формальної моделі є множина клінічних діагнозів, яка може бути представлена у вигляді набору формул, основаних на аксіомах, що виступають в ролі метамови і вказують на засоби та шляхи побудови цих формул. Доменом інтерпретації цих формул є скінчена кількість класів клінічних діагнозів та їх клінічних характеристик.
Наступним кроком є побудова модель синтаксичної складової класифікації яка складається з множини граматик, кожна з яких є компактним записом усіх варіантів певного діагнозу. Мета-модель, яка полягає в основі моделей (граматик) і здатна відображати як загальний процес трансформації деякої кодової комбінації в Т-термінальний ланцюжок (натурально-мовне описання клінічного діагнозу), або порядок завдання деякого діагнозу за правилами граматики, так і можливу структуру шаблону діагнозу, що задає відповідну граматику, описана правилами (13)-(25).
Кожний клінічний діагноз може бути віднесеним до одного з шаблонів, пов’язаним зі статистичним діагнозом (нозологією МКХ-10):
<shape id="_x0000_i1037" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image025.wmz» o:><img width=«159» height=«24» src=«dopb266387.zip» v:shapes="_x0000_i1037">.                      (13)
Правило (14) показує структуру шаблону, яка складається з початкового термінального рядка бi, який може бути пустим, тобто віднесеним до множини терміналів з пустим ланцюжком, та набору слотів-атрибутів, пов’язаних з даним шаблоном:
<shape id="_x0000_i1038" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image027.wmz» o:><img width=«140» height=«25» src=«dopb266388.zip» v:shapes="_x0000_i1038">.                          (14)
Правило (15) показує структуру набору слотів-атрибутів розширеного опису діагнозу, пов’язаного з кодом Ki:
<shape id="_x0000_i1039" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image029.wmz» o:><img width=«115» height=«24» src=«dopb266389.zip» v:shapes="_x0000_i1039">.                               (15)
Правило (16) показує синтаксичну структуру слота, де l1,l2 – термінальні символи, які визначають границі слоту, Рij – ядро слоту, <shape id="_x0000_i1040" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image031.wmz» o:><img width=«43» height=«21» src=«dopb266390.zip» v:shapes="_x0000_i1040">– термінальні рядки, <shape id="_x0000_i1041" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image033.wmz» o:><img width=«45» height=«24» src=«dopb266391.zip» v:shapes="_x0000_i1041"> – залежні слоти з аналогічною структурою:
<shape id="_x0000_i1042" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image035.wmz» o:><img width=«137» height=«25» src=«dopb266392.zip» v:shapes="_x0000_i1042">.                           (16)
Правила (17-21) показують варіанти структури слота. Додаткові знаки „*” і „!” вказують на обов’язковість підстановки одного зі значень замість нетермінального символу. Знак „&” вказує на можливість підстановки декількох значень нетермінального символу одночасно. Знак розширеної нотації формальних граматик „+” означає обов’язкову підстановку одного або декількох значень замість нетермінального символу.
<shape id="_x0000_i1043" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image037.wmz» o:><img width=«208» height=«25» src=«dopb266393.zip» v:shapes="_x0000_i1043">              (17)
<shape id="_x0000_i1044" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image039.wmz» o:><img width=«168» height=«25» src=«dopb266394.zip» v:shapes="_x0000_i1044">                      (18)
<shape id="_x0000_i1045" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image041.wmz» o:><img width=«147» height=«25» src=«dopb266395.zip» v:shapes="_x0000_i1045">                          (19)
<shape id="_x0000_i1046" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image043.wmz» o:><img width=«205» height=«25» src=«dopb266396.zip» v:shapes="_x0000_i1046">              (20)
<shape id="_x0000_i1047" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image045.wmz» o:><img width=«185» height=«25» src=«dopb266397.zip» v:shapes="_x0000_i1047">.                 (21)
Правила (22-23) описують варіант залежності слотів у шаблоні (слоти Уik і Уil залежать від Уij) у разі обов’язкової та необов’язкової клінічної характеристики. Відповідні правила для формул (19)-(20) будуються аналогічним чином.
<shape id="_x0000_i1048" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image047.wmz» o:><img width=«395» height=«51» src=«dopb266398.zip» v:shapes="_x0000_i1048">               (22)
<shape id="_x0000_i1049" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image049.wmz» o:><img width=«379» height=«51» src=«dopb266399.zip» v:shapes="_x0000_i1049">                  (23)
Правило (24) визначає варіанти значень нетермінального символу, якими можуть бути як термінальні символи, так і певна кількість шаблонів-значень (<shape id="_x0000_i1050" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image051.wmz» o:><img width=«161» height=«27» src=«dopb266400.zip» v:shapes="_x0000_i1050">)
<shape id="_x0000_i1051" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image053.wmz» o:><img width=«283» height=«27» src=«dopb266401.zip» v:shapes="_x0000_i1051">. (24)
Шаблон-значення може бути організований з m-1 слотів-атрибутів, де m – кількість нетермінальних символів в алфавіті, які визначають клінічні характеристики діагнозу
<shape id="_x0000_i1052" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image055.wmz» o:><img width=«152» height=«27» src=«dopb266402.zip» v:shapes="_x0000_i1052">.                        (25)
Отже, модель синтаксичної складової класифікації формується множиною граматик, кожна з яких є компактним записом усіх варіантів визначеного діагнозу.
Таким чином, описана модель визначає синтаксичну складову слоту клінічної характеристики, її компоненти, їх порядок у слоті та у фреймі: залежні слоти; нетермінальні символи; термінальні рядки, що можуть існувати перед клінічною характеристикою, після неї, та взагалі після слоту; правила трансформації.
Модель семантичної складової класифікації формується на базі дескриптивної логіки, що дозволяє віднести мову опису класифікації до формалізованих мов, визначити її переваги і недоліки, можливі шляхи розвитку. Дана модель зводиться до термінологічної аксіоми спадкоємства, а також до набору конструкторів концептів клінічного діагнозу (табл. 1,2). Таким чином, логіку класифікації клінічних діагнозів віднесено до підмножини мов  без можливості використання оператора “обмеження на існування”.

Таблиця 1
Конструктори концептів клінічної класифікації діагнозів
Оператор
Нотація дескрипційної логіки
Вершина сіті
<shape id="_x0000_i1053" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image057.wmz» o:><img width=«28» height=«17» src=«dopb266403.zip» v:shapes="_x0000_i1053">
За межами сіті
<shape id="_x0000_i1054" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image059.wmz» o:><img width=«16» height=«17» src=«dopb266404.zip» v:shapes="_x0000_i1054">
Кон’юнкція
<shape id="_x0000_i1055" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image061.wmz» o:><img width=«96» height=«24» src=«dopb266405.zip» v:shapes="_x0000_i1055">
Імплікація
<shape id="_x0000_i1056" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image063.wmz» o:><img width=«96» height=«24» src=«dopb266406.zip» v:shapes="_x0000_i1056">
Обмеження на значення
<shape id="_x0000_i1057" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image065.wmz» o:><img width=«81» height=«24» src=«dopb266407.zip» v:shapes="_x0000_i1057">
Обмеження на мінімальне число значень
<shape id="_x0000_i1058" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image067.wmz» o:><img width=«87» height=«24» src=«dopb266408.zip» v:shapes="_x0000_i1058">
Обмеження на максимальне число значень
<shape id="_x0000_i1059" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image069.wmz» o:><img width=«87» height=«24» src=«dopb266409.zip» v:shapes="_x0000_i1059">
Таблиця 2
Відповідність конструкторів концептів запропонованої класифікації
Спрощена Нотація
Приклад
 Нотація логіки 
Опис
*Axis
{*F}
фаза захворювання
<shape id="_x0000_i1060" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image071.wmz» o:><img width=«101» height=«51» src=«dopb266410.zip» v:shapes="_x0000_i1060">
Необов'язкова клінічна характе-ристика діагнозу
{*Axis1
{*Axis2}}
{*T{*F}}
<shape id="_x0000_i1061" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image073.wmz» o:><img width=«136» height=«80» src=«dopb266411.zip» v:shapes="_x0000_i1061">
Характеристика F може бути задана, якщо задана характе-ристика T
Axis&
{*O&}
ускладнення
<shape id="_x0000_i1062" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image075.wmz» o:><img width=«139» height=«51» src=«dopb266412.zip» v:shapes="_x0000_i1062">
Можливість завдання декількох значень характеристики одночасно
!Axis
{!T}
ст. важкості
<shape id="_x0000_i1063" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image077.wmz» o:><img width=«164» height=«25» src=«dopb266413.zip» v:shapes="_x0000_i1063">
Обов'язкова характеристика
Формалізмом, здатним описати семантично-синтаксичну модель клінічного діагнозу, є фреймова і, відповідно, об’єктно-орієнтована мови опису знань. Фреймова модель класифікації є композицією наступних складових: аксіом та переліку конструкторів, здатних описати фрейм-концепт(табл.1,2); структури слоту з визначенням відповідних граней (табл.3); функціональної складової класифікації, яка може бути визначена як набір команд мови керування класифікацією та базується на перших двох складових. Основу функціонального рівня класифікації складають команди управління фреймовою мережею класифікації на основі описаної структури. Серед особливостей відзначимо наявність команд завдання абстрактних фреймів, які складаються з певної множини слотів характеристик, успадкування від абстрактних фреймів тощо. Так, процес успадкування від абстрактного фрейму формально описується як правило:
<shape id="_x0000_i1064" type="#_x0000_t75" o:ole=""><imagedata src=«64714.files/image079.wmz» o:><img width=«341» height=«24» src=«dopb266414.zip» v:shapes="_x0000_i1064">, де F − абстрактний фрейм, C − фрейм, F.S – множина слотів супер-фрейму, Copy – предикат, що описує процес копіювання відповідної частини мережі, яка пов’язана з успадкованим слотом, GT – предикат, який описує синтаксичну трансформацію термінів при успадкуванні на основі описаних правил GTRules для даного слоту.
Таблиця 3
Загальна структура слоту
Ім’я грані слоту
Опис грані слоту
SuperSlot
Слот, від якого наслідується даний
MemberSlot
Ідентифікатор слоту
SlotIsDependentOf
Слот, від якого даний залежить
ValueClass
Ім’я концепту (фрейму), з яким задається відношення
Cardinality.Min
Обмеження на мінімальну кількість значень
Cardinality.Max
Обмеження на максимальну кількість зна­чень
OrderInFrame
Порядок слоту у фреймі
OrderInSlot
Порядок підпорядкованого слоту в слоті
DirectionForOrderInSlot
Покажчик напрямку місцезнаходження підпорядкованого слоту в слоті
TerminalString1
Термінальний рядок перед клінічною характеристикою
TerminalString2
Термінальний рядок за клінічною характеристикою
TerminalString3
Термінальний рядок, який стоїть за слотом у фреймі
Перехід до об’єктно-орієнтованої моделі здійснюється наступним чином: структурна частина отриманої фреймової репрезентації відображається на даталогічну модель, а функціональна − на об’єктно-орієнтовану модель, яка описує контур керування класифікацією.
Концептуальна модель класифікації надана на рис. 1. Основою класифікації є композиція класів Frame та Slot, що відповідає за репрезентацію фреймової мережі клінічних діагнозів. Особливістю моделі є використання циклічного зв’язку на базі шаблону Composite, що дозволяє репрезентувати мережу з необмеженою кількістю рівнів ієрархії „частина-ціле”. Залежність слотів у рамках фрейму (конструктор імплікації слотів) визначається циклічним зв’язком класу Slot, що дозволяє задати нескінчену кількість вкладених слотів. Класи AFrameFrame та AFrameSlot відповідають за реалізацію механізму успадкування фреймів-концептів від абстрактних фреймів, при цьому передбачається можливість реалізації часткового успадкування. Важливою особливістю при реалізації успадкування є існування механізму граматичної трансформації філерів визначеного слоту, при якому зі значенням слоту абстрактного фрейму можуть бути пов’язані схеми граматичної трансформації, які визначаються композицією класів GT, GTItem, GTTypeID: клас GT визначає схему трансформації; клас GTItem визначає елементарну трансформацію в рамках фрейму-значення; GTType визначає тип трансформації. Елементарною трансформацією можна вважати заміну вказаних маркерів (Marker) в значенні атрибуту TS0 відповідного фрейму на фразу (Description) за визначеною схемою. Клас Axis відповідає за репрезентацію осей класифікації, тісно пов’язаних з визначенням слотів фреймів. Класи ICD, ICDFrame відповідають за зв’язок з МКХ-10.
Структура таблиці „фрейми” складається з наступних атрибутів: ID — ідентифікатор фрейму; SlotID — ідентифікатор слоту, значенням якого є фрейм; Element — номер характеристики даного класу для даного слоту; TS0 — значення у випадку примітивного концепту або термінальний рядок символів, який передує першому слоту, у разі комплексного, Note — додатковий атрибут для більш детального опису значення характеристики. Структура таблиці „слот” еквівалентна таблиці 3 з доданням атрибуту FrameID, який визначає до якого фрейму відноситься даний слот.
Визначено умови та вимоги до функціональної складової класифікації, які зведено до чотирьох пакетів: робота з класифікацією, робота з базою пацієнтів, взаємодія з іншими термінологічними системами і пошук та аналіз даних по пацієнтам. Побудовано алгоритми та класи керування класифікацією, основними з яких є: CClassificationEntry (репрезентує суб-мережу визначеного фрейму), СNotation (відповідає за нотацію), CCode (відповідає за репрезентацію ієрархічного коду), CFrameValue (відповідає за роботу з фреймом-значенням слоту), CDecoder (відповідає за декодування коду клінічного діагнозу) тощо. Алгоритми пов’язані з обробкою мережі та базуються на використанні механізмів рекурсії, яка виконується логікою програми (переклад на рівень БД не є реальним).
Для того, щоб проаналізувати можливість інтеграції розробленої класифікації з сучасними термінологічними системами, сформовано формальну модель узагальненої термінологічної системи з використанням апарату логіки предикатів, яка об’єднує запропонований підхід з підходами SNOMED CT, UMLS.
Термінологічна система (ТС) надає загальну множину концептів, визначень та термінів (синонімів), які відповідають тим чи іншим концептам та атрибутам, і забезпечує пріоритетну семанти­чну складову загальної системи: ієрархічні стосунки, стосунки „частина-ціла”, логічне озна­чення концептів. Визначення концепту описують його зміст: можливі атрибути, що задають характерис­тики концепту, родові стосунки або стосунки „частина-ціле”. Атрибут “PostOperation” посила­ється на логічну операцію, за допомогою якої склада­ється означення концепту; у разі підтримки ТС декількох логічних операцій можливо додання ще декіль­кох атрибутів задля можливості реалізації формули з дужками.
Розроблена класифікація відповідає за додатковий рівень обмежень щодо семантики описаного діагнозу та за граматичну інтерпретацію. Надбудова даної класифікації пов’язана з термінологічною системою за прави­лом: кожний фрейм (значення) розробленої класифікації має відображення на концепт термінологічної системи, та кож­ний слот має бути відображеним на атрибут ТС. Слід особливо відзначити блок класів FrameCon­straint, SlotConstraint, ValueConstraint, TypeOfConstraint, які вирішують задачу вилучення несумісних концептів-характеристик у рамках одного формулювання діагнозу. Так, FrameConstraint вказує на існування обмежень та на їх характер у вигляді: „всі комбінації значень усіх атрибутів є консистентними…”; „всі консистентні/інконсистентні окрім…”; „існують консистентні/інконсистентні…”. SlotConstraint – надає обмеження на комбінацію слотів: „поява будь-яких значень двох слотів є інконсистентним/консистентним”; „всі консистентні/інконсистентні окрім”; „існують консистентні/інконсистентні”. ValueConstraint – обмеження щодо комбінацію значень таким чином: „одне значення одного слоту і кожне значення другого слоту є консистентними/інконсистентними”; „одне значення одного слоту і одне значення другого слоту є консистентним/ інконсистентними”.
Таким чином, розроблено механізм взаємодії зі стандартними термінологічними системами, який дозволяє представити розроблену класифікацію як потенціальну частину більш загальної сучасної термінологічної системи для розширення її семантичних та синтаксичних можливостей при описі клінічних діагнозів.
У четвертому розділі розглянуто особливості реалізації ПЗ та впровадження автоматизованого класифікатора клінічних діагнозів, який базується на принципах: перспективності засобів розробки інформаційних систем (технологій проектування та програмування); максимальної незалежності від особливостей технічних особливостей інформаційної платформи (специфіка провайдеру баз даних, операційна система); компонентно-орієнтованого підходу розробки інформаційних систем.        
Основу контуру роботи з БД складають ряд програмних класів на основі композиційного використання стандартних засобів мови C# ІDbDataAdapter, ІDbCommand, IDbParameter, HashTable, DataTable, DataSet.
Контур класифікації (рис.2) складається з: редактора класифікації (UCSCD.Editor) та процесора скриптів (UCSCD.ScriptProcessor), які є засобами створення/редагування класифікації експертом (табл.4); бібліотек, що дозволяють здійснювати кодування/декодування клінічних діагнозів, завдання діагнозів пацієнтів, пошук та аналіз, пов’язаний з фактами класифікації в базі пацієнтів. При цьому особливою рисою є забезпечення незалежності класифікації від специфіки ГІС, яка базується на трьох способах використання класифікації: тільки класифікація як сервер термінології на базі API; класифікація і БД пацієнтів на базі API; класифікація і БД пацієнтів на базі візуальних компонентів.
В кінці розділу наведено приклади використання класифікації в підсистемах аналітики і статистики ГІС.
Таблиця 4
Набір основних команд керування класифікацією клінічних діагнозів
Описання команд керування класифікацією
Команда
Значення
Putframe :<fn >:<fv>
Визначити фрейм (Напр.: putframe:C15: Захворювання {!L стравоходу} {, p !W })
Putslotvalue:<fn>.<svn>=<sv>
Визначити філер слоту (Наприклад: Putslotvalue: C15:L1 = шийного відділу)
Deleteframe:<fn>
Видалення фрейму (Deleteframe:K25)
Deleteslot: <fn>.<sn>
Видалення слоту (Deleteslot:K25:T)
Deleteslotvalue: <fn>.<svn>
Видалення філеру слоту(Deleteslotvalue:K25:T1)
Aframe: <fn>:<fv>
Визначити фрейм (Напр.: aframe:A1:{!I}{*O})
Aframeslotvalue:<fn>.<svn>=<svm>
Визначити філер слоту абстрактного фрейму (Напр.: Aframeslotvalue: A1:I1 = кровотеч<1>)
Frameaframe:<afn>[+gtn]:<fn>
Визначити успадкування фрейму fn від afn, використовуючи схему трансформації (Напр.: Frameaframe:A1+1:C15)
Gt:<afn>:<gtn>:{<mn>=<mv>;}
Визначити схему граматичної трансформації для фрейму (Напр.:Gt:A1:1:1=ою;2=ею;3=єю)
Changeslotaxis:<fn>:<sn1>><sn2>
Зміна осі (Changeslotaxis:K29.4: K>S)
Moveframe:<fn1>:<fn2>
Зміна імені фрейма (зв’язок фрейму з іншим кодом МКХ-10)
Icd10:<fn>.<svn>:<icd10n>
Поставити у відповідність кодової комбінації класифікації код МКХ-10. (Icd10:K21-O5:K22.2)
fn — ім’я фрейму; fv — опис фрейму в нотації розробленої класифікації; svn – ім’я філеру слоту;
sv – філер слоту; svm — філер слоту з маркерами; sn – ім’я слоту; gtn — номер схеми граматичної трансформації; mn – імя маркеру; mv – значення маркеру; icd10n – код МКХ-10.
    продолжение
--PAGE_BREAK--
еще рефераты
Еще работы по медицине