Другие журналы

научное издание МГТУ им. Н.Э. Баумана

НАУКА и ОБРАЗОВАНИЕ

Издатель ФГБОУ ВПО "МГТУ им. Н.Э. Баумана". Эл № ФС 77 - 48211.  ISSN 1994-0408

Методы отображения онтологий. Обзор

# 01, январь 2009
DOI: 10.7463/0109.0115931
авторы: профессор, д.ф.-м.н. Карпенко А. П., Сухарь Р. С.

УДК 519.6

МГТУ им. Н.Э. Баумана, 105005, Москва, 2-я Бауманская ул., д.5.

karpenko@pk6.bmstu.ru

 

Введение

            Создание промышленных систем, основанных на онтологиях, требует методов и инструментов, как для построения онтологий, так и для целого ряда задач, связанных с их сопровождением. Для построения онтологий с середины 90-х годов прошлого века начали создаваться среды разработки онтологий. В последующие годы параллельно с развитием средств разработки онтологий появились средства редактирования и сопровождения онтологий, средства отображения, выравнивания и объединения онтологий, а также средства аннотирования онтологий. Таким образом, к настоящему времени сформировалась целая инженерия онтологий [1].

            Одним из центральных понятий инженерии онтологий является понятие «отображение онтологий» (ontologymapping), под которым понимается деятельность по установлению соответствия между несколькими онтологиями или, другими словами, нахождение семантических связей подобных элементов из разных онтологий. С наиболее общей точки зрения важность задачи отображения онтологий обусловлена тем фактом, что мощность знаний, заключенных в онтологиях, проявляется в полной мере только в том случае, когда удается учесть взаимосвязи независимых онтологий - установление факта подобия сущностей в разных онтологиях означает извлечение из этих онтологий дополнительных знаний.

            Близкой к проблеме отображения онтологий является проблема выравнивания онтологий (ontologyalignment), которая заключается в том, чтобы установить различные виды соответствия между двумя онтологиями, а затем сохранить исходные онтологии вместе с информацией о найденных соответствиях с тем, чтобы в дальнейшем использовать информацию о взаимосвязях онтологий. Отметим также, что на основе отображения онтологий решается задача интеграции онтологий (ontologymerging) – задача создания новой онтологии или ее фрагментов из двух и более исходных онтологий.

            Задача отображения онтологий возникает во многих областях науки и техники, например, при организации понятийного контроля знаний субъекта обучения в интеллектуальной обучающей системе [2], при моделировании организаций в задачах организационного проектирования [3], при проектировании персонифицированных информационных ресурсов над WEB-сайтами со слабоструктурированными данными [4], при построении цифровых (электронных) библиотек [1].

            В работе рассмотрены критерии и мультикритерии подобия онтологий. На этой основе дан обзор методов автоматического отображения онтологий. Рассматриваемые критерии подобия онтологий построены на основе подобия сущностей соответствующих семантических сетей, дескриптивной логики, ограничений и правил и пр. [5]. Все критерии являются транзитивными: если А подобно В, и В подобно С, то А подобно С. Таким образом, рассматриваемые критерии можно использовать для установления подобия более, чем двух онтологий.

Для иллюстраций в работе используется язык описания онтологий OWL (WebOntologyLanguage)[6].

1. Термины и определения

            Компоненты, из которых состоит онтология, зависят от используемой модели онтологии. Обычно онтология описывается с помощью

·               концептов (понятий, классов, сущностей, категорий),

·               атрибутов концептов (слотов, свойств, ролей),

·               отношений между концептами (связей, зависимостей, функций),

·               дополнительных ограничений (аксиом, фасет).

            Элементы предметной области (элементы данного концепта) называются экземплярами. Зависимость между концептами, которая включает в себя необходимое условие и следствие выполнения этого условия, называется правилом. Онтология вместе с множеством соответствующих экземпляров составляет базу знаний.

            Подобие некоторых сущностей  определяется с помощью функции подобия , которая обладает следующими свойствами [7]:

   (объекты  идентичны);

 (объекты  совершенно разные и не имеют схожих характеристик);

 (свойство возвратности функции подобия);

 (свойство симметричности функции подобия).

            Пусть ,  - рассматриваемые онтологии,  - некоторая сущность онтологии , . Подобие сущностей ,  означает, что , где  - пороговая величина (уровень подобия, уровень отсечения).

            Отображение онтологии  на онтологию  означает попытку найти для каждого из концептов онтологии  подобный ему концепт в онтологии  [8]. Другими словами, отобразить онтологию  на онтологию  означает отобразить каждую из сущностей  онтологии  на соответствующую сущность  онтологии . Несколько иные определения термина «отображение онтологий» даются в работах [4, 5].

Будем писать  и говорить, что сущность  есть отображение сущности , если сущности ,  подобны, т.е. если . Здесь  - функция отображения.

Если онтология  есть отображение онтологии , то этот факт будем записывать в виде .

2. Критерии подобия онтологий

2.1. Критерии на основе подобия идентификаторов или URIсущностей.

            Критерий . Первым из критериев этого класса является критерий на основе идентификаторов сущностей (меток). Критерий формулируется следующим образом:

если метки двух сущностей подобны,  то эти сущности подобны ().

Здесь и далее ,  - обозначение критерия подобия.

Вместо имен сущностей могут сравниваться имена их синонимов (с использованием существующих словарей общей и профессиональной лексики или тезаурусов [7]).

            Отметим, что известно большое количество методов сравнения меток, см., например, метод интервала редактирования (theeditdistance) [9]. Отметим также, что с помощью соответствующего словаря данный критерий подобия может быть использован для сравнения сущностей, заданных на разных языках.

Пример 1. Пусть имеются два концепта с идентификаторами «компьютерная мышка» и «компьютерная мышь»:

 
<owl:Class rdf:ID=”id1”> 
 
       <rdfs:label>компьютерная мышка<label/> 
 
</owl:Class>  
 
<owl:Class rdf:ID=”id2”> 
 
       <rdfs:label>компьютерная мышь<label/> 
 
</owl:Class> 

            Сравнение этих идентификаторов любым из методов сравнения меток покажет подобие указанных концептов.

            Критерий . Критерий строится на основе идентификаторов сущностей, уникальных для каждой из сущностей, например, URI(UniformResourceIdentifier) и формулируется следующим образом [10]:

если две сущности имеют подобные URI, то эти сущности подобны ().

Пример 2. В онтологии [11] определяется концепт «Регион»:

 
<owl:Class rdf:ID="Регион"/> 

В этой же онтологии имеется понятие "РегионЦентральногоПобережья":

 
<owl:Classrdf:ID="РегионЦентральногоПобережья"/>  

В соответствии с критерием  концепт «Регион» и концепт "РегионЦентральногоПобережья" подобны.

 

2.2. Критерии на основе семантической сети онтологии [12].

            Критерий . Поскольку сущности состоят в отношениях с другими сущностями через свои атрибуты, имеет место следующий критерий подобия:

если атрибуты двух сущностей подобны, то эти сущности подобны ().

Пример 3.

 

 
<Регион rdf:ID="РегионГорыСантаКруз"> 
 
  <locatedIn rdf:resource="#РегионКалифорния"/> 
 
</Регион> 
 
<Винодельня rdf:ID="ВиноградникГораСантаКруз"/> 
 
<КабернеСовиньон 
 
  rdf:ID="КабернеСовиньонВинодельняГораСантаКруз"> 
 
  <расположенВ rdf:resource="#РегионГорыСантаКруз"/>   
 
  <имеетПроизводителя    rdf:resource="#ВиноградникГораСантаКруз"/>    
 
</КабернеСовиньон> 
 
<ВиноградКабернеСовиньон 
 
  rdf:ID="ВиноградКабернеСовиньонВинодельняГораСантаКруз"> 
 
  <расположенВ rdf:resource="#РегионГорыСантаКруз"/>   
 
  <имеетПроизводителя    rdf:resource="#ВиноградникГораСантаКруз"/>    
 
</ВиноградКабернеСовиньон>   
 
  

            Экземпляры «КабернеСовиньон» и «ВиноградКабернеСовиньон» обладают одинаковыми атрибутами и поэтому подобны.

            Критерий . Ограничить отношения между сущностями можно путем задания области применения (domain) и диапазона (range) соответствующих атрибутов сущностей. Это обстоятельство позволяет сформировать следующий критерий подобия отношений:

если область применения и диапазон двух отношений подобны,

то такие отношения подобны ().

            Пример 4.

 
<owl:ObjectProperty rdf:ID="СделаноИзВинограда">  
 
  <rdfs:domain rdf:resource="#Вино"/> 
 
  <rdfs:range rdf:resource="#Виноград"/>  
 
</owl:ObjectProperty>  
 
<owl:ObjectPropertyrdf:ID="ПолученоИзВинограда">  
 
  <rdfs:domain rdf:resource="#Вино"/> 
 
  <rdfs:range rdf:resource="#Виноград"/>  
 
</owl:ObjectProperty>  
 
  

            Отношения «СделаноИзВинограда», «ПолученоИзВинограда» имеют одинаковые области применения и диапазоны и поэтому подобны.

 

2.3. Критерии на основе дескриптивной логики [5].

Критерии данного класса охватывают онтологии, которые обладают сложностью, достаточной для их описания дескриптивными логиками [13].

            Приведем прежде пример дескриптивной логики.

 

Отношение

двух концептов

Отношение экземпляра и концепта

Отношение экземпляра и концепта

умные люди читают книги

Сергей читает книги

Сергей — умный человек

 

            Здесь «умные люди», «книги» и «умный человек» — концепты; «читают» - отношение; «Сергей» - экземпляр. Экземпляр «Сергей» наследует отношение родительского понятия. Тот же пример на языке OWL имеет вид:

<owl:Classrdf:ID="литература"/>

<owl:Class rdf:ID="книги">

            <rdfs:subClassOf rdf:resource="#литература"/>

</owl:Class>

<owl:Class rdf:ID="умные люди">

            <owl:Restriction>

                   <owl:onProperty rdf:resource="#читают"/>

                   <owl:hasValue rdf:resource="#книги"/>

            </owl:Restriction>

</owl:Class>

<owl:Thing rdf:ID="Сергей">

            <rdfs:type rdf:resource="#умные люди"/>

</owl:Thing>

            Критерий  формируется, исходя из посыла, что подобные концепты с большой вероятностью имеют подобные родительские понятия:

если родительские понятия двух концептов подобны,
то сами концепты также подобны
().

            Пример 5.

 
<owl:Class rdf:ID="Напиток">  
 
  <rdfs:subClassOf rdf:resource="#ПродуктПитания"/> 
 
</owl:Class>  
 
<owl:Class rdf:ID="Пища">  
 
  <rdfs:subClassOf rdf:resource="#ПродуктПитания"/> 
 
</owl:Class>  
 
  

            Родительские понятия концептов «Напиток» и «Пища» совпадают, поэтому указанные концепты подобны.

            Критерий  основан на подобии дочерних понятий [14]:

если дочерние понятия сравниваемых концептов  подобны,

 то эти концепты также подобны ().

            Пример 6.

 
<owl:Class rdf:ID="Еда"/>  
 
<owl:Class rdf:ID="Пища"/>  
 
<owl:Class rdf:ID="Хлеб">  
 
  <rdfs:subClassOf rdf:resource="#Еда"/> 
 
  <rdfs:subClassOf rdf:resource="#Пища"/> 
 
</owl:Class>  
 
<owl:Class rdf:ID="Мясо">  
 
  <rdfs:subClassOf rdf:resource="#Еда"/> 
 
  <rdfs:subClassOf rdf:resource="#Пища"/> 
 
</owl:Class>  
 
  

            Концепты «Еда» и «Пища» имеют одно и тоже дочернее понятие «Хлеб» и поэтому подобны.

            Критерий  основан на подобии концептов, относящихся к тому же уровню иерархии понятий:

если концепты имеют подобные концепты того же уровня иерархии,
то они также подобны
().

            Пример 7.

<owl:Class rdf:ID="Автомобиль"/>

<owl:Class rdf:ID="Машина"/>

<owl:Class rdf:ID="Порш"/>

            <rdfs:subClassOf rdf:resource="#Автомобиль"/>

</owl:Class>

<owl:Class rdf:ID="Жигули"/>

            <rdfs:subClassOf rdf:resource="#Автомобиль"/>

            <rdfs:subClassOf rdf:resource="#Машина"/>

</owl:Class>

<owl:Class rdf:ID="Мерседес"/>

                        <rdfs:subClassOf rdf:resource="#Машина"/>

</owl:Class>

 

            Концепты «Порш» и «Мерседес» подобны, поскольку каждый из этих концептов имеет подобный концепт «Жигули» того же уровня (Рис. 1).

Рис. 1. К примеру 7.

            Критерии ,  строятся на основе подобия атрибутов дочерних и родительских сущностей:

если подобны атрибуты дочерних сущностей,

то атрибуты родительских сущностей также подобны ();

 

если подобны атрибуты родительских сущностей,

то атрибуты дочерних сущностей также подобны ().

 

            Пример 8.

 
  
 
<owl:Class rdf:ID="ХарактеристикаВина"/> 
 
<owl:Class rdf:ID="ЦветВина"> 
 
  <rdfs:subClassOf rdf:resource="#ХарактеристикаВина"/> 
 
  ... 
 
</owl:Class> 
 
<owl:ObjectProperty rdf:ID="ОбладаетХарактеристикойВина"> 
 
  <rdfs:domain rdf:resource="#Вино"/> 
 
  <rdfs:range  rdf:resource="#ХарактеристикаВина"/> 
 
</owl:ObjectProperty> 
 
<owl:ObjectProperty rdf:ID="ИмеетЦвет"> 
 
  <rdfs:subPropertyOf rdf:resource="#ОбладаетХарактеристикойВина"/> 
 
  <rdfs:range rdf:resource="#ЦветВина"/> 
 
  ... 
 
</owl:ObjectProperty> 
 
<owl:ObjectProperty rdf:ID="ИмеетОттенок"> 
 
  <rdfs:subPropertyOf rdf:resource="#ОбладаетХарактеристикойВина"/> 
 
  <rdfs:range rdf:resource="#ЦветВина"/> 
 
  ... 
 
</owl:ObjectProperty> 
 
  

            Атрибуты «ИмеетЦвет» и «ИмеетОттенок» подобны, поскольку подобны их родительские атрибуты.

            Критерий . Поскольку, как отмечалось выше, экземпляр представляет собой элемент соответствующего концепта, он наследует все атрибуты этого концепта. Поэтому имеет место следующий критерий подобия [15]:

если концепты включают в себя подобные экземпляры,

то эти концепты подобны ().

            Пример 9.

 
<owl:Class rdf:ID="Автомобиль"/>  
 
<owl:Class rdf:ID="Машина"/> 
 
<owl:Thingrdf:ID="ПоршСергея"> 
 
<rdfs:type rdf:resource="#Автомобиль"/> 
 
 <rdfs:type rdf:resource="#машина"/> 
 
</owl:Thing > 
 
<owl:Thing rdf:ID="МерседесСергея"> 
 
 <rdfs:type rdf:resource="#Автомобиль"/> 
 
 <rdfs:type rdf:resource="#Машина"/> 
 
</owl:Thing> 

            Концепты «Автомобиль» и «Машина» включают в себя одинаковые экземпляры и поэтому подобны.

            Критерий  является обратным по отношению к критерию  и записывается в виде:

если экземпляры принадлежат подобным концептам,

то эти экземпляры подобны ().

            Пример 10.

 
<owl:Class rdf:ID="Автомобиль"/>  
 
<owl:Thingrdf:ID="ПоршСергея"> 
 
<rdfs:type rdf:resource="#Автомобиль"/> 
 
</owl:Thing > 
 
<owl:Thing rdf:ID="МерседесСергея"> 
 
 <rdfs:type rdf:resource="#Автомобиль"/> 
 
</owl:Thing> 
 
  

            Экземпляры «ПоршСергея» и «МерседесСергея» подобны, поскольку принадлежат одному концепту «Автомобиль».

            Критерий  близок к критерию подобия  и формулируется следующим образом:

если концепты имеют схожую малую/большую
 часть экземпляров, эти понятия подобны
().

            В отличие от критерия , подобие в данном критерии определяется подобием структуры дочерних элементов, а не уровнем подобия самих элементов.

            Пример 11.

 
<owl:Class rdf:ID="Автомобиль"/>  
 
<owl:Class rdf:ID="Машина"/> 
 
<owl:Thing rdf:ID="ПоршСергея"> 
 
 <rdfs:type rdf:resource="#Автомобиль"/> 
 
 <rdfs:type rdf:resource="#Машина"/> 
 
</owl:Thing > 
 
<owl:Thing rdf:ID="МерседесСергея"> 
 
 <rdfs:type rdf:resource="#Автомобиль"/> 
 
 <rdfs:type rdf:resource="#Машина"/> 
 
</owl:Thing> 
 
<owl:Thingrdf:ID="ЖигулиСергея"> 
 
<rdfs:type rdf:resource="#Машина"/> 
 
</owl:Thing> 
 
<owl:Thing rdf:ID="ДжипСергея"> 
 
 <rdfs:type rdf:resource="#Автомобиль"/> 
 
</owl:Thing> 
 
  

            Концепты «Автомобиль» и «Машина» включают в себя часть одинаковых экземпляров («ПоршСергея», «МерседесСергея») и поэтому подобны.

Критерий  имеет следующую формулировку:

если два экземпляра связаны с некоторым другим экземпляром подобными отношениями,

 то эти экземпляры подобны ().

            Пример 12.

 
<owl:ObjectProperty rdf:ID="РасположенВ"> 
 
  <rdf:type rdf:resource="&owl;TransitiveProperty"/> 
 
  <rdfs:domain rdf:resource="&owl;Thing"/> 
 
  <rdfs:range rdf:resource="#Регион"/> 
 
</owl:ObjectProperty> 
 
<Регион rdf:ID="РегионГорыСантаКруз"> 
 
  <расположенВ rdf:resource="#РегионСША"/> 
 
</Регион> 
 
<Регион rdf:ID="РегионКалифорния"> 
 
  <расположенВ rdf:resource="#РегионСША"/> 
 
</Регион> 
 
  

            Экземпляры «РегионГорыСантаКруз» и «РегионКалифорния» связаны с экземпляром «РегионСША» отношением «РасположенВ» и поэтому подобны.

            Критерий  является обратным по отношению к критерию и формулируется следующим образом:

если некоторое отношение связывает экземпляры с одним и тем же экземпляром,

то сравниваемые отношения могут быть подобны ().

 

            Пример 13.

 
<owl:ObjectProperty rdf:ID="РасположенВ"> 
 
  <rdf:type rdf:resource="&owl;TransitiveProperty"/> 
 
  <rdfs:domain rdf:resource="&owl;Thing"/> 
 
  <rdfs:range rdf:resource="#Регион"/> 
 
</owl:ObjectProperty> 
 
<owl:ObjectProperty rdf:ID="НаходитсяВ"> 
 
  <rdf:type rdf:resource="&owl;TransitiveProperty"/> 
 
  <rdfs:domain rdf:resource="&owl;Thing"/> 
 
  <rdfs:range rdf:resource="#Регион"/> 
 
</owl:ObjectProperty> 
 
<Регион rdf:ID="РегионГорыСантаКруз"> 
 
  <расположенВ rdf:resource="#РегионСША"/> 
 
</Регион> 
 
<Регион rdf:ID="РегионКалифорния"> 
 
  <находитсяВ rdf:resource="#РегионСША"/> 
 
</Регион> 

            Здесь экземпляры «РегионГорыСантаКруз» и «РегионКалифорния» связаны с одним и тем же экземпляром «РегионСША» отношениямим «РасположенВ» и «НаходитсяВ» соответственно. Поэтому указанные отношения подобны.

2.4. Критерии на основе ограничений.

            Критерий  основан на использовании отношений вида «SameClassAs» и «SameIndividualAs» [6]:

если две сущности связаны между собой отношением «sameClassAs» или отношением «sameIndividualAs», то эти сущности подобны ().

            Пример 14.

 
<Вино rdf:ID="ЛюбимоеВиноМихаила">  
 
  <owl:sameAs rdf:resource="#StGenevieveТехасскоеБелое"/>  
 
</Вино>   

 

            Критерий  основан на использовании отношений вида «EquivalentClass», «EquivalentProperty», «SameAs»:

если две сущности связаны между собой отношениями «EquivalentClass», «EquivalentProperty», «SameAs», то эти сущности подобны ().

            Пример 15.

 
<owl:Class rdf:ID="БелоеВино"> 
 
  <owl:intersectionOf rdf:parseType="Collection"> 
 
    <owl:Class rdf:about="#Вино" /> 
 
    <owl:Restriction> 
 
      <owl:onProperty rdf:resource="#ИмеетЦвет"/> 
 
      <owl:hasValue rdf:resource="#Белое"/> 
 
    </owl:Restriction> 
 
  </owl:intersectionOf> 
 
</owl:Class> 
 
  
 
<owl:Class rdf:ID="Шампанское"> 
 
  <owl:intersectionOf rdf:parseType="Collection"> 
 
    <owl:Class rdf:about="#Вино"/> 
 
    <owl:Restriction> 
 
      <owl:onProperty rdf:resource="#ИмеетЦвет"/> 
 
      <owl:hasValue rdf:resource="#Белое"/> 
 
    </owl:Restriction> 
 
  </owl:intersectionOf> 
 
</owl:Class> 
 

            В этом примере «БелоеВино» и «Шампанское» обладают подобными ограничениями («имеетЦвет» «Белое»):

 

2.5. Критерии на основе правил.

Подобными называются правила, которые имеют подобные условия, а также подобные следствия выполнения правила.

Критерий  имеет вид:

если две сущности связаны между собой подобными правилами,
то эти сущности подобны
().

            Пример 16.

Правило

Правило

Следствие

а). Если ( - брат ) и ( - отец ), то ( - отец )

б). Если ( - сестра ) и ( - отец ), то ( - отец )

в. Из а) и б) следует, что отношения «брат» и «сестра» подобны

 

            Этот же пример на языке OWL имеет вид:

<ruleml:imp>

<ruleml:_rlab ruleml:href="#Пример1"/>

<ruleml:_body>

   <swrlx:individualPropertyAtom  swrlx:property="ИмеетБрата">

      <ruleml:var>x1</ruleml:var>

      <ruleml:var>x2</ruleml:var>

   </swrlx:individualPropertyAtom>

   <swrlx:individualPropertyAtom  swrlx:property="ИмеетОтца">

      <ruleml:var>x2</ruleml:var>

      <ruleml:var>x3</ruleml:var>

   </swrlx:individualPropertyAtom>

</ruleml:_body>

<ruleml:_head>

   <swrlx:individualPropertyAtom  swrlx:property="ИмеетОтца">

      <ruleml:var>x1</ruleml:var>

      <ruleml:var>x3</ruleml:var>

   </swrlx:individualPropertyAtom>

</ruleml:_head>

</ruleml:imp>

 

<ruleml:imp>

<ruleml:_rlab ruleml:href="#Пример2"/>

<ruleml:_body>

   <swrlx:individualPropertyAtom  swrlx:property="ИмеетСестру">

      <ruleml:var>x1</ruleml:var>

      <ruleml:var>x2</ruleml:var>

   </swrlx:individualPropertyAtom>

   <swrlx:individualPropertyAtom  swrlx:property="ИмеетОтца">

      <ruleml:var>x2</ruleml:var>

      <ruleml:var>x3</ruleml:var>

   </swrlx:individualPropertyAtom>

</ruleml:_body>

<ruleml:_head>

   <swrlx:individualPropertyAtom  swrlx:property="ИмеетОтца ">

      <ruleml:var>x1</ruleml:var>

      <ruleml:var>x3</ruleml:var>

   </swrlx:individualPropertyAtom>

</ruleml:_head>

</ruleml:imp>


            Отношения «ИмеетБрата» и «ИмеетСестру» подобны.

2.6. Критерии, учитывающие специфику словаря приложения.

Рассмотренные выше критерии подобия онтологий используют свойства общего определения онтологий. Кроме этого, возможны онтологии, которые используют особый словарь. Если этот словарь строго определен и общедоступен, то он также может быть использован для формирования критериев подобия онтологий.

            В качестве примера рассмотрим SWAP-системы [16], в которых каждому файлу присваивается уникальный хэш-код. Для таких систем имеют место

критерии , :

если хэш-коды двух элементов одинаковы, то и элементы подобны ();

файлы одинакового MIME-type подобны, как минимум, по формату ().

2.7. Сводная таблица критериев подобия.

Все 19 рассмотренных критериев подобия онтологий сведены в Табл. 1.

            Отметим, что, например, в работе [3] рассматривается иная систематизация критериев подобия онтологий, в соответствии с которой выделяется 4 класса таких критериев:

1)            лингвистические (терминологические, лексические) критерии;

2)            статистические (экстенсиональные) критерии;

3)            структурные критерии;

4)            логические (формальные, семантические) критерии.

3. Мультикритерии подобия онтологий

            Большое количество мультикритериев, построенных на основе рассмотренных критериев подобия онтологий, предложено в работе [5]. Чаще всего в качестве мультикритерия подобия используется аддитивная свертка критериев  -  - т.е. их взвешенная сумма

,                                              (1)

где ,  - сущности онтологий , , соответственно;  - весовой коэффициент критерия .

Таблица 1. Сводка критериев подобия онтологий

Общая формулировка критерия

Критерий

Что?

 

 

 

 

 

 

Понятий подобны, если подобны <Что?>

метки

URI

свойства

родительские понятия

понятия того же уровня

дочерние понятия

экземпляры

выборка экземпляров

отношение «sameAs»

ограничения

правила

 

 

 

 

Атрибуты подобны, если подобны <Что?>

метки

URI

область и вектор

родительские атрибуты

дочерние атрибуты

связанные экземпляры

отношение «sameAs»

ограничения

правила

 

 

 

 

Экземпляры подобны, если подобны <Что?>

метки

URI

родительское понятие

свойства и экземпляры

отношение «sameAs»

Ограничения

правила

хэш-коды

MIPE-type

 

            Широко известная модификация аддитивной свертки (1) основана на использовании сигмоидальной функции  от критериев подобия  - :

.                                      (2)

Здесь ;  - свободный параметр функции. Использование сигмоидальной функции в критерии подобия (2) позволяет повысить веса критериев, имеющих большие значения, и практически пренебречь критериями с малыми значениями.

            Значительный интерес представляет вариант построения мультикритерия подобия на основе обучаемой нейронной сети. Так в работе [5] мультикритерий синтезируется с помощью трехслойной персептронной нейронной сети, в которой в скрытом слое используются нейроны с функцией активации типа гиперболический тангенс, а в выходном слое – типа сигмоида.

4.Методы определения уровня отсечения

            Как отмечалось выше, сущности ,  подобны, если , где  - уровень отсечения. В данном разделе рассматриваются методы выбора величины  [17].

            Метод константы. В этом методе для критерия подобия  в качестве уровня отсечения принимается некоторая константа , . Значение этой константы определяется на основе арифметического среднего для величины критерия подобия или на основе экспертных оценок.

            Метод допустимой ошибки. Здесь в качестве уровня отсечения принимается разность между максимальным значением критерия подобия и некоторой константой c, определяющей погрешность подобия

; , ; .

            Метод допустимой погрешности. Метод аналогичен предыдущему методу и отличается от него лишь тем, что в качестве константы  используется величина, равная некоторой фиксированной части  от максимального значения критерия подобия:

; , ; .

            Отметим следующее обстоятельство. До сих пор мы рассматривали использование уровня отсечения для отнесения сравниваемых онтологий к одному из двух классов – подобны, не подобны. Естественным расширением данного подхода является полуавтоматический подход, в котором сравниваемые онтологии относятся к одному из трех следующих классов: онтологии подобны; онтологии не подобны; онтологии должны быть классифицированы экспертом.

5. Последовательность действий при отображении онтологий

            В процедуре отображения онтологий можно выделить два этапа [3]:

1)            локальное отображение сущностей - независимое установление соответствий между двумя сущностями, рассматриваемых онтологий;

2)            глобальное отображение сущностей - пересмотр (пересчет) локальных отображений с учетом отображений всех остальных элементов.

            Поскольку многие из рассмотренных критериев подобия двух сущностей основываются на подобии других пар сущностей, вообще говоря, отображение онтологий является итерационным процессом. При этом на первой итерации должен использоваться критерий подобия, который не основывается на других критериях (например, критерий на основе подобия меток ).

            В связи с итерационным характером процедуры отображения онтологий возникает вопрос о выборе требуемого количества итераций. Возможны следующие варианты такого выбора:

·               количество итераций заранее фиксировано;

·               итерации продолжаются до тех пора, пока не прекратятся изменения в отображении;

·               итерации продолжаются до тех пора, пока изменения в отображении не станут ниже некоторого заданного порога отсечения;

·               итерации продолжаются до тех пора, пока не будут превышены допустимые ресурсы времени и вычислительной мощности.

            Из-за итерационного характера процедуры отображения онтологий возникает еще один вопрос: следует ли производить какую-либо обработку результатов данной итерации перед их переносом в следующую итерацию? Здесь можно выделить два подхода. Во-первых, на следующей итерации можно рассматривать только самые лучшие отображения (отображения с самым большим значением соответствующего критерия подобия). Во-вторых, на данной итерации полученные отображения можно ранжировать – лучшему отображению назначить вес 1, отображению со следующим по значению критерием подобия - вес , следующему отображению – вес . Последний подход позволяет с большой вероятностью сохранить правильные отображения и, в то же время, в случае необходимости заменить эти отображения следующими по уровню соответствия.

            В конечном счете, предлагается следующая последовательность итераций при отображении онтологий:

1)            Первая итерация выполняется с использованием одного из критериев подобия , , .

2)            На второй итерации подобие сущностей оценивается с помощью любого из критериев подобия  - .

3)            Выполняется несколько итераций, указанных в п.п. 1, 2. Количество итераций определяется одним из вышеописанных способов. На последней итерации удаляются повторы и пары сущностей, величина подобия которых меньше порога отсечения.

 

 

 

6. Заключение

Известно значительное количество инструментальных средств инженерии онтологий, которые поддерживают те или иные из рассмотренных методов отображения онтологий. Назовем основные из этих средств [1]:

·                 &nb sp;  PROMPT - дополнение в виде плагина к системе построения онтологий Protégé;

·                 &nb sp;  интерактивный инструмент Chimaera, основанный на редакторе онтологий Ontolingua;

·                 &nb sp;  OntoMerge транслирует исходные онтологии в общее представление на специальном языке;

·                 &nb sp;  OntoMorphопределяет набор операторов преобразования, которые можно применить к онтологии;

·                 &nb sp;  OBSERVER объединяет онтологии с информацией об отображении между ними и находит синонимы в исходных онтологиях;

·                 &nb sp;  ONION базируется на алгебре онтологии и предоставляет инструменты для определения правил артикуляции (соединения) между онтологиями.

 

Библиография

1.                 Овдий О.М., Проскудина Г.Ю. Обзор инструментов инженерии онтологий. -http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2004/part4/op

2.                 Карпенко А.П., Соколов Н.К. Контроль понятийных знаний субъекта обучения с помощью когнитивных карт. // Управление качеством инженерного образования и инновационные образовательные технологии. Сборник докладов Международной научно-методической конференции, 28-30 октября 2008 г. –М.:МГТУ им. Н.Э.Баумана, 2008, Ч.2, с. 55-57.

3.                 Кудрявцев Д.В., Григорьев Л.П. Организационное моделирование на основе онтологий: от бизнеса к государству. // Труды Х Российской научно-практической конференции «Реинжиниринг бизнес-процессов на основе современных информационных технологий. Системы управления знаниями», 17-18 апреля 2007 г., Москва. - с. 151-156.

4.                 Скворцов Н.А. и др. Проектирование персонализованных информационных ресурсов над WEB-сайтами со слабоструктурированными данными. - http://synthesis.ipi.ac.ru/sigmod/seminar/s20000127

5.                 M. Ehrig, Y. Sure. An Ontology Mapping - An Integrated Approach. // The semantic web: Research and applications. – Berlin, Springer, 2004, pp. 3-13.

6.                 OWL. Web Ontology Language Semantics and Abstract Syntax, P. F. Patel-Schneider, P. Hayes, I. Horrocks, Editors. - Рекомендация W3C, 2004.

7.                 G. Bisson. Why and how to define a similarity measure for object based representation systems. // Towards Very Large Knowledge Bases. – The Netherlands, IOS Press, 1995, pp. 236–246.

8.                 X. Su. A text categorization perspective for ontology mapping. - Technical report, Department of Computer and Information Science, Norwegian University of Science and Technology, Norway, 2002.

9.                 Википедия, http://en.wikipedia.org/wiki/Edit_distance

10.             Википедия, http://ru.wikipedia.org/wiki/URI

11.             http://www.w3.org/TR/2004/REC-owl-guide-20040210/wine

12.             M. R. Quillan. Word concepts: A theory and simulation of some basic capabilities. // Behavioral Science, 1967, 12, pp.410–430.

13.             Википедия, http://en.wikipedia.org/wiki/Description_logic

14.             A. Maedche, B. Motik, N. Silva, R. Volz. Mafra - a mapping framework for distributed ontology’s. // Proceedings of the EKAW 2002, 2002, pp.2-8.

15.             A. H. Doan, Ja. Madhavan, P. Domingos, A. Halevy. Learning to map between ontology’s on the semantic web. // Proceedings to the Eleventh International World Wide Web Conference, Honolulu, Hawaii, USA, May 2002, pp.3-9.

16.             http://swap.semanticweb.org

17.             H. Do, E. Rahm. COMA - a system for flexible combination of schema matching approaches. // Proceedings of the 28th VLDB Conference, Hong Kong, China, 2002, pp. 2-7.

 

 

Поделиться:
 
ПОИСК
 
elibrary crossref ulrichsweb neicon rusycon
 
ЮБИЛЕИ
ФОТОРЕПОРТАЖИ
 
СОБЫТИЯ
 
НОВОСТНАЯ ЛЕНТА



Авторы
Пресс-релизы
Библиотека
Конференции
Выставки
О проекте
Rambler's Top100
Телефон: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)
  RSS
© 2003-2024 «Наука и образование»
Перепечатка материалов журнала без согласования с редакцией запрещена
 Тел.: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)