![]() |
Comelio GmbH
|
Software-Technologien > Ontologien > Übersicht Übersicht
Konzept der OntologienModellierungstechniken auf der Basis von Ontologien greifen notwendigerweise auf den Ontologiebegriff zurück und versuchen, ihn mit unterschiedlichen technischen –in diesem Fall syntaktischen – Werkzeugen umzusetzen. Da zu diesem Begriff aus unterschiedlichen Disziplinen (Informationswissenschaft, Betriebswirtschaftslehre und Sprachwissenschaft sowie Philosophie) Definitionen vorliegen, soll in diesem Abschnitt zunächst herausgearbeitet werden, um welches Konzept es sich bei den Ontologien überhaupt handelt. Wissensbeschreibung durch SemantikIn technologischer Hinsicht besteht – wie oben gesagt – mit XML Schema zunächst die Möglichkeit, die vorhandenen Informationen zu strukturieren, auszuzeichnen und sie mit entsprechenden Datentypen zu versehen. Damit dient XML Schema der allgemeinen Aufbereitung und Beschreibung der vorhandenen Informationen, ermöglicht allerdings alleine noch nicht die Ableitung von neuem Wissen. Die unterschiedlichen Ansätze der Wissensbeschreibung, an deren Ende die Technik der Ontologien steht, lässt sich unter dem Begriff der Semantik bzw. auch der semantischen Datenmodellierung verwenden. Dabei besteht zunächst die Notwendigkeit, die Informationen mit Hilfe von geeigneten Symbolen bzw. Bezeichnungen in Form einer Terminologie abzubilden. Diese charakterisiert die einzelnen Elemente innerhalb der Wissensbasis in der benötigten Granularität und lässt auch die Angabe eines Wertebereiches zu, welcher für die einzelnen Elemente zulässig ist. Diese Terminologien lassen sich über XML Schema einrichten und weisen die genannten Nachteile auf, wie z.B. die Problematik, dass proprietäre, d.h. nur innerhalb eines bestimmten Systems bekannte, Namen für die Elemente verwendet werden. Diese Konzeption steht damit einem Austausch über Systemgrenzen (Unternehmen, Anwendung etc.) im Weg. Eine Terminologie eignet sich daher ausschließlich für die Angabe eines Symbolvokabulars, mit dessen Hilfe Elemente ausgezeichnet und benannt werden können. Mit Hilfe von semantischen Schemata lassen sich nun die für die vorhandenen Elemente definierten Symbole Beziehungen in Form von Konzepten festlegen. Dies sind allerdings noch die Beziehungen, welche über die Ontologien abgebildet werden können, sondern lediglich Zuordnungen von Elementen in Form von Konzeptinstanzen zu ihren übergeordneten Konzepten in Form von „Oberbegriff und Unterbegriff“. Teilweise lässt sich dies auch noch in XML Schema über entsprechende Eltern-Kind-Elementstrukturen abbilden. Die semantischen Schemata bilden allerdings die zusätzliche Eigenschaft, dass mit ihrer Hilfe und einer standardisierten, d.h. über Systemgrenzen hinweg gesicherten, Zuordnung von Konzepten zu Elementen die Möglichkeit des Datenaustausches zwischen Systemen gegeben ist. Dies können dann natürlich genauso branchenspezifische, anwendungsspezifische oder themenspezifische Schemata (Beispiele im XML-Umfeld: Ein branchenspezifisches Schema stellt NewsML (http://www.newsml.org) für den Nachrichtenaustausch dar, ebenso für den Austausch für Angebot- und Nachfrageinformationen cXML (http://www.cxml.org/). Anwendungsspezifische Schemata stellen alle Standards für Webservices wie SOAP (http://www.w3.org/TR/soap/) oder XML-RPC (http://www.xmlrpc.com/) dar.) sein . Es ist mit Hilfe von XML Schema wiederum möglich, semantische Schemata abzubilden, da natürlich auch hier wieder ein bestimmter Symbolvorrat für die Beschreibung von Elementen herangezogen wird. Aus einem vergleichenden Blickwinkel heraus liegt der einzige Unterschied zwischen den Terminologien und den semantischen Schemata nur darin, dass sie standardisierte Terminologien darstellen, welche innerhalb eines größeren Systems oder eines Systemszusammenhang den Datenaustausch zwischen Systemen mit unterschiedlichen Terminologien erlauben. Dazu wird eine Art Übersetzungsrahmen verwendet bzw. eine Zuordnung für den Austausch wichtiger Elemente zu im semantischen Schema vorhandenen Strukturen (Beispiele im XML-Umfeld: Dublin Core Meta Data Element Set (http://dublincore.org) für die Erfassung von Dokumentmetainformationen oder auch das später noch behandelte Resource Description Framework (http://www.w3.org/RDF) mit gleicher Zielsetzung.). Damit bieten die semantischen Schemata eine Normierung auf der Zuordnungsebene, während die Terminologien eine Normierung auf der Bezeichnungsebene (Vokabular, Auszeichnung) bieten. Die Beziehungen zwischen den Elementen lassen sich in einer Ontologie schließlich ebenfalls maschinenlesbar abbilden. Dies stellt insoweit eine Erweiterung dar, als dass die Komplexität der Strukturen, welche zwischen den einzelnen Elementen in der Faktenbasis bestehen, ungleich komplexer abgebildet werden können als mit Terminologien oder den semantischen Schemata in Form von standardisierten Terminologien. Dabei ist eine größere Annäherung zu reellen Beziehungen möglich, weil nicht nur allgemeine Zuordnungsbeziehungen in Form von „Oberbegriff und Unterbegriff“ abgebildet werden können, sondern eigene Beziehungstypen. Diese lassen sich natürlich auch zu unterschiedlichen Standardbeziehungen zuordnen, stellen allerdings selbst eine Konzeption in der Beschreibungssystematik dar und lassen u.a. auch Plausibilitätstests und damit weitergehende Validierungen zu. Begriff und DefinitionOntologie, die Philosophie des Seins, stammt als Wort etymologisch von den beiden griechischen Wörtern ontos (Sein) und logos (Darlegung, Ausarbeitung) ab. Das Konzept der Ontologien bzw. der Beschäftigung mit derselben lässt sich tatsächlich bis zu den griechischen Philosophen zurückverfolgen und hängt eng mit folgenden Fragestellungen zusammen: Was sind Dinge? Was ist das Innerste der Dinge, welches unveränderlich ist? Existieren Konzepte (auch alltägliche Gegenstandsbezeichnungen und nicht nur abstrakte Begriffe) außerhalb unseres Bewusstseins? Wie können die Einheiten der Welt klassifiziert werden? Im Zusammenhang mit Ontologien lassen sich die beiden Begriffe Existenz und Sein unterscheiden, wobei mit dem Begriff Existenz das tatsächliche Vorhandensein (Existieren im ursprünglichen Sinne des Worts) eines Begriffs (z.B. der Name eines Gegenstands) gemeint ist. Mit dem Begriff Sein dagegen bezieht man sich auf die Art und Weise, wie ein Begriff zu verstehen ist oder was man sich unter einem Begriff vorzustellen hat. Im Hinblick auf Phantasiebegriffe (Fabelwesen) lässt sich sagen, dass sie sehr wohl ein Sein aufweisen, aber keine Existenz besitzen. Von diesem Ausgangspunkt aus lassen sich unterschiedliche Denkansätze wie die Metaphysik von Aristoteles zur Zeit der altgriechischen Hochkultur oder die Symbollehre von William of Ockam im Mittelalter bis hin zu Immanuel Kant im achtzehnten Jahrhundert beschreiben und vergleichen, die allerdings mit den technischen Umsetzungen der Ontologien in den Syntaxregeln des W3C nicht viel gemein haben. Gemeinsam ist ihnen, dass sie versuchten, die Grundfrage von Existenz und Sein in unterschiedlichen Kategoriensystemen zu beantworten. Von diesen ist die Kategorienlehre Kants besonders umfangreich, weil er mehr Dimensionen der Beschreibung (Kategorie) von Dingen verwandte. Er unterteilte sie in vier Klassen, welche jeweils ein triadisches Muster enthielt: Menge (Einheit, Mehrzahl, Totalität), Qualität (Realität, Negation, Begrenzung), Relation (Vererbung, Kausalität, Gemeinschaft) und Modalität (Möglichkeit, Existenz, Notwendigkeit). Ohne auf die Details seiner umfangreichen Kategorienlehre einzugehen oder gar seine Vorgehensweise bei der Ableitung der einzelnen Kategorien und ihrer Muster darzustellen, lässt sich dennoch bereits an den von ihm verwendeten Begrifflichkeiten erkennen, dass fast gar keine Ideen von ihm oder seinen Vordenkern in die Konzeption der heutigen Beschäftigung mit Ontologien eingegangen sind . Dies gilt auch für andere Ansätze wie z.B. von José Ortega y Gasset oder William James im neunzehnten Jahrhundert. Zusätzlich gilt gemeinhin , dass das betriebswirtschaftliche Interesse an Ontologien natürlich in erster Linie über die Informationswissenschaft und dann – etwas spezieller – über deren Beschäftigung mit künstlicher Intelligenz geweckt wurde. Die Betriebswirtschaftslehre nahm dann diese Ansätze in technischer und theoretischer Hinsicht auf, um ihre Methoden für die Bewältigung von Informationsverarbeitungsprozessen zu nutzen oder eigene Methoden zu entwickeln, welche für diese Prozesse einsetzbar sind. Folgende Definitionen lassen sich nun für den Ontologie-Begriff in der Literatur finden :
Wie schon an anderer Stelle erwähnt und wie auch später noch mehrfach herausgegriffen, enthalten diese drei exemplarisch ausgewählten Definitionen (wie in vielen anderen Zusammenhängen gibt es eine große Zahl an unterschiedlichen Gewichtungen und Ein- und Abgrenzungen eines Gebiets) einige Bestandteile, welche bereits in anderen Zusammenhängen wichtig waren: Ein Bereich der Umwelt soll hinsichtlich seiner Begriffe in einer formalisierten Sprache abgebildet werden. Dies entspricht einer herkömmlichen Datenstrukturierung, wobei allerdings zusätzlich auch die Beziehungen zwischen den Begriffen des zu modellierenden Bereichs betrachtet werden sollen. Daraus können sich notwendigerweise auch neue Begriffe und Modellierungsinhalte ergeben, welche mit den herkömmlichen Techniken nicht erfasst werden können. Zusätzlich soll diese Beschreibung so formalisiert geschehen, dass sie maschinen-lesbar ist, d.h. dass die Metadaten über Techniken der rechner-gestützten Informationsverarbeitung automatisch verarbeitet werden können. Dies stellt besondere Anforderungen an die Formalisierung und die Spezifizierung der Metadaten, d.h. an die Art und Weise der Modellierung selbst. Typen von OntologienBei der Unterscheidung von Ontologien, die selbst wieder als Datenstrukturen zur Beschreibung anderer Datenstrukturen auftreten, lassen sich unterschiedliche Typen festlegen. Je nach Interessengebiet des Autors bzw. vorgeschlagener Einsatzbereich von Ontologien ergeben sich auch unterschiedliche Gewichtungen der einzelnen Typen. Interessant an der folgenden Liste, welche die Differenzierungen von drei Autoren vereint, ist die gleichzeitige Auflistung von möglichen Einsatzbereichen. Die folgenden Typen lassen sich finden:
Wenngleich auch die unterschiedlichen Ontologie-Typen sich nur schwer zu übergeordneten Begriffen zusammenführen lassen [Je nach den verwendeten Ontologie-Typen lassen sich selbstverständlich auch andere Kategorisierungen verwenden. Gómez-Pérez, A. (et al.) , 2004, Ontological engineering, S. 26f fasst hier unterschiedliche Ansätze zusammen, welche allerdings nicht die in diesem Abschnitt verwendeten Ontologietypen aufgreifen, sondern teilweise ähnliche, teilweise allerdings auch Ontologien für spezielle Anwendungstechniken kategorisieren. Dadurch entstehen auch andere Kategorien und Einteilungen.], was insbesondere die repräsentativen und die Metadaten-Ontologien betrifft, so kann man über die drei Dimensionen Information, Aktivitäten und Speicherung zumindest ansatzweise eine vereinfachende Ebene in die Typologie einziehen. Diese drei Dimensionen lassen sich also bspw. nutzen:
Typen von Beziehungen zwischen DatenEin Beispiel, welches ausschließlich auf rein sprachbezogene (Substantive, Verben, Adjektive etc.) Ontologien ausgerichtet ist, stellt WordNet dar. Es enthält die Möglichkeit, mehr als 100.000 Begriffe der englischen Sprache in den folgenden Beziehungstypen zueinander darzustellen. Dies ergibt im Endergebnis ein nach Begriffen und nicht nach der alphabetischen Reihenfolge aufbereitetes Wörterbuch. Zwar mögen diese Beziehungen nicht für alle Einsatzbereiche von Ontologien ausreichen, doch finden sie sich auch in den technischen Umsetzungen wie z.B. RDF wieder. Sobald hauptsächliche Textmengen durch ontologische Metadaten beschrieben werden sollen, erkennt man schnell, dass diese Beziehungstypen in diesem Fall notwendigerweise zu implementieren sind. Die Typologie besteht aus den folgenden Klassifizierungen :
Wie man bereits am letzten Beziehungstyp erkennen kann, sind nicht alle Beziehungstypen für jedwede zu erstellende Ontologie einsetzbar. Insbesondere die morphologischen Beziehungen lassen sich nur dann einsetzen, wenn überhaupt mit Hilfe von einzelnen Buchstabenbereichen verschieden Wörter (Begriffe) in eine Beziehung gesetzt werden können oder auch sollen. Dies liegt daran, weil im Fall von WordNet ein Wörterbuch nachgebildet werden soll, welches auf Ontologien beruht. Die IST-EIN- oder TEIL-VON-Beziehungen jedoch tauchen in unterschiedlichen technischen Umsetzungen auch auf. Dies mag allerdings auch daran liegen, dass insbesondere diese beiden Beziehungen auch in anderen Techniken der Datenmodellierung wie dem Entity-Relationship-Modell, dem Object-Role-Modell und natürlich in der Objektorientierung erscheinen und daher zu universellen Konzepten der Datenbeschreibung gezählt werden können. Allgemeine Eigenschaften von Ontologien, welche nicht in Form eines Wortverzeichnisses auftreten und daher grundsätzlicher Natur sind, lassen sich folgendermaßen finden:
Seminare
|
||