Sekundäre Informationsstrukturierung : eine Methodologie zur Verbindung XML- und RDF-basierter Informationsmodellierung sowie ihre Anwendung auf linguistische Korpora
Sasaki F (2004)
Bielefeld (Germany): Bielefeld University.
Bielefelder E-Dissertation | Deutsch
Download
Autor*in
Sasaki, Felix
Gutachter*in / Betreuer*in
Witt, Andreas (Dr.)
Alternativer Titel
Secondary information structuring : a methodology for the combination of XML- and RDF-based information modeling and its application to linguistic corpora
Abstract / Bemerkung
Ausgangspunkt der Arbeit ist die Methodologie der texttechnologischen Informationsmodellierung, die standardisierte Formate zur Modellierung von informationellen Ressourcen nutzt. Texte - als ein Beispiel einer informationellen Ressource - lassen sich auf verschiedenen, zumeist in hierarchischen Beziehungen zueinander stehenden Ebenen mit Informationen anreichern, wobei auf so genannte Auszeichnungssprachen wie XML (eXtensible Markup Language) zurückgegriffen wird. Die Eigenschaften von abstrakten, konzeptuellen Ressourcen ("Ontologien") hingegen lassen sich mittels RDF (Resource Description Framework) bzw. darauf aufbauenden Standards beschreiben. Die Verwendung von Auszeichnungssprachen zur Verarbeitung textueller Dokumente bezeichnet man als primäre Informationsmodellierung, die Modellierung abstrakter, konzeptueller Ressourcen geschieht auf einer konzeptuellen Ebene. Sekundäre Informationsstrukturierung verknüpft die Modellierungsinventarien, welche in der primären Informationsstrukturierung und in der konzeptuellen Ebene von Bedeutung sind, und erlaubt so eine Verbindung dieser beiden Formen von Informationsmodellierung. In der primären Informationsstrukturierung sind Regeln für den Aufbau von Dokumentklassen, d.h. Dokumentgrammatiken, und Strukturmuster in ausgezeichneten Dokumenten, so genannte Bedingungen relevant. Der Kern der Modellierung auf der konzeptuellen Ebene hingegen bilden Konzepte, die in eine Konzepthierarchie eingegliedert und durch interkonzeptuelle Beziehungen verbunden sind. Die sekundäre Informationsstrukturierung stellt nun eine Reihe vordefinierter Prädikate bereit, welche diese an sich heterogenen informationellen Ressourcen in logischen Aussagen aufeinander beziehen. Regel- und Bedingungsbeschreibungen werden in den Aussagen selektiert, in eine Konzepthierarchie integriert, und durch die Beschreibung interkonzeptueller Beziehungen zueinander bzw. zur konzeptuellen Ebene relationiert. Die Aussagen in der sekundären Informationsstrukturierung stellen eine intensionale, d.h. inhaltsseitige Beschreibung von Eigenschaften informationeller Ressourcen dar. Sie lassen sich operationalisieren in Hinblick auf ihre Extension bzw. ausdrucksseitige Beschreibung, d.h. in den informationellen Ressourcen selbst. Die vorliegende Arbeit definiert Operationen wie eine konzeptbezogene Suche, Validierung oder Transformation ausgezeichneter Dokumente in der primären Informationsstrukturierung.
Die Arbeit exemplifiziert die entwickelte Methodologie in der Domäne linguistischer, textueller Korpora. Zwei Themenbereiche stehen dabei im Fokus. Die Multidimensionalität der Sprache führt dazu, dass die integrierte Repräsentation verschiedener, linguistischer Auszeichnungsebenen in (textuellen) Korpora ein außerordentliches Problem darstellt. Hier ermöglicht es die sekundäre Informationsstrukturierung, Beziehungen zwischen den Ebenen separat zu den Auszeichnungen, d.h. als eine inhaltsseitige Beschreibung darzustellen. Die Auszeichnung tiefergehender Strukturen, d.h. nicht auf einzelne Auszeichnungssegmente beziehbarer linguistischer Phänomene, ist der zweite Bereich. Sekundäre Informationsstrukturierung macht diese Strukturen in Form von Aussagen über die impliziten Strukturen explizit. Die Methodologie leistet also in zweifacher Hinsicht einen substantiellen Beitrag zu einer linguistisch motivierten, korpusbasierten Informationsmodellierung.
Stichworte
Dokumentverarbeitung , Korpus (Linguistik) , XML , RDF (Informatik) , Annotation , XML , RDF , Informationsmodellierung , Schemasprachen , Markup language , Schema language
Jahr
2004
Page URI
https://pub.uni-bielefeld.de/record/2302927
Zitieren
Sasaki F. Sekundäre Informationsstrukturierung : eine Methodologie zur Verbindung XML- und RDF-basierter Informationsmodellierung sowie ihre Anwendung auf linguistische Korpora. Bielefeld (Germany): Bielefeld University; 2004.
Sasaki, F. (2004). Sekundäre Informationsstrukturierung : eine Methodologie zur Verbindung XML- und RDF-basierter Informationsmodellierung sowie ihre Anwendung auf linguistische Korpora. Bielefeld (Germany): Bielefeld University.
Sasaki, Felix. 2004. Sekundäre Informationsstrukturierung : eine Methodologie zur Verbindung XML- und RDF-basierter Informationsmodellierung sowie ihre Anwendung auf linguistische Korpora. Bielefeld (Germany): Bielefeld University.
Sasaki, F. (2004). Sekundäre Informationsstrukturierung : eine Methodologie zur Verbindung XML- und RDF-basierter Informationsmodellierung sowie ihre Anwendung auf linguistische Korpora. Bielefeld (Germany): Bielefeld University.
Sasaki, F., 2004. Sekundäre Informationsstrukturierung : eine Methodologie zur Verbindung XML- und RDF-basierter Informationsmodellierung sowie ihre Anwendung auf linguistische Korpora, Bielefeld (Germany): Bielefeld University.
F. Sasaki, Sekundäre Informationsstrukturierung : eine Methodologie zur Verbindung XML- und RDF-basierter Informationsmodellierung sowie ihre Anwendung auf linguistische Korpora, Bielefeld (Germany): Bielefeld University, 2004.
Sasaki, F.: Sekundäre Informationsstrukturierung : eine Methodologie zur Verbindung XML- und RDF-basierter Informationsmodellierung sowie ihre Anwendung auf linguistische Korpora. Bielefeld University, Bielefeld (Germany) (2004).
Sasaki, Felix. Sekundäre Informationsstrukturierung : eine Methodologie zur Verbindung XML- und RDF-basierter Informationsmodellierung sowie ihre Anwendung auf linguistische Korpora. Bielefeld (Germany): Bielefeld University, 2004.
Alle Dateien verfügbar unter der/den folgenden Lizenz(en):
Copyright Statement:
Dieses Objekt ist durch das Urheberrecht und/oder verwandte Schutzrechte geschützt. [...]
Volltext(e)
Access Level
Open Access
Zuletzt Hochgeladen
2019-09-06T08:57:41Z
MD5 Prüfsumme
aa7583c884408668b6644b0918f17429