Robustes Verstehen gesprochener Sprache in einem multimodalen Roboter-Szenario

Hüwel S (2006)
Bielefeld (Germany): Bielefeld University.

Download
OA
Bielefeld Dissertation | German
Author
Supervisor
Wrede, Britta
Alternative Title
Robust understanding of speech for multimodal robot interaction
Abstract
Das Bestreben in Industrie und Forschung, Robotersysteme zu entwickeln, die dem Menschen zur Unterhaltung dienen oder andere Dienste erweisen, ist ungebrochen. Dabei wird die Möglichkeit, mit dem Robotersystem interagieren zu können, immer wichtiger. Gerade für den Privatgebrauch ist es das Ziel, einen Roboterkameraden zu konstruieren, der dem Menschen zur Seite steht, ihn z.B. bei den Aufgaben wie Aufräumen oder Blumengießen unterstützt. Da gerade im privaten Bereich sehr unterschiedliche Menschen (z.B. alte und junge) mit dem Roboter interagieren sollen, kann nicht erwartet werden, dass sie erst eine Reihe von komplexen Befehlen lernen müssen. Ebenfalls sollte es möglich sein, dem Roboter neue Gegenstände zu zeigen und sie benennen zu können, damit der Roboter mehr über seine Umgebung lernt und so besser in ihr agieren kann. Es ist daher sehr wichtig, dass die Kommunikation möglichst unbeschränkt und intuitiv stattfinden kann. Diese Arbeit stellt einen interdisziplinären Ansatz für die Entwicklung einer robusten Sprachverarbeitung für einen Robotergefährten dar, der einerseits die Rahmenbedingungen berücksichtigt, die für eine freie Kommunikation mit sehr unterschiedlichen Personengruppen gelten, aber auch auf die komplexeren Zusammenspiele und Anforderungen der anderen im Robotersystem integrierten Komponenten eingeht. Robustheit bedeutet in diesem Zusammenhang zweierlei. Einerseits kann die Verstehenskomponente eine Vielzahl an Äußerungen verstehen, die in einem spontansprachlichen Kontext vorkommen können (Mensch und Roboter agieren in einer gemeinsamen Umgebung). Das bedeutet, dass sowohl nicht-grammatikalische oder unvollständige Äußerungen verarbeitet als auch mögliche Hinweise auf Informationen über die Umgebung korrekt eingebunden und an die visuellen Komponenten weitergereicht werden können. Andererseits kann die Verstehenskomponente auch mit möglicherweise fehlerhaften Daten aus der Spracherkennung umgehen. Das Sprachverstehen generiert eine semantische Interpretation aus der erkannten Wortkette und bewertet zusätzlich die Qualität, also inwieweit eine Äußerung vollständig korrekt erkannt wurde oder nicht. Der Ansatz der Sprachverarbeitung ist modular aufgebaut, um eine Trennung der Wissensdatenbanken (Lexikon und semantische Konzepte) von dem Verarbeitungsmechanismus zu ermöglichen. Somit können die Datenbanken des Systems jeweils an neue Kontexte angepasst und um neue Sprachdaten erweitert werden, die z.B. aus realen Experimenten gewonnen wurden. Im Rahmen dieser Arbeit wurde ein besonderer Repräsentationsformalismus für die Semantik situierter Spontansprache entwickelt. Die sogenannten situierten semantischen Einheiten oder Units (SSUs) bilden das gesamte Wissen für die Dialoge zwischen Mensch und Roboter ab, sie stellen zudem hierarchische Informationen bereit, die sowohl für die Verarbeitung als auch für die Bereitstellung von Dialogakten genutzt werden können. Der Verarbeitungsmechanismus generiert unter Einsatz der Wissensdatenbanken jeweils eine semantische Interpretation aus den Äußerungen der Interaktionspartner. Dafür werden anstelle syntaktischer Informationen die semantischen Beziehungen zwischen den Wörtern genutzt. Die Interpretationen werden anschließend vom Dialogmanager verwendet, um eine Handlung zu generieren, z.B. auf eine Frage zu antworten oder die Robotersteuerung zu aktivieren. Zunächst setzt sich diese Arbeit mit den soziologischen, psychologischen und linguistischen Besonderheiten der spontansprachlichen Interaktion zwischen Mensch und Roboter auseinander. Hierzu wurden erste Studien und Experimente durchgeführt. Aus den Korpusstudien der Experimente wurde das Lexikon und die semantische Datenbank für das Robotersystem entwickelt. Ein weiterer Bereich, der in dem besonderen Konzept der Sprachverarbeitung einfließt, ist die technische Realisierung des Roboters. Insbesondere wird auf die Schnittstellen zwischen den Komponenten eingegangen. Dazu kommen technische Besonderheiten, die sich aus der Notwendigkeit eines Echtzeitsystems in einer realen Umgebung in der Interaktion mit möglicherweise unbekannten Personen ergeben. Das Sprachverstehen mit seinen verschiedenen Bestandteilen ist in die multimodale Roboterarchitektur BIRON integriert, das im zweiten Teil dieser Arbeit ausführlich behandelt wird. Außerdem wurden Benutzerexperimente mit BIRON durchgeführt und das Sprachverstehen auf Basis dieser Experimente evaluiert. Das hier beschriebene Konzept zum Sprachverstehen verleiht einem mobilen Robotersystem die Fähigkeit, spontansprachliche und situierte Äußerungen zu verstehen und mit anderen Modalitäten in Beziehung zu setzen. Das Robotersystem erlangt dadurch tiefgehende kommunikative Fähigkeiten, die den Grundstock zur Verständigung in freien Dialogsituationen bilden.
Year
PUB-ID

Cite this

Hüwel S. Robustes Verstehen gesprochener Sprache in einem multimodalen Roboter-Szenario. Bielefeld (Germany): Bielefeld University; 2006.
Hüwel, S. (2006). Robustes Verstehen gesprochener Sprache in einem multimodalen Roboter-Szenario. Bielefeld (Germany): Bielefeld University.
Hüwel, S. (2006). Robustes Verstehen gesprochener Sprache in einem multimodalen Roboter-Szenario. Bielefeld (Germany): Bielefeld University.
Hüwel, S., 2006. Robustes Verstehen gesprochener Sprache in einem multimodalen Roboter-Szenario, Bielefeld (Germany): Bielefeld University.
S. Hüwel, Robustes Verstehen gesprochener Sprache in einem multimodalen Roboter-Szenario, Bielefeld (Germany): Bielefeld University, 2006.
Hüwel, S.: Robustes Verstehen gesprochener Sprache in einem multimodalen Roboter-Szenario. Bielefeld University, Bielefeld (Germany) (2006).
Hüwel, Sonja. Robustes Verstehen gesprochener Sprache in einem multimodalen Roboter-Szenario. Bielefeld (Germany): Bielefeld University, 2006.
Main File(s)
Access Level
OA Open Access

This data publication is cited in the following publications:
This publication cites the following data publications:

Export

0 Marked Publications

Open Data PUB

Search this title in

Google Scholar