Sprachdialogsysteme erhalten immer mehr Einzug in
unseren Alltag. Wenn man z.B. bei der Telekom anruft, so wird das Telefonat von
einem solchen System entgegen genommen. Der Anrufer wird dann entsprechend
seinem Anliegen mit dem richtigen Sachbearbeiter verbunden. Auch bei IKEA wird
man von einem solchen System begrüßt. Es erlaubt u.a. die Abfrage der
Warenverfügbarkeit.
Doch was ist eigentlich ein solches
Sprachdialogsystem? Wie funktioniert es und wie ist es aufgebaut? Mit einem
Sprachdialogsystem können Anrufer über ein Telefon oder ein anderes akustisches
Medium teil- oder vollautomatisiert natürlichsprachliche Dialoge führen.
Der Dialog mit allen seinen festgelegten Varianten ist in
VoiceXML beschrieben. Diese Dialogbeschreibung wird zur Laufzeit durch den
Dialogablauf-Interpreter verarbeitet. Sprachliche Äußerungen des Systems
erfolgen entweder durch zuvor von Sprechern aufgenommene Äußerungen, oder sie
werden durch den Sprechsynthetisierer (Text-to-Speech-Engine, TTS) des Sprachdialogsystems
erzeugt. Äußerungen des Anrufers werden durch den automatischen Spracherkenner
(Automatic Speech Recognition, ASR) des Sprachdialogsystems verstanden. Im Dialog
mit dem Anrufer benötigte Informationen werden von den Backend-Systemen
gelesen. Erhaltene Informationen, wie z.B. eine Bestellung, werden an die Backend-Systeme
übermittelt
Mit Sprachdialogsystemen lassen sich einfache Dialoge
besonders gut abbilden. Hierzu gehören z.B.
Adressänderung,
Änderung der Bankverbindung,
Warenbestellung,
Verfügbarkeitsprüfung von Artikeln,
an einem Gewinnspiel teilnehmen,
Urlaubsantrag stellen,
Krankmeldung vornehmen.
Sprachdialogsysteme können angerufen werden (Inbound), sind
aber auch in der Lage, anzurufen (Outbound), um z.B. Fachhändler an eine wöchentliche
Bestellung zu erinnern oder Feuerwehrleute zu einem Einsatz zu rufen.
Sprachdialogsysteme sind besonders gut in Situationen
geeignet, in denen Computer nicht vorhanden sind oder nicht eingesetzt werden
können. Sie sind
Einfach zu bedienen,
schnell,
7 Tage und 24 Stunden verfügbar,
hinsichtlich der Anzahl der Anrufer skalierbar,
sicher, fehlerarm,
mehrsprachig und adaptiv.
Für die
Akzeptanz des Systems durch den Benutzer ist jedoch ein auf den Anwendungsfall
abgestimmtes Gesprächsdesign unerläßlich.