Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme

Wendt S, Fink GA, Kummert F (2001)
In: Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz. Hess W, Stöber K (Eds); Studientexte zur Sprachkommunikation, 22. Dresden: TUDPress: 85-91.

Konferenzbeitrag | Veröffentlicht | Deutsch
 
Download
Es wurden keine Dateien hochgeladen. Nur Publikationsnachweis!
Autor*in
Wendt, S.; Fink, Gernot A.; Kummert, FranzUniBi
Herausgeber*in
Hess, Wolfgang; Stöber, Karlheinz
Abstract / Bemerkung
In der automatischen Sprachverarbeitung sind derzeit MFCC (Mel-frequency cepstral coefficients) oder LPCC (linear predictive cepstral coefficients) als Merkmale sehr verbreitet. Die Berechnung dieser Merkmale orientiert sich dabei i.a. nur rudimentär an der menschlichen Sprachwahrnehmung. Geht man jedoch davon aus, daß die Repräsentation von Sprache beim Menschen eine optimale Repräsentation darstellt, könnte eine stärkere Berücksichtigung von menschlichen Gehöreigenschaften zu einer Verbesserung von automatischen Spracherkennungssystemen führen. In diesem Beitrag wird ein Spracherkennungssystem mit einem von Strope und Alwan vorgestellten Modell zur Berechnung des Effektes der Vorwärtsmaskierung erweitert, wobei einige änderungen in der Anwendung des Modells vorgenommen wurden. Das Modell, das sich an der akustischen Wahrnehmung des Menschen orientiert, läßt sich sehr einfach in einem auf MFCC-Merkmalen beruhenden Spracherkennungssystem einsetzen, da nur wenige Anpassungen in der Merkmalsberechnung notwendig sind, und führt vor allem in geräuschvollen Aufnahmeumgebungen zu einer deutlichen Abnahme der Wortfehlerrate.
Erscheinungsjahr
2001
Titel des Konferenzbandes
Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz
Serien- oder Zeitschriftentitel
Studientexte zur Sprachkommunikation
Band
22
Seite(n)
85-91
Konferenz
12. Konferenz Elektronische Sprachsignalverarbeitung
Konferenzort
Bonn
Konferenzdatum
2001-09-24 – 2001-09-26
ISBN
3-935712-62-6
Page URI
https://pub.uni-bielefeld.de/record/2618829

Zitieren

Wendt S, Fink GA, Kummert F. Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme. In: Hess W, Stöber K, eds. Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz. Studientexte zur Sprachkommunikation. Vol 22. Dresden: TUDPress; 2001: 85-91.
Wendt, S., Fink, G. A., & Kummert, F. (2001). Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme. In W. Hess & K. Stöber (Eds.), Studientexte zur Sprachkommunikation: Vol. 22. Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz (pp. 85-91). Dresden: TUDPress.
Wendt, S., Fink, Gernot A., and Kummert, Franz. 2001. “Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme”. In Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz, ed. Wolfgang Hess and Karlheinz Stöber, 22:85-91. Studientexte zur Sprachkommunikation. Dresden: TUDPress.
Wendt, S., Fink, G. A., and Kummert, F. (2001). “Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme” in Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz, Hess, W., and Stöber, K. eds. Studientexte zur Sprachkommunikation, vol. 22, (Dresden: TUDPress), 85-91.
Wendt, S., Fink, G.A., & Kummert, F., 2001. Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme. In W. Hess & K. Stöber, eds. Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz. Studientexte zur Sprachkommunikation. no.22 Dresden: TUDPress, pp. 85-91.
S. Wendt, G.A. Fink, and F. Kummert, “Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme”, Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz, W. Hess and K. Stöber, eds., Studientexte zur Sprachkommunikation, vol. 22, Dresden: TUDPress, 2001, pp.85-91.
Wendt, S., Fink, G.A., Kummert, F.: Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme. In: Hess, W. and Stöber, K. (eds.) Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz. Studientexte zur Sprachkommunikation. 22, p. 85-91. TUDPress, Dresden (2001).
Wendt, S., Fink, Gernot A., and Kummert, Franz. “Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme”. Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz. Ed. Wolfgang Hess and Karlheinz Stöber. Dresden: TUDPress, 2001.Vol. 22. Studientexte zur Sprachkommunikation. 85-91.
Export

Markieren/ Markierung löschen
Markierte Publikationen

Open Data PUB

Suchen in

Google Scholar
ISBN Suche