Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme

Wendt S, Fink GA, Kummert F (2001)
In: Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz. Hess W, Stöber K (Eds); Studientexte zur Sprachkommunikation, 22. Dresden: TUDPress: 85-91.

Conference Paper | Published | German

No fulltext has been uploaded

Author
; ;
Editor
Hess, Wolfgang ; Stöber, Karlheinz
Abstract
In der automatischen Sprachverarbeitung sind derzeit MFCC (Mel-frequency cepstral coefficients) oder LPCC (linear predictive cepstral coefficients) als Merkmale sehr verbreitet. Die Berechnung dieser Merkmale orientiert sich dabei i.a. nur rudimentär an der menschlichen Sprachwahrnehmung. Geht man jedoch davon aus, daß die Repräsentation von Sprache beim Menschen eine optimale Repräsentation darstellt, könnte eine stärkere Berücksichtigung von menschlichen Gehöreigenschaften zu einer Verbesserung von automatischen Spracherkennungssystemen führen. In diesem Beitrag wird ein Spracherkennungssystem mit einem von Strope und Alwan vorgestellten Modell zur Berechnung des Effektes der Vorwärtsmaskierung erweitert, wobei einige änderungen in der Anwendung des Modells vorgenommen wurden. Das Modell, das sich an der akustischen Wahrnehmung des Menschen orientiert, läßt sich sehr einfach in einem auf MFCC-Merkmalen beruhenden Spracherkennungssystem einsetzen, da nur wenige Anpassungen in der Merkmalsberechnung notwendig sind, und führt vor allem in geräuschvollen Aufnahmeumgebungen zu einer deutlichen Abnahme der Wortfehlerrate.
Publishing Year
Conference
12. Konferenz Elektronische Sprachsignalverarbeitung
Location
Bonn
Conference Date
2001-09-24 – 2001-09-26
PUB-ID

Cite this

Wendt S, Fink GA, Kummert F. Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme. In: Hess W, Stöber K, eds. Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz. Studientexte zur Sprachkommunikation. Vol 22. Dresden: TUDPress; 2001: 85-91.
Wendt, S., Fink, G. A., & Kummert, F. (2001). Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme. In W. Hess & K. Stöber (Eds.), Studientexte zur Sprachkommunikation: Vol. 22. Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz (pp. 85-91). Dresden: TUDPress.
Wendt, S., Fink, G. A., and Kummert, F. (2001). “Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme” in Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz, ed. W. Hess and K. Stöber Studientexte zur Sprachkommunikation, vol. 22, (Dresden: TUDPress), 85-91.
Wendt, S., Fink, G.A., & Kummert, F., 2001. Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme. In W. Hess & K. Stöber, eds. Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz. Studientexte zur Sprachkommunikation. no.22 Dresden: TUDPress, pp. 85-91.
S. Wendt, G.A. Fink, and F. Kummert, “Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme”, Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz, W. Hess and K. Stöber, eds., Studientexte zur Sprachkommunikation, vol. 22, Dresden: TUDPress, 2001, pp.85-91.
Wendt, S., Fink, G.A., Kummert, F.: Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme. In: Hess, W. and Stöber, K. (eds.) Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz. Studientexte zur Sprachkommunikation. 22, p. 85-91. TUDPress, Dresden (2001).
Wendt, S., Fink, Gernot A., and Kummert, Franz. “Vorwärtsmaskierung für cepstrum-basierte Spracherkennungssysteme”. Elektronische Sprachsignalverarbeitung. Tagungsband der zwölften Konferenz. Ed. Wolfgang Hess and Karlheinz Stöber. Dresden: TUDPress, 2001.Vol. 22. Studientexte zur Sprachkommunikation. 85-91.
This data publication is cited in the following publications:
This publication cites the following data publications:

Export

0 Marked Publications

Open Data PUB

Search this title in

Google Scholar
ISBN Search