A hierarchical system for word discovery exploiting DTW-based initialization

Walter, Oliver; Korthals, Timo; Haeb-Umbach, Reinhold; Raj, Bhiksha

A hierarchical system for word discovery exploiting DTW-based initialization

Walter O, Korthals T, Haeb-Umbach R, Raj B (2013)
In: IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), 2013. IEEE: 386-391.

Konferenzbeitrag | Englisch

Download

Es wurden keine Dateien hochgeladen. Nur Publikationsnachweis!

URL

http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=6707761&url=http%3A%2F%2Fi[...]

DOI

https://doi.org/10.1109/ASRU.2013.6707761

Autor*in

Walter, Oliver; Korthals, Timo^UniBi ; Haeb-Umbach, Reinhold; Raj, Bhiksha

Einrichtung

Technische Fakultät > AG Kognitronik und Sensorik
Center of Excellence - Cognitive Interaction Technology CITEC

Abstract / Bemerkung

Discovering the linguistic structure of a language solely from spoken input asks for two steps: phonetic and lexical discovery. The first is concerned with identifying the categorical subword unit inventory and relating it to the underlying acoustics, while the second aims at discovering words as repeated patterns of subword units. The hierarchical approach presented here accounts for classification errors in the first stage by modelling the pronunciation of a word in terms of subword units probabilistically: a hidden Markov model with discrete emission probabilities, emitting the observed subword unit sequences. We describe how the system can be learned in a completely unsupervised fashion from spoken input. To improve the initialization of the training of the word pronunciations, the output of a dynamic time warping based acoustic pattern discovery system is used, as it is able to discover similar temporal sequences in the input data. This improved initialization, using only weak supervision, has led to a 40% reduction in word error rate on a digit recognition task.

Stichworte

hidden Markov models; natural language processing; DTW based initialization; acoustic pattern discovery system; digit recognition; dynamic time warping; emission probabilities; hidden Markov model; hierarchical system; lexical discovery; linguistic structure; phonetic discovery; temporal sequences; word discovery; word pronunciations; Acoustics; Clustering algorithms; Hidden Markov models; Iterative decoding; Silicon; Speech; Training; Unsupervised; acoustic units; word discovery

Erscheinungsjahr

2013

Titel des Konferenzbandes

IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), 2013

Seite(n)

386-391

Konferenz

ASRU 2013

Konferenzort

Olomouc, Tschechien

Konferenzdatum

2013-12-08 – 2013-12-12

Page URI

https://pub.uni-bielefeld.de/record/2902861

Zitieren

Walter O, Korthals T, Haeb-Umbach R, Raj B. A hierarchical system for word discovery exploiting DTW-based initialization. In: IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), 2013. IEEE; 2013: 386-391.

Walter, O., Korthals, T., Haeb-Umbach, R., & Raj, B. (2013). A hierarchical system for word discovery exploiting DTW-based initialization. IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), 2013, 386-391. IEEE. doi:10.1109/ASRU.2013.6707761

Walter, Oliver, Korthals, Timo, Haeb-Umbach, Reinhold, and Raj, Bhiksha. 2013. “A hierarchical system for word discovery exploiting DTW-based initialization”. In IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), 2013, 386-391. IEEE.

Walter, O., Korthals, T., Haeb-Umbach, R., and Raj, B. (2013). “A hierarchical system for word discovery exploiting DTW-based initialization” in IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), 2013 (IEEE), 386-391.

Walter, O., et al., 2013. A hierarchical system for word discovery exploiting DTW-based initialization. In IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), 2013. IEEE, pp. 386-391.

O. Walter, et al., “A hierarchical system for word discovery exploiting DTW-based initialization”, IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), 2013, IEEE, 2013, pp.386-391.

Walter, O., Korthals, T., Haeb-Umbach, R., Raj, B.: A hierarchical system for word discovery exploiting DTW-based initialization. IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), 2013. p. 386-391. IEEE (2013).

Walter, Oliver, Korthals, Timo, Haeb-Umbach, Reinhold, and Raj, Bhiksha. “A hierarchical system for word discovery exploiting DTW-based initialization”. IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), 2013. IEEE, 2013. 386-391.

Link(s) zu Volltext(en)

URL

http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=6707761&url=http%3A%2F%2Fieeexplore.ieee.org%2Fiel7%2F6695806%2F6707689%2F06707761.pdf%3Farnumber%3D6707761

Access Level

Closed Access

Export

Markieren/ Markierung löschen
Markierte Publikationen

Open Data PUB

Suchen in

Google Scholar

PUB - Publikationen an der Universität Bielefeld

A hierarchical system for word discovery exploiting DTW-based initialization

Zitieren