VEU

Speech Processing

L’àmbit de recerca del grup VEU és el tractament de la parla. Investiguem tecnologies que permeten l’extracció d’informació que la veu conté: reconeixement de què es diu, l’idioma o el dialecte, característiques del parlant -qui és, la seva edat, el sexe, l’estat emocional-, la direcció del so. També treballem en la caracterització general de l’àudio, per determinar quan hi ha veu i quan hi ha altres esdeveniments acústics com música o sorolls diversos. Les tecnologies de la parla possibiliten generar veu -síntesis de veu- o modificar les seves característiques.

Línies principals d’investigació

 • Anàlisi de la parla.
 • Reconeixement de veu.
 • Reconeixement de parlants i idiomes.
 • Síntesi de parla.
 • Sistemes de diàleg.
 • Codificació de veu.
 • Millora de la parla.
 • Traducció automàtica estadística.

Capacitats tecnològiques

 • Millora i anàlisi d’àudio.
 • Construcció i ús de recursos lèxics multilingües.
 • Desenvolupament de bases de dades de parla.
 • Extracció d’informació.
 • Recuperació d’informació.
 • Mètodes d’aprenentatge automàtic.
 • Traducció automàtica.
 • Reconeixement de parla robust multilingüe.
 • Conversió de text a veu multilingüe.
 • Interfícies de llenguatge natural.
 • Eines de processament del llenguatge natural.
 • Reconeixement de locutor i emocions.

Casos d’èxit, exemples

 • AEDL: Localització d’esdeveniments acústics en sala multimodal.
 • CHIL: Computers in the Human Interaction Loop.
 • ALLIES: Desenvolupament de sistemes intel·ligents autònoms que mantinguin el seu rendiment al llarg del temps.

Spin-offs

anàlisi de la parla | codificació de la parla | grup | millora de la parla | reconeixement de l'idioma | reconeixement de veu | reconeixement del parlant | síntesi de la parla | sistemes de diàleg | traducció automàtica estadística