VEU

Speech Processing

L’àmbit de recerca del grup VEU és el tractament de la parla. Investiguem tecnologies que permeten l’extracció d’informació que la veu conté: reconeixement de què es diu, l’idioma o el dialecte, característiques del parlant -qui és, la seva edat, el sexe, l’estat emocional-, la direcció del so. També treballem en la caracterització general de l’àudio, per determinar quan hi ha veu i quan hi ha altres esdeveniments acústics com música o sorolls diversos. Les tecnologies de la parla possibiliten generar veu -síntesis de veu- o modificar les seves característiques.

Línies principals d’investigació

  • Anàlisi de la parla.
  • Reconeixement de veu.
  • Reconeixement de parlants i idiomes.
  • Síntesi de parla.
  • Sistemes de diàleg.
  • Codificació de veu.
  • Millora de la parla.
  • Traducció automàtica estadística.

Capacitats tecnològiques

  • Millora i anàlisi d’àudio.
  • Construcció i ús de recursos lèxics multilingües.
  • Desenvolupament de bases de dades de parla.
  • Extracció d’informació.
  • Recuperació d’informació.
  • Mètodes d’aprenentatge automàtic.
  • Traducció automàtica.
  • Reconeixement de parla robust multilingüe.
  • Conversió de text a veu multilingüe.
  • Interfícies de llenguatge natural.
  • Eines de processament del llenguatge natural.
  • Reconeixement de locutor i emocions.

Casos d’èxit, exemples

  • AEDL: Localització d’esdeveniments acústics en sala multimodal.
  • CHIL: Computers in the Human Interaction Loop.
  • ALLIES: Desenvolupament de sistemes intel·ligents autònoms que mantinguin el seu rendiment al llarg del temps.

Spin-offs

anàlisi de la parla | codificació de la parla | grup | millora de la parla | reconeixement de l'idioma | reconeixement de veu | reconeixement del parlant | síntesi de la parla | sistemes de diàleg | traducció automàtica estadística