Etiquetado fonético automático al nivel palabra usando la dinámica de cambio de los vectores del libro código

Suárez Guerra, Sergio; Oropeza Rodríguez, José Luis

doi:10.13053/cys-24-2-3229

Serviços Personalizados

Journal

Artigo

Indicadores

Citado por SciELO
Acessos

Links relacionados

Similares em SciELO

Permalink

Computación y Sistemas

versão On-line ISSN 2007-9737versão impressa ISSN 1405-5546

Resumo

SUAREZ GUERRA, Sergio e OROPEZA RODRIGUEZ, José Luis. Etiquetado fonético automático al nivel palabra usando la dinámica de cambio de los vectores del libro código. Comp. y Sist. [online]. 2020, vol.24, n.2, pp.861-874. Epub 04-Out-2021. ISSN 2007-9737. https://doi.org/10.13053/cys-24-2-3229.

Se describe una solución alternativa referente al etiquetado fonético que componen un conjunto de palabras de pronunciadas por un locutor, susceptible de utilizarse en cualquier idioma, según sean las necesidades y características asociadas a la propuesta. El procedimiento se basa en el seguimiento de la dinámica de cambio de los vectores cepstrales asociados a la frecuencia de Mel (MFCCs) que conforman el Libro Código (LC), extraído de la palabra a etiquetar. Esta dinámica de cambio analiza dónde ocurre una transición de un vector (MFCC) del LC a otro, así como las perturbaciones que ocurren en la zona de cambio debido a la concatenación fonética. Se establecen métricas para considerar el ruido de coarticulación y definir la ubicación de la frontera de separación fonética. Se usan dos métodos para evaluar la dinámica de cambio de los vectores y entregar el etiquetado más acertado. El porciento de reconocimiento y etiquetado correcto obtenido con esta aplicación es del 97.9%, inferior en un 1.06%, con respecto al porcentaje de reconocimiento obtenido sobre el mismo corpus de palabras, pero haciendo uso de un etiquetado manual. Lo más impórtate es que, el tiempo utilizado en el etiquetado del corpus de voz de forma automática, es significativamente menor que el estimado de hacerse manualmente, además de eliminar la subjetividad personal en el trabajo de etiquetado.

Palavras-chave : Etiquetado fonético; reconocimiento de voz.

· resumo em Inglês · texto em Espanhol · Espanhol (

pdf )