SciELO - Scientific Electronic Library Online

 
vol.35 número89Servicios accesibles a todos los usuarios en las bibliotecas universitarias españolas: estado de la cuestión índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay artículos similaresSimilares en SciELO

Compartir


Investigación bibliotecológica

versión On-line ISSN 2448-8321versión impresa ISSN 0187-358X

Resumen

POLO BAUTISTA, Luis Roberto  y  MARTINEZ ACEVEDO, Karen Vanessa. Algoritmo para el análisis temático de documentos digitales. Investig. bibl [online]. 2021, vol.35, n.89, eib0895841901.  Epub 22-Mar-2022. ISSN 2448-8321.  https://doi.org/10.22201/iibi.24488321xe.2021.89.58419.

El objetivo del artículo es presentar un algoritmo para asignar áreas temáticas a documentos digitales que sirva como herramienta de apoyo al análisis temático dentro de la organización de la información, con el fin de ser implementado en el desarrollo de vocabularios controlados. La metodología utilizada consistió en aplicar el Reconocimiento Óptico de Caracteres (ROC) y la Asignación Latente de Dirichlet (ALD) como las principales herramientas para el desarrollo de un algoritmo basado en el lenguaje de programación Python, que permite la lectura de archivos con extensión PDF para la obtención de los principales temas del corpus textual. Los resultados de la aplicación del algoritmo demuestran su utilidad en el área de la indización como un sistema para identificar y extraer temas relevantes de un documento específico en formato electrónico, permitiendo la automatización de procesos por parte del profesional de la información. De esta forma, se concluye su uso como desarrollo de puntos de acceso alternativos en función del contenido de los textos.

Palabras llave : Asignación Latente de Dirichlet; Algoritmos; Análisis Temático; Documentos Digitales.

        · resumen en Inglés     · texto en Español