Una heurística eficiente aplicada al algoritmo K-means para el agrupamiento de grandes instancias altamente agrupadas

Pérez-Ortega, Joaquín; Hidalgo-Reyes, Miguel; Castro-Sánchez, Noé Alejandro; Pazos-Rangel, Rodolfo; Díaz-Parra, Ocotlán; Olivares-Peregrino, Víctor; Almanza-Ortega, Nelva

doi:10.13053/cys-22-2-2546

Serviços Personalizados

Journal

Artigo

Indicadores

Citado por SciELO
Acessos

Links relacionados

Similares em SciELO

Permalink

Computación y Sistemas

versão On-line ISSN 2007-9737versão impressa ISSN 1405-5546

Resumo

PEREZ-ORTEGA, Joaquín et al. Una heurística eficiente aplicada al algoritmo K-means para el agrupamiento de grandes instancias altamente agrupadas. Comp. y Sist. [online]. 2018, vol.22, n.2, pp.607-619. Epub 21-Jan-2021. ISSN 2007-9737. https://doi.org/10.13053/cys-22-2-2546.

Con la presencia cada vez mayor de Big Data surge la necesidad de agrupar grandes instancias. Estas instancias presentan un número de objetos de naturaleza multidimensional, los cuales requieren agruparse en cientos o miles de grupos. En este artículo se presenta una mejora al algoritmo K-means, la cual está orientada a la solución eficiente de instancias con un gran número de grupos y de dimensiones. A dicha mejor heurística se le denomina Honeycomb (HC) y está basada en la relación entre el número de dimensiones y el número de centroides que conforman una vecindad, permitiendo reducir el número de cálculos de distancias objeto-centroide para cada objeto. La heurística se validó resolviendo un conjunto de instancias sintéticas obteniendo reducciones del tiempo de ejecución de hasta un 90 % y con disminución de la calidad menor al 1 %, respecto a K-means estándar. Para instancias reales de baja y alta dimensionalidad, HC obtuvo una reducción del tiempo de ejecución entre 84.74 % y 95.44 % y con una reducción de la calidad entre el 1.07 % y 1.62 %, respectivamente. Los resultados experimentales son alentadores porque esta heurística beneficiaría a aquellos dominios que requieren instancias con valores cada vez mayores de objetos, dimensiones y grupos.

Palavras-chave : Algoritmo K-means; complejidad computacional; heurística.

· resumo em Inglês · texto em Espanhol