SciELO - Scientific Electronic Library Online

 
vol.18 número1Mejora de voz con filtrado local adaptativo basado en estadísticas de ordenDetección de ruido y aprendizaje basado en información actual índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

  • Não possue artigos similaresSimilares em SciELO

Compartilhar


Computación y Sistemas

versão On-line ISSN 2007-9737versão impressa ISSN 1405-5546

Resumo

RAMIREZ-CRUZ, Yunior. Introducing Biases in Document Clustering. Comp. y Sist. [online]. 2014, vol.18, n.1, pp.137-151. ISSN 2007-9737.  https://doi.org/10.13053/CyS-18-1-2014-024.

In this paper, we present three criteria for introducing biases in document clustering algorithms, when information characterizing the document collections is available. We focus on collections known to be the result of a document categorization or sample-based document filtering process. Our proposals rely on profiles, i.e., document samples known to have been used for obtaining the collection, to extract statistics which determine the biases to introduce. We conduct an experimental evaluation over a number of collections extracted from the widely used corpus RCV1, which allows us to confirm the validity of our proposals and determine a number of situations where biased clusterings, according to different criteria, outperform their unbiased counterparts.

Palavras-chave : Document clustering; introduc biases.

        · resumo em Espanhol     · texto em Inglês     · Inglês ( pdf )

 

Creative Commons License Todo o conteúdo deste periódico, exceto onde está identificado, está licenciado sob uma Licença Creative Commons