SciELO - Scientific Electronic Library Online

 
vol.25 número3Wardp HMM: A Shilling Attack Detection Technique Using Wardp Method and Hidden Markov ModelLexicographic Study of Synonymy: Clarifying Semantic Similarity between Words índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

  • Não possue artigos similaresSimilares em SciELO

Compartilhar


Computación y Sistemas

versão On-line ISSN 2007-9737versão impressa ISSN 1405-5546

Resumo

CASTILLO VELASQUEZ, Francisco Antonio et al. Identificación del género de autores de textos cortos. Comp. y Sist. [online]. 2021, vol.25, n.3, pp.659-665.  Epub 13-Dez-2021. ISSN 2007-9737.  https://doi.org/10.13053/cys-25-3-3999.

En la actualidad, la posibilidad de comunicarse o de expresarse por un medio electrónico es muy amplia: correo electrónico, redes sociales, chats y otras herramientas son usadas por la mayoría de los usuarios de computadoras y dispositivos móviles. Uno de los problemas que se ha presentado con esta forma de comunicación es el exceso, como el plagio, falsa identidad, notas intimidatorias, etc. La atribución de autoría de textos (AAT) se encarga de responder a la cuestión de quién es el autor de un texto, dando algunos ejemplos previos de ese autor (conjunto de entrenamiento). Un proceso útil dentro de la AAT es la identificación de género o sexo (hombre, mujer) y que ha sido estudiado por varios autores, pero principalmente para el inglés. El presente trabajo propone un modelo computacional basado en características léxicas (n-gramas) para la identificación del género para textos cortos en español. Se hicieron pruebas con un corpus de textos de mensajes en redes sociales y blogs, obteniendo resultados prometedores.

Palavras-chave : Identificación de género; aprendizaje automático; n-gramas; clasificación; autoría.

        · resumo em Inglês     · texto em Espanhol     · Espanhol ( pdf )