SciELO - Scientific Electronic Library Online

 
vol.17 número2Selección de los arcos correctos basada en información lingüística para análisis sintáctico de dependencias índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay artículos similaresSimilares en SciELO

Compartir


Computación y Sistemas

versión On-line ISSN 2007-9737versión impresa ISSN 1405-5546

Resumen

ISLAM, Zahurul  y  MEHLER, Alexander. Automatic Readability Classification of Crowd-Sourced Data based on Linguistic and Information-Theoretic Features. Comp. y Sist. [online]. 2013, vol.17, n.2, pp.113-123. ISSN 2007-9737.

This paper presents a classifier of text readability based on information-theoretic features. The classifier was developed based on a linguistic approach to readability that explores lexical, syntactic and semantic features. For this evaluation we extracted a corpus of 645 articles from Wikipedia together with their quality judgments. We show that information-theoretic features perform as well as their linguistic counterparts even if we explore several linguistic levels at once.

Palabras llave : Text readability; Wikipedia; enthropy; information transmission; evaluation of features.

        · resumen en Español     · texto en Inglés     · Inglés ( pdf )

 

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons