SciELO - Scientific Electronic Library Online

 
vol.97 issue4Why continue with floristic checklists in Mexico? The case of the Tacaná-Boquerón Priority Terrestrial Region, in the Mexican State of ChiapasFloristic inventory of the Biosphere Reserve Sierra del Abra Tanchipa, San Luis Potosí, Mexico author indexsubject indexsearch form
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • Have no similar articlesSimilars in SciELO

Share


Botanical Sciences

On-line version ISSN 2007-4476Print version ISSN 2007-4298

Abstract

RUIZ-SANCHEZ, Eduardo et al. Datataxa: un nuevo script para extraer la información de los metadatos de secuencias de GenBank: la Flora del Bajío como un caso de estudio. Bot. sci [online]. 2019, vol.97, n.4, pp.754-760.  Epub Feb 04, 2020. ISSN 2007-4476.  https://doi.org/10.17129/botsci.2226.

Antecedentes:

GenBank es un repositorio público de millones de secuencias nucleotídicas. Se han desarrollado varios programas para extraer la información almacenada en GenBank. Ninguno de ellos es útil para extraer y organizar información de los metadatos de las entradas de GenBank. Desarrollamos un nuevo script llamado Datataxa, que extrae metainformación de Genbank. El listado de la Flora del Bajío y de Regiones Adyacentes (FBRA) fue utilizado como caso de estudio, para probar nuestro script.

Pregunta:

¿Cuántas especies de la FBRA tienen registros en GenBank? y ¿Qué porcentaje de esos registros se han utilizado en estudios de filogenética, filogeografía, filogenómica, código de barras, diversidad genética y biogeografía?.

Métodos:

Datataxa está escrito en lenguaje AutoIt Scripting Language para facilitar la extracción de información de GenBank. La información extraída de GenBank fue clasificada en seis categorías. La lista preliminar de especies de la FBRA fue utilizada como caso de estudio para aplicar nuestro script. Estas categorías fueron aplicadas a la lista de especies de la FBRA.

Resultados:

El script nos permitió extraer y organizar la información de lo metadatos, como los títulos de publicación de 2,558 especies que están incluidas en la FBRA, 1,575 de esas especies tienen registros en GenBank. 1,322 fueron de estudios filogenéticos, seguido de código de barras (326) y biogeografía (298). Filogenómica (41), filogeografía (34) y diversidad genética (34), tuvieron menos representación.

Conclusiones:

Datataxa trabajó muy bien extrayendo los metadatos de las secuencias de Genbank. Datataxa puede ser utilizado en cualquier lista de especies para extraer los metadatos de GenBank.

Keywords : API; checklist; entrez; GenBank; plantas vasculares; tratamiento florístico.

        · abstract in English     · text in English     · English ( pdf )