Clasificación de Organismos en Reinos utilizando Frecuencia de Codones de ADN

Palabras clave: machine learning, ensambles, frecuencia de codones ADN, reino

Resumen

Este estudio de tiene por objetivo utilizar clasificadores de machine learning para predecir el reino al que pertenece un organismo por la frecuencia de uso de codones de ADN. Para ello se ha tomado 13 028 datos de organismos del GenBank distribuidos en once reinos y se los redujo a seis reinos (arqueas, bacterias, invertebrados, plantas, virus y vertebrados) con 9027 datos reagrupados. El proceso requirió la, depuración de atributos irrelevantes, el empleo de métricas de medición de clasificadores de exactitud, precisión, sensibilidad y puntuación, así como el ajuste de hiperparámetros de los modelos. Los algoritmos de clasificación fueron voting, bagging, boosting y stacking, usando KNN, AD, MLP, SVC y RF. La selección de atributos se hizo con random forest. El ensamble stacking, con sus modelos, predice mejor la clasificación de organismos en el presente estudio.

Descargas

La descarga de datos todavía no está disponible.

Citas

Khomtchouk, B. B. (2020). Codon usage bias levels predict taxonomic identity and genetic composition. BioRxiv. The Preprint Server for Biology. https://doi.org/10.1101/2020.10.26.356295.

Im, E.-H., & Choi, S. S. (2017). Synonymous codon usage controls various molecular aspects. Genomic & Informatics, 15(4), 123-127. https://doi.org/10.5808/GI.2017.15.4.123.

Nakamura, Y, Gojobori, T, & Ikemura, T. (2000). Codon usage tabulated from international DNA sequence databases: status for the year 2000. Nucleic Acids Research, 28(1), 292. https://doi.org/10.1093/nar/28.1.292

Parvathy, S. T., Udayasuriyan, V., & Bhadana, V. (2021). Codon usage bias. Molecular Biology Reports, 49, 539-565. https://doi.org/10.1007/s11033-021-06749-4

Sharp, P. M., Emery, L. R., & Zeng, K. (2010). Forces that influence the evolution of codon bias. Philosophical Transactions of the Royal Society B. Biological Sciences, 365(1544), 1203-1212. https://doi.org/10.1098/rstb.2009.0305

Wang, F.-P., & Li, H. (2009). Codon-pair usage and genome evolution. Gene, 433(1-2), 8-15. https://doi.org/10.1016/j.gene.2008.12.016

Publicado
2022-07-29
Cómo citar
Palma Ttito, L. B. (2022). Clasificación de Organismos en Reinos utilizando Frecuencia de Codones de ADN. Interfases, 15(015), 131-143. https://doi.org/10.26439/interfases2022.n015.5896
Sección
Artículos de investigación