Clasificación de Organismos en Reinos utilizando Frecuencia de Codones de ADN

Autores/as

DOI:

https://doi.org/10.26439/interfases2022.n015.5896

Palabras clave:

machine learning, ensambles, frecuencia de codones ADN, reino

Resumen

Este estudio de tiene por objetivo utilizar clasificadores de machine learning para predecir el reino al que pertenece un organismo por la frecuencia de uso de codones de ADN. Para ello se ha tomado 13 028 datos de organismos del GenBank distribuidos en once reinos y se los redujo a seis reinos (arqueas, bacterias, invertebrados, plantas, virus y vertebrados) con 9027 datos reagrupados. El proceso requirió la, depuración de atributos irrelevantes, el empleo de métricas de medición de clasificadores de exactitud, precisión, sensibilidad y puntuación, así como el ajuste de hiperparámetros de los modelos. Los algoritmos de clasificación fueron voting, bagging, boosting y stacking, usando KNN, AD, MLP, SVC y RF. La selección de atributos se hizo con random forest. El ensamble stacking, con sus modelos, predice mejor la clasificación de organismos en el presente estudio.

Descargas

Los datos de descarga aún no están disponibles.

Referencias

Khomtchouk, B. B. (2020). Codon usage bias levels predict taxonomic identity and genetic composition. BioRxiv. The Preprint Server for Biology. https://doi.org/10.1101/2020.10.26.356295.

Im, E.-H., & Choi, S. S. (2017). Synonymous codon usage controls various molecular aspects. Genomic & Informatics, 15(4), 123-127. https://doi.org/10.5808/GI.2017.15.4.123.

Nakamura, Y, Gojobori, T, & Ikemura, T. (2000). Codon usage tabulated from international DNA sequence databases: status for the year 2000. Nucleic Acids Research, 28(1), 292. https://doi.org/10.1093/nar/28.1.292

Parvathy, S. T., Udayasuriyan, V., & Bhadana, V. (2021). Codon usage bias. Molecular Biology Reports, 49, 539-565. https://doi.org/10.1007/s11033-021-06749-4

Sharp, P. M., Emery, L. R., & Zeng, K. (2010). Forces that influence the evolution of codon bias. Philosophical Transactions of the Royal Society B. Biological Sciences, 365(1544), 1203-1212. https://doi.org/10.1098/rstb.2009.0305

Wang, F.-P., & Li, H. (2009). Codon-pair usage and genome evolution. Gene, 433(1-2), 8-15. https://doi.org/10.1016/j.gene.2008.12.016

Descargas

Publicado

2022-07-29

Número

Sección

Artículos de investigación

Cómo citar

Clasificación de Organismos en Reinos utilizando Frecuencia de Codones de ADN. (2022). Interfases, 15(015), 131-143. https://doi.org/10.26439/interfases2022.n015.5896