Clasificación de Organismos en Reinos utilizando Frecuencia de Codones de ADN

Autores

DOI:

https://doi.org/10.26439/interfases2022.n015.5896

Palavras-chave:

machine learning, ensambles, frecuencia de codones ADN, reino

Resumo

Este estudio de tiene por objetivo utilizar clasificadores de machine learning para predecir el reino al que pertenece un organismo por la frecuencia de uso de codones de ADN. Para ello se ha tomado 13 028 datos de organismos del GenBank distribuidos en once reinos y se los redujo a seis reinos (arqueas, bacterias, invertebrados, plantas, virus y vertebrados) con 9027 datos reagrupados. El proceso requirió la, depuración de atributos irrelevantes, el empleo de métricas de medición de clasificadores de exactitud, precisión, sensibilidad y puntuación, así como el ajuste de hiperparámetros de los modelos. Los algoritmos de clasificación fueron voting, bagging, boosting y stacking, usando KNN, AD, MLP, SVC y RF. La selección de atributos se hizo con random forest. El ensamble stacking, con sus modelos, predice mejor la clasificación de organismos en el presente estudio.

Downloads

Os dados de download ainda não estão disponíveis.

Referências

Khomtchouk, B. B. (2020). Codon usage bias levels predict taxonomic identity and genetic composition. BioRxiv. The Preprint Server for Biology. https://doi.org/10.1101/2020.10.26.356295.

Im, E.-H., & Choi, S. S. (2017). Synonymous codon usage controls various molecular aspects. Genomic & Informatics, 15(4), 123-127. https://doi.org/10.5808/GI.2017.15.4.123.

Nakamura, Y, Gojobori, T, & Ikemura, T. (2000). Codon usage tabulated from international DNA sequence databases: status for the year 2000. Nucleic Acids Research, 28(1), 292. https://doi.org/10.1093/nar/28.1.292

Parvathy, S. T., Udayasuriyan, V., & Bhadana, V. (2021). Codon usage bias. Molecular Biology Reports, 49, 539-565. https://doi.org/10.1007/s11033-021-06749-4

Sharp, P. M., Emery, L. R., & Zeng, K. (2010). Forces that influence the evolution of codon bias. Philosophical Transactions of the Royal Society B. Biological Sciences, 365(1544), 1203-1212. https://doi.org/10.1098/rstb.2009.0305

Wang, F.-P., & Li, H. (2009). Codon-pair usage and genome evolution. Gene, 433(1-2), 8-15. https://doi.org/10.1016/j.gene.2008.12.016

Publicado

2022-07-29

Edição

Seção

Artículos de investigación

Como Citar

Clasificación de Organismos en Reinos utilizando Frecuencia de Codones de ADN. (2022). Interfases, 15(015), 131-143. https://doi.org/10.26439/interfases2022.n015.5896