Árboles consenso en la clasificación de bancos de germoplasma vegetal.

Osmany Molina Concepción, Marilys Milián Jiménez, Carmen C. Pons Pérez, Ricardo Grau Ábalo

Resumen


Partiendo de que no existe todavía un algoritmo de clasificación por excelencia que logre encontrar una mejor estructura para separar las accesiones y, que en la búsqueda de mejores algoritmos de clasificación aparece una tendencia a la combinación de algoritmos de agrupamiento en el mismo problema, el presente trabajo tiene como objetivo combinar varios algoritmos de agrupamiento en la conformación de conglomerados jerárquicos aglomerativos, en aras de lograr un mejor rendimiento y calidad de los resultados alcanzados por los algoritmos individuales y compensar posibles errores cometidos en el desempeño de cada uno sobre la clasificación del germoplasma en estudio. La investigación se realizó en la colección de malanga (Xanthosoma spp.) que se conserva en el germoplasma del INIVIT. Para combinar los resultados de los diferentes algoritmos de aglomeración se usó la función cl_ensemble y el árbol consenso se obtuvo con la función cl_consensus del paquete “clue”, utilizando los tres métodos disponibles en esta función para calcular los conglomerados consenso en los algoritmos jerárquicos (euclidean, manhattan y majority). El árbol consenso con el método manhattan es el que mejor representa la estructura de la base de datos de malanga en estudio, sin embargo, no muestra estabilidad en diferentes corridas. En los análisis se utilizaron funciones implementadas sobre la base del lenguaje de programación R. Se demostró que la combinación de agrupamientos para lograr un dendrograma consenso es una técnica efectiva en la conformación de estructuras consistentes.

Texto completo:

PDF

Referencias


CUADRAS, C. M. 1981. Métodos de Análisis Multivariante. Eunibar. D.L. XII: 642.

FRANCO, T. L. y HIDALGO R., Eds. 2003. Análisis Estadístico de Datos de Caracterización Morfológica de Recursos Fitogenéticos. Boletín técnico IPGRI. Cali, Colombia, Instituto Internacional de Recursos Fitogenéticos (IPGRI).

GOWER, J.C. 1967. A comparison of some methods of cluster analysis. Biometrics, 23:623-628.

GOWER, J.C. 1971. A general coefficient of similarity and some of its properties. Biometrics, 27:857-871.

HORNIK, K. 2011. clue: Cluster ensembles. R package version 0.3-41. Consultado: 14 de junio de 2016. Disponible en: http://CRAN.R-project.org/package=clue. http://www.r-project.org/.

MILIÁN, M J. (2008). Caracterización de la variabilidad de los cultivares de la colección cubana de germoplasma del género Xanthosoma (Araceae). Tesis para aspirar al grado de Doctor en Ciencias Biológicas, Ciudad de la Habana,123 p.

R DEVELOPMENT CORE TEAM. 2016. R: A language and environment for statistical computing. R Foundation for Statistical Computing. R Foundation for Statistical Computing. Consultado: 17 de diciembre de 2016. Disponible en: http://www.r-project.org/. 17/12/2016.

ROUSSEEUW, P.J. 1986. A visual display for hierarchical classification. Data Analysis and Informatics, 4:743-748.

SORENSEN, T.A. 1948. A method of establishing groups of equal amplitude in plant sociology based on similarity of species content and its application to analysis of vegetation on Danish commons. Biologiske Skrifter, 5:1-34.

SOKAL, R.R. y ROHLF, F.J. 1962. The comparisons of dendrograms by objective methods. Taxon, 11:33-40.

SNEATH, P.H.A. y SOKAL, R.R. 1973. Numerical taxonomy. The principles and practice of numerical classification. W. H. Freeman and Co, San Francisco, California, USA.

VEGA, S.P. y RUIZ, J.S. 2010. A survey of clustering ensemble algorithms, World Scientific Publishing Company.

WARD, J.H. 1963. Hierarchical grouping to optimize an objective function. J Amer Statist Assoc, 58:236-244.


Enlaces refback

  • No hay ningún enlace refback.


Copyright (c) 2017 Agricultura Tropical

Agricultura Tropical (http://ojs.inivit.cu/).  RNPS: 2397, ISSN: 2517-9292 (Versión electrónica). Correo electrónico: revistae@inivit.cu.

Instituto de Investigaciones de Viandas Tropicales (INIVIT). Apdo. 6, Santo Domingo, CP: 53 000, Villa Clara, Cuba.

Teléfono: (53) 42403103, 42403102 Ext. 108. Web: http://www.inivit.cu/