Título: Aplicaciones de data mining al estudio de la biodiversidad
Autores: Santa María, Cristóbal
Soria, Marcelo
Fecha: 2012-08-23
2011-05
2011
Publicador: Unversidad Nacional de La Plata
Fuente:

Tipo: Objeto de conferencia
Objeto de conferencia
Tema: cluster
riqueza
diversidad
rarefacción
simulación
cobertura
Data mining
Ciencias Informáticas
base de datos
Descripción: El trabajo propone la utilización conjunta de técnicas de data mining y simulación para evaluar la riqueza y diversidad de comunidades microbianas. Se parte de una muestra formada por distintas secuencias de ADN que se alinean para luego ser agrupadas según su similaridad en clusters. Cada uno de estos clusters es una especie y el propósito es estimar su número y distribución en la comunidad basándose en la información que da la muestra. La técnica de rarefacción, sustentada en el procedimiento bootstrap, permite construir una curva cuya tendencia asintótica es precisamente la riqueza de la comunidad. Para alcanzar tal asíntota, y a la vez para estimar la distribución estadística de las especies, se propone una simulación que utiliza la estimación de Turing sobre la probabilidad de nueva especie al seleccionar un individuo nuevo y la idea de cobertura para la porción de la distribución que cubre la muestra.
Eje: Bases de datos y minería de datos
Idioma: Español