Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos
Tesis (Maestría en Estadística Aplicada) -- Universidad Nacional de Córdoba. Facultad de Ciencias Económicas. Escuela de Graduados ; Argentina, 2021.
Main Author: | |
---|---|
Other Authors: | |
Format: | masterThesis |
Language: | spa |
Published: |
2021
|
Subjects: | |
Online Access: | http://hdl.handle.net/11086/20184 |
_version_ | 1801212239387033600 |
---|---|
author | Videla, María Eugenia |
author2 | Bruno, Cecilia Inés |
author_facet | Bruno, Cecilia Inés Videla, María Eugenia |
author_sort | Videla, María Eugenia |
collection | Repositorio Digital Universitario |
description | Tesis (Maestría en Estadística Aplicada) -- Universidad Nacional de Córdoba. Facultad de Ciencias Económicas. Escuela de Graduados ; Argentina, 2021. |
format | masterThesis |
id | rdu-unc.20184 |
institution | Universidad Nacional de Cordoba |
language | spa |
publishDate | 2021 |
record_format | dspace |
spelling | rdu-unc.201842022-06-30T12:48:53Z Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos Videla, María Eugenia Bruno, Cecilia Inés Genómica estadística Algoritmos Marcadores moleculares Análisis multivariado Ordenamiento Clasificación Indices de validación de agrupamientos SNPs Tesis (Maestría en Estadística Aplicada) -- Universidad Nacional de Córdoba. Facultad de Ciencias Económicas. Escuela de Graduados ; Argentina, 2021. Fil: Videla, María Eugenia. Universidad Nacional de Córdoba. Facultad de Ciencias Económicas; Argentina. La disponibilidad de herramientas basadas en biotecnologías para evaluar miles de variantes genómicas simultáneamente ha revolucionado el paradigma en los estudios de diversidad genética. La información provista por los marcadores moleculares (MM) proporciona datos de naturaleza multivariada que pueden ser utilizados para identificar similitudes/diferencias genéticas entre individuos. Dado un conjunto de individuos caracterizados molecularmente, se espera que aquellos que presentan mayor similitud en su perfil genético, se encuentren relacionados, en algún grado de parentesco y por lo tanto, puedan agruparse definiendo poblaciones o grupos genéticos. Una plétora de métodos multivariados, para identificar grupos de individuos, ha sido propuesta para abordar la clasificación en un volumen masivo de MM, entre ellos, el análisis de conglomerados. A pesar de la existencia de diferentes algoritmos de clasificación, la cantidad de grupos sugeridos puede ser difusa. Dado a que los algoritmos definen grupos que no son conocidos a priori, independientemente del método de agrupamiento, la partición final de los datos requiere alguna clase de evaluación para encontrar el número óptimo de grupos que resulta ser la mejor partición natural de los datos. El objetivo del presente trabajo de tesis es evaluar el desempeño de distintos métodos de agrupamiento e índices de validación del número de grupo para detectar las correlaciones genéticas existentes entre individuos bajo distintos escenarios de estructura genética poblacional. Este trabajo de tesis ha sido organizado con una introducción general en el contexto de la descripción de los datos genómicos y el concepto de estructuración de lo mismos en el Capítulo 1. En el Capítulo 2 se compara el comportamiento de tres métodos de agrupamiento provenientes de diferentes familias de algoritmos a través de un estudio de simulación. En el Capítulo 3 la identificación del número óptimo de grupos generados por algoritmos de agrupamientos fue evaluada a través de la comparación de cuatro índices de validación. Finalmente, se ilustran, en el Capítulo 4, los métodos comparados sobre dos conjuntos de datos de maíz generados a partir de ensayos en el marco de programas de mejoramiento genético vegetal. Finalmente, hemos dispuesto en un Anexo los códigos de programación en R. Fil: Videla, María Eugenia. Universidad Nacional de Córdoba. Facultad de Ciencias Económicas; Argentina. 2021-09-07T13:55:44Z 2021-09-07T13:55:44Z 2021 masterThesis http://hdl.handle.net/11086/20184 spa Atribución-NoComercial 4.0 Internacional http://creativecommons.org/licenses/by-nc/4.0/ |
spellingShingle | Genómica estadística Algoritmos Marcadores moleculares Análisis multivariado Ordenamiento Clasificación Indices de validación de agrupamientos SNPs Videla, María Eugenia Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos |
title | Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos |
title_full | Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos |
title_fullStr | Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos |
title_full_unstemmed | Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos |
title_short | Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos |
title_sort | evaluacion de algoritmos de agrupamientos para inferir estructura genetica poblacional en datos genomicos |
topic | Genómica estadística Algoritmos Marcadores moleculares Análisis multivariado Ordenamiento Clasificación Indices de validación de agrupamientos SNPs |
url | http://hdl.handle.net/11086/20184 |
work_keys_str_mv | AT videlamariaeugenia evaluaciondealgoritmosdeagrupamientosparainferirestructurageneticapoblacionalendatosgenomicos |