Genómica de poblaciones - Population genomics

La genómica de poblaciones es la comparación a gran escala de secuencias de ADN de poblaciones. La genómica de poblaciones es un neologismo asociado con la genética de poblaciones . La genómica de poblaciones estudia los efectos de todo el genoma para mejorar nuestra comprensión de la microevolución, de modo que podamos conocer la historia filogenética y la demografía de una población.

Historia

La genómica de poblaciones ha sido de interés para los científicos desde Darwin. Algunos de los primeros métodos utilizados para estudiar la variabilidad genética en múltiples loci incluyeron electroforesis en gel y mapeo de enzimas de restricción. Anteriormente, la genómica se limitaba únicamente al estudio de una pequeña cantidad de loci . Sin embargo, los avances recientes en la secuenciación y el almacenamiento y la energía de las computadoras han permitido el estudio de cientos de miles de loci de poblaciones. El análisis de estos datos requiere la identificación de loci no neutros o atípicos que indican selección en esa región del genoma. Esto permitirá al investigador eliminar estos loci para estudiar los efectos de todo el genoma o centrarse en estos loci si son de interés.

Aplicaciones de investigación

En el estudio de S. pombe (más comúnmente conocida como levadura de fisión), un organismo modelo popular, se ha utilizado la genómica de poblaciones para comprender la razón de la variación fenotípica dentro de una especie. Sin embargo, dado que anteriormente la variación genética dentro de esta especie no se entendía bien debido a restricciones tecnológicas, la genómica de poblaciones nos permite conocer las diferencias genéticas de las especies. En la población humana, la genómica de poblaciones se ha utilizado para estudiar el cambio genético desde que los humanos comenzaron a migrar fuera de África hace aproximadamente 50.000-100.000 años. Se ha demostrado que no solo se seleccionaron en gran medida los genes relacionados con la fertilidad y la reproducción, sino también que cuanto más se alejaban los seres humanos de África, mayor era la presencia de lactasa.

Un estudio de 2007 realizado por Begun et al. compararon la secuencia completa del genoma de múltiples líneas de Drosophila simulans con el ensamblaje de D. melanogaster y D. yakuba . Esto se hizo alineando el ADN de las secuencias de escopeta del genoma completo de D. simulans con una secuencia de referencia estándar antes de llevar a cabo el análisis del genoma completo del polimorfismo y la divergencia. Esto reveló una gran cantidad de proteínas que habían experimentado una selección direccional . Descubrieron fluctuaciones a gran escala previamente desconocidas tanto en el polimorfismo como en la divergencia a lo largo de los brazos cromosómicos. Descubrieron que el cromosoma X tenía una divergencia más rápida y significativamente menos polimorfismo de lo esperado anteriormente. También encontraron regiones del genoma (por ejemplo, UTR ) que indicaban evolución adaptativa.

En 2014 Jacquot et al. estudió la diversificación y epidemiología de patógenos bacterianos endémicos utilizando el complejo de especies de Borrelia burgdorferi (la bacteria responsable de la enfermedad de Lyme) como modelo. También deseaban comparar la estructura genética entre B. burgdorferi y las especies estrechamente relacionadas B. garinii y B. afzelii . Comenzaron secuenciando muestras de un cultivo y luego mapeando la lectura sin procesar en secuencias de referencia. Se utilizaron análisis filogenéticos y basados ​​en SNP tanto en niveles intraespecíficos como interespecíficos. Al observar el grado de aislamiento genético, encontraron que la tasa de recombinación intraespecífica era ~ 50 veces mayor que la tasa interespecífica. También encontraron que al usar la mayoría de las cepas conespecíficas del genoma no se agrupaban en clados, lo que genera dudas sobre las estrategias anteriores utilizadas al investigar la epidemiología de patógenos.

Moore et al.realizaron un estudio en 2014 en el que un grupo de poblaciones de salmón del Atlántico que se analizaron previamente con análisis genéticos de poblaciones tradicionales ( microsatélites , genotipado de matrices SNP , BayeScan (que usa la distribución de Dirichlet-multinomial )) para ubicarlas en áreas de conservación definidas unidades . Esta evaluación genómica estuvo de acuerdo en su mayoría con resultados previos, pero identificó más diferencias entre grupos regionales y genéticamente discretos, lo que sugiere que potencialmente había un número aún mayor de unidades de conservación de salmón en esas regiones. Estos resultados verificaron la utilidad del análisis de todo el genoma para mejorar la precisión de la designación futura de unidades de conservación.

En las especies marinas altamente migratorias , los análisis genéticos de poblaciones tradicionales a menudo no logran identificar la estructura de la población. En los túnidos, los marcadores tradicionales como los productos de PCR de corto alcance, los microsatélites y las matrices SNP han tenido problemas para distinguir las poblaciones de peces de las cuencas oceánicas separadas. Sin embargo, la investigación genómica de poblaciones utilizando secuenciación RAD en atún aleta amarilla y atún blanco ha podido distinguir poblaciones de diferentes cuencas oceánicas y revelar la estructura de la población a escala fina. Estos estudios identifican loci supuestamente adaptativos que revelan una fuerte estructura de población, aunque estos sitios representan una proporción relativamente pequeña de los datos generales de la secuencia de ADN. Por el contrario, la mayoría de los loci secuenciados que se presume que son selectivamente neutrales no revelan patrones de diferenciación de poblaciones, resultados que coinciden con los marcadores de ADN tradicionales. El mismo patrón de loci supuestamente adaptativos y secuenciación RAD que revela la estructura de la población, en comparación con la información limitada proporcionada por los marcadores de ADN tradicionales, también se observa para otros peces marinos, incluidos el marlín rayado y el cocodrilo .

Modelos matemáticos

Comprender y analizar la gran cantidad de datos que provienen de los estudios de genómica de poblaciones requiere varios modelos matemáticos. Un método para analizar esta gran cantidad de datos es a través del mapeo QTL . El mapeo de QTL se ha utilizado para ayudar a encontrar los genes responsables de los fenotipos adaptativos. Para cuantificar la diversidad genética dentro de una población se utiliza un valor conocido como índice de fijación o F ST . Cuando se utiliza con la D de Tajima , F ST se ha utilizado para mostrar cómo actúa la selección sobre una población. La prueba de McDonald-Kreitman (o prueba de MK) también se ve favorecida cuando se busca la selección porque no es tan sensible a los cambios en la demografía de una especie que desviarían otras pruebas de selección.

Futuros desarrollos

La mayoría de los desarrollos dentro de la genómica de poblaciones tienen que ver con aumentos en la tecnología de secuenciación. Por ejemplo, la secuenciación de ADN asociada a un sitio de restricción, o RADSeq, es una tecnología relativamente nueva que secuencia con menor complejidad y ofrece mayor resolución a un costo razonable. Las tecnologías de secuenciación de alto rendimiento también son un campo en rápido crecimiento que permite recopilar más información sobre la divergencia genómica durante la especiación. La secuenciación de alto rendimiento también es muy útil para la detección de SNP, que juega un papel clave en la medicina personalizada. Otro enfoque relativamente nuevo es la secuenciación de la biblioteca de representación reducida (RRL) que descubre y genotipa los SNP y tampoco requiere genomas de referencia.

Ver también

Notas

enlaces externos

Referencias