Filogenética molecular - Molecular phylogenetics

Árbol filogenético de la vida de Haeckel

Filogenia Molecular ( / m ə l ɛ k j ʊ l ər ˌ f l ə n ɛ t ɪ k s , m ɒ -, m - / ) es la rama de la filogenia que analiza diferencias moleculares genéticos, hereditarios , predominantemente en secuencias de ADN, para obtener información sobre las relaciones evolutivas de un organismo. A partir de estos análisis, es posible determinar los procesos mediante los cuales se ha logrado la diversidad entre especies. El resultado de un análisis filogenético molecular se expresa en un árbol filogenético . La filogenética molecular es un aspecto de la sistemática molecular , un término más amplio que también incluye el uso de datos moleculares en taxonomía y biogeografía .

La filogenética molecular y la evolución molecular se correlacionan. La evolución molecular es el proceso de cambios selectivos (mutaciones) a nivel molecular (genes, proteínas, etc.) a lo largo de varias ramas del árbol de la vida (evolución). La filogenética molecular hace inferencias de las relaciones evolutivas que surgen debido a la evolución molecular y da como resultado la construcción de un árbol filogenético. La figura que se muestra a la derecha muestra el árbol filogenético de la vida como uno de los primeros árboles detallados, según la información conocida en la década de 1870 por Haeckel.

Historia

Los marcos teóricos de la sistemática molecular se establecieron en la década de 1960 en las obras de Emile Zuckerkandl , Emanuel Margoliash , Linus Pauling y Walter M. Fitch . Las aplicaciones de la sistemática molecular fueron pioneras en Charles G. Sibley ( aves ), Herbert C. Dessauer ( herpetología ) y Morris Goodman ( primates ), seguidos de Allan C. Wilson , Robert K. Selander y John C. Avise (que estudiaron varios grupos). El trabajo con la electroforesis de proteínas comenzó alrededor de 1956. Aunque los resultados no fueron cuantitativos y no mejoraron inicialmente la clasificación morfológica, proporcionaron indicios tentadores de que las nociones de larga data sobre las clasificaciones de las aves , por ejemplo, necesitaban una revisión sustancial. En el período 1974-1986, la hibridación ADN-ADN fue la técnica dominante utilizada para medir la diferencia genética.

Antecedentes teóricos

Los primeros intentos de sistemática molecular también se denominaron quimiotaxonomía y utilizaron proteínas, enzimas , carbohidratos y otras moléculas que se separaron y caracterizaron utilizando técnicas como la cromatografía . Estos han sido reemplazados en los últimos tiempos en gran parte por la secuenciación de ADN , que produce las secuencias exactas de nucleótidos o bases en segmentos de ADN o ARN extraídos utilizando diferentes técnicas. En general, estos se consideran superiores para los estudios evolutivos, ya que las acciones de la evolución se reflejan en última instancia en las secuencias genéticas. En la actualidad, todavía es un proceso largo y costoso secuenciar todo el ADN de un organismo (su genoma ). Sin embargo, es bastante factible determinar la secuencia de un área definida de un cromosoma en particular . Los análisis sistemáticos moleculares típicos requieren la secuenciación de alrededor de 1000 pares de bases . En cualquier lugar dentro de dicha secuencia, las bases que se encuentran en una posición determinada pueden variar entre organismos. La secuencia particular que se encuentra en un organismo dado se conoce como su haplotipo . En principio, dado que hay cuatro tipos de bases, con 1000 pares de bases, podríamos tener 4 1000 haplotipos distintos. Sin embargo, para los organismos dentro de una especie particular o en un grupo de especies relacionadas, se ha encontrado empíricamente que solo una minoría de sitios muestra alguna variación, y la mayoría de las variaciones que se encuentran están correlacionadas, de modo que el número de distintos haplotipos que se encuentran es relativamente pequeño.

En un árbol filogenético, existen numerosas agrupaciones (clados). Un clado puede definirse como un grupo de organismos que tienen un ancestro común a lo largo de la evolución. Esta figura ilustra cómo se puede expresar un clado en un árbol filogenético.

En un análisis sistemático molecular, los haplotipos se determinan para un área definida de material genético ; se utiliza una muestra sustancial de individuos de la especie objetivo u otro taxón ; sin embargo, muchos estudios actuales se basan en individuos individuales. También se determinan los haplotipos de individuos de taxones estrechamente relacionados, aunque diferentes. Finalmente, se determinan los haplotipos de un número menor de individuos de un taxón definitivamente diferente: estos se conocen como un grupo externo . A continuación, se comparan las secuencias de bases de los haplotipos. En el caso más simple, la diferencia entre dos haplotipos se evalúa contando el número de ubicaciones donde tienen diferentes bases: esto se conoce como el número de sustituciones (también pueden ocurrir otros tipos de diferencias entre los haplotipos, por ejemplo, la inserción de una sección de ácido nucleico en un haplotipo que no está presente en otro). La diferencia entre organismos generalmente se reexpresa como un porcentaje de divergencia , dividiendo el número de sustituciones por el número de pares de bases analizados: la esperanza es que esta medida sea independiente de la ubicación y longitud de la sección de ADN que se secuencia. .

Un enfoque más antiguo y reemplazado era determinar las divergencias entre los genotipos de los individuos mediante la hibridación ADN-ADN . La ventaja reivindicada de utilizar la hibridación en lugar de la secuenciación de genes era que se basaba en todo el genotipo, en lugar de en secciones particulares de ADN. Las técnicas modernas de comparación de secuencias superan esta objeción mediante el uso de múltiples secuencias.

Una vez que se han determinado las divergencias entre todos los pares de muestras, la matriz triangular de diferencias resultante se somete a alguna forma de análisis estadístico de conglomerados , y el dendrograma resultante se examina para ver si las muestras se agrupan de la manera que se esperaría de ideas actuales sobre la taxonomía del grupo. Se puede decir que cualquier grupo de haplotipos que sean más similares entre sí que cualquiera de ellos a cualquier otro haplotipo constituye un clado , que puede representarse visualmente como lo demuestra la figura que se muestra a la derecha. Las técnicas estadísticas como bootstrapping y jackknifing ayudan a proporcionar estimaciones de confiabilidad para las posiciones de los haplotipos dentro de los árboles evolutivos.

Técnicas y aplicaciones

Todo organismo vivo contiene ácido desoxirribonucleico ( ADN ), ácido ribonucleico ( ARN ) y proteínas . En general, los organismos estrechamente relacionados tienen un alto grado de similitud en la estructura molecular de estas sustancias, mientras que las moléculas de organismos relacionados lejanamente suelen mostrar un patrón de disimilitud. Se espera que las secuencias conservadas, como el ADN mitocondrial, acumulen mutaciones con el tiempo y, asumiendo una tasa constante de mutación, proporcionen un reloj molecular para la datación de la divergencia. La filogenia molecular utiliza estos datos para construir un "árbol de relaciones" que muestra la probable evolución de varios organismos. Con la invención de la secuenciación de Sanger en 1977, fue posible aislar e identificar estas estructuras moleculares. La secuenciación de alto rendimiento también se puede utilizar para obtener el transcriptoma de un organismo, lo que permite la inferencia de relaciones filogenéticas utilizando datos transcriptómicos .

El enfoque más común es la comparación de secuencias homólogas de genes utilizando técnicas de alineación de secuencias para identificar similitudes. Otra aplicación de la filogenia molecular es el código de barras de ADN , en el que la especie de un organismo individual se identifica utilizando pequeñas secciones de ADN mitocondrial o ADN de cloroplasto . Otra aplicación de las técnicas que lo hacen posible se puede ver en el muy limitado campo de la genética humana, como el uso cada vez más popular de las pruebas genéticas para determinar la paternidad de un niño , así como el surgimiento de una nueva rama de la criminalística. la ciencia forense se centró en la evidencia conocida como huellas dactilares genéticas .

Análisis filogenético molecular

Hay varios métodos disponibles para realizar un análisis filogenético molecular. Un método, que incluye un protocolo completo paso a paso sobre la construcción de un árbol filogenético, que incluye el ensamblaje de secuencias contiguas de ADN / aminoácidos, alineación de secuencias múltiples , prueba de modelo (prueba de los modelos de sustitución que mejor se ajustan) y reconstrucción de la filogenia utilizando la máxima verosimilitud y Inferencia Bayesiana, está disponible en Nature Protocol.

Pevsner ha descrito otra técnica de análisis filogenético molecular que se resumirá en las siguientes frases (Pevsner, 2015). Un análisis filogenético generalmente consta de cinco pasos principales. La primera etapa comprende la adquisición de secuencias. El siguiente paso consiste en realizar un alineamiento de secuencia múltiple, que es la base fundamental para construir un árbol filogenético. La tercera etapa incluye diferentes modelos de sustitución de ADN y aminoácidos. Existen varios modelos de sustitución. Algunos ejemplos incluyen la distancia de Hamming , el modelo de un parámetro de Jukes y Cantor y el modelo de dos parámetros de Kimura (ver Modelos de evolución del ADN ). La cuarta etapa consta de varios métodos de construcción de árboles, incluidos los métodos basados ​​en la distancia y los basados ​​en caracteres. La distancia de Hamming normalizada y las fórmulas de corrección de Jukes-Cantor proporcionan el grado de divergencia y la probabilidad de que un nucleótido cambie a otro, respectivamente. Los métodos comunes de construcción de árboles incluyen el método de grupo de pares no ponderados usando la media aritmética ( UPGMA ) y la unión de vecinos , que son métodos basados ​​en la distancia, la parsimonia máxima , que es un método basado en caracteres, y la estimación de máxima verosimilitud y la inferencia bayesiana , que son caracteres. métodos basados ​​en modelos. UPGMA es un método simple; sin embargo, es menos preciso que el método de unión de vecinos. Finalmente, el último paso consiste en evaluar los árboles. Esta evaluación de precisión se compone de consistencia, eficiencia y solidez.

Cinco etapas del análisis filogenético molecular

MEGA (análisis de genética evolutiva molecular) es un software de análisis fácil de usar y de descarga y uso gratuito. Este software es capaz de analizar metodologías de árbol basadas tanto en la distancia como en los caracteres. MEGA también contiene varias opciones que uno puede optar por utilizar, como enfoques heurísticos y bootstrapping. Bootstrapping es un enfoque que se usa comúnmente para medir la robustez de la topología en un árbol filogenético, que demuestra el porcentaje que cada clado es compatible después de numerosas repeticiones. En general, un valor superior al 70% se considera significativo. El diagrama de flujo que se muestra a la derecha demuestra visualmente el orden de las cinco etapas de la técnica de análisis filogenético molecular de Pevsner que se han descrito.

Limitaciones

La sistemática molecular es un enfoque esencialmente cladístico : supone que la clasificación debe corresponder a la ascendencia filogenética y que todos los taxones válidos deben ser monofiléticos . Esta es una limitación cuando se intenta determinar el árbol o árboles óptimos, lo que a menudo implica bisecar y reconectar porciones del árbol o árboles filogenéticos.

El reciente descubrimiento de una extensa transferencia horizontal de genes entre organismos proporciona una complicación significativa a la sistemática molecular, lo que indica que diferentes genes dentro del mismo organismo pueden tener diferentes filogenias.

Además, las filogenias moleculares son sensibles a los supuestos y modelos que intervienen en su elaboración. En primer lugar, las secuencias deben estar alineadas; luego, se deben abordar cuestiones como la atracción de ramas largas , la saturación y los problemas de muestreo de taxones . Esto significa que se pueden obtener resultados sorprendentemente diferentes aplicando diferentes modelos al mismo conjunto de datos.

Además, como se mencionó anteriormente, UPGMA es un enfoque simple en el que el árbol siempre está enraizado. El algoritmo asume un reloj molecular constante para las secuencias del árbol. Esto está asociado con ser una limitación en el sentido de que si existen tasas de sustitución desiguales, el resultado puede ser un árbol incorrecto.

Ver también

notas y referencias

Otras lecturas

enlaces externos