Umbral de error (evolución) - Error threshold (evolution)

En biología evolutiva y genética de poblaciones , el umbral de error (o tasa de mutación crítica ) es un límite en el número de pares de bases que puede tener una molécula autorreplicante antes de que la mutación destruya la información en generaciones posteriores de la molécula. El umbral de error es crucial para comprender la "paradoja de Eigen".

El umbral de error es un concepto en los orígenes de la vida ( abiogénesis ), en particular de la vida muy temprana, antes de la llegada del ADN . Se postula que las primeras moléculas autorreplicantes podrían haber sido pequeñas moléculas de ARN similares a las ribozimas . Estas moléculas constan de cadenas de pares de bases o "dígitos", y su orden es un código que indica cómo interactúa la molécula con su entorno. Toda la replicación está sujeta a errores de mutación. Durante el proceso de replicación, cada dígito tiene una cierta probabilidad de ser reemplazado por algún otro dígito, lo que cambia la forma en que la molécula interactúa con su entorno y puede aumentar o disminuir su aptitud o capacidad de reproducción en ese entorno.

Paisaje de fitness

Manfred Eigen señaló en su artículo de 1971 (Eigen 1971) que este proceso de mutación limita el número de dígitos que puede tener una molécula. Si una molécula excede este tamaño crítico, el efecto de las mutaciones se vuelve abrumador y un proceso de mutación descontrolada destruirá la información en las generaciones posteriores de la molécula. El umbral de error también está controlado por el "panorama de aptitud" de las moléculas. El panorama de la aptitud se caracteriza por los dos conceptos de altura (= aptitud) y distancia (= número de mutaciones). Las moléculas similares están "cercanas" entre sí, y las moléculas que están más en forma que otras y tienen más probabilidades de reproducirse, están "más altas" en el paisaje.

Si una secuencia en particular y sus vecinas tienen una alta adecuación, formarán una cuasiespecie y podrán soportar secuencias más largas que una secuencia de ajuste con pocos vecinos de ajuste, o un vecindario de secuencias menos adecuado. Además, Wilke (Wilke 2005) señaló que el concepto de umbral de error no se aplica en partes del paisaje donde hay mutaciones letales, en las que la mutación inducida produce una aptitud cero y prohíbe la reproducción de la molécula.

La paradoja de Eigen

La paradoja de Eigen es uno de los enigmas más difíciles de resolver en el estudio de los orígenes de la vida. Se cree que el concepto de umbral de error descrito anteriormente limita el tamaño de las moléculas autorreplicantes a quizás unos pocos cientos de dígitos, pero casi toda la vida en la tierra requiere moléculas mucho más largas para codificar su información genética. Este problema se maneja en las células vivas mediante enzimas que reparan mutaciones, permitiendo que las moléculas codificantes alcancen tamaños del orden de millones de pares de bases. Estas grandes moléculas deben, por supuesto, codificar las mismas enzimas que las reparan, y aquí radica la paradoja de Eigen, presentada por primera vez por Manfred Eigen en su artículo de 1971 (Eigen 1971). En pocas palabras, la paradoja de Eigen equivale a lo siguiente:

  • Sin enzimas de corrección de errores, el tamaño máximo de una molécula en replicación es de aproximadamente 100 pares de bases.
  • Para que una molécula de replicación codifique enzimas de corrección de errores, debe ser sustancialmente mayor de 100 bases.

Esta es una paradoja del tipo de la gallina o el huevo , con una solución aún más difícil. ¿Qué fue primero, el genoma grande o las enzimas de corrección de errores? Se han propuesto varias soluciones a esta paradoja:

  • Modelo corrector estocástico (Szathmáry & Maynard Smith, 1995). En esta solución propuesta, una serie de moléculas primitivas de digamos, dos tipos diferentes, están asociadas entre sí de alguna manera, quizás por una cápsula o "pared celular". Si su éxito reproductivo se mejora al tener, digamos, números iguales en cada célula, y la reproducción se produce por división en la que cada uno de los diversos tipos de moléculas se distribuye aleatoriamente entre los "niños", el proceso de selección promoverá tal representación igual en el células, aunque una de las moléculas puede tener una ventaja selectiva sobre la otra.
  • Umbral de error relajado (Kun et al., 2005): los estudios de ribozimas reales indican que la tasa de mutación puede ser sustancialmente menor que la esperada en un principio, del orden de 0,001 por par de bases por replicación. Esto puede permitir longitudes de secuencia del orden de 7-8 mil pares de bases, suficientes para incorporar enzimas de corrección de errores rudimentarias.

Un modelo matemático simple

Considere una molécula de 3 dígitos [A, B, C] donde A, B y C pueden tomar los valores 0 y 1. Hay ocho secuencias de este tipo ([000], [001], [010], [011] , [100], [101], [110] y [111]). Digamos que la molécula [000] es la más adecuada; en cada réplica produce un promedio de copias, donde . Esta molécula se llama "secuencia maestra". Las otras siete secuencias son menos adecuadas; cada uno produce solo 1 copia por repetición. La replicación de cada uno de los tres dígitos se realiza con una tasa de mutación de μ. En otras palabras, en cada repetición de un dígito de una secuencia, existe la probabilidad de que sea erróneo; 0 será reemplazado por 1 o viceversa. Ignoremos las mutaciones dobles y la muerte de las moléculas (la población crecerá infinitamente) y dividamos las ocho moléculas en tres clases dependiendo de su distancia de Hamming a la secuencia maestra:


Distancia de Hamming
Secuencia (s)
0 [000]
1 [001]
[010]
[100]
2 [110]
[101]
[011]
3 [111]

Tenga en cuenta que el número de secuencias para la distancia d es solo el coeficiente binomial para L = 3, y que cada secuencia se puede visualizar como el vértice de un cubo de L = 3 dimensiones, con cada borde del cubo especificando una ruta de mutación en la que el cambiar la distancia de Hamming es cero o ± 1. Puede verse que, por ejemplo, un tercio de las mutaciones de las moléculas [001] producirán [000] moléculas, mientras que los otros dos tercios producirán las moléculas de clase 2 [011] y [101]. Ahora podemos escribir la expresión para las poblaciones de niños de la clase i en términos de las poblaciones de padres .

donde la matriz ' w ' que incorpora selección natural y mutación, según modelo de cuasiespecie , viene dada por:

donde es la probabilidad de que una molécula completa se replique con éxito. Los vectores propios de la matriz w producirán los números de población de equilibrio para cada clase. Por ejemplo, si la tasa de mutación μ es cero, tendremos Q = 1 y las concentraciones de equilibrio serán . La secuencia maestra, siendo el más apto, será el único que sobrevivirá. Si tenemos una fidelidad de replicación de Q = 0.95 y una ventaja genética de a = 1.05, entonces las concentraciones de equilibrio serán aproximadamente . Puede verse que la secuencia maestra no es tan dominante; sin embargo, las secuencias con poca distancia de Hamming son mayoritarias. Si tenemos una fidelidad de replicación de Q cercana a 0, entonces las concentraciones de equilibrio serán aproximadamente . Ésta es una población con el mismo número de cada una de las 8 secuencias. (Si tuviéramos una población perfectamente igual de todas las secuencias, tendríamos poblaciones de [1,3,3,1] / 8).

Si ahora vamos al caso donde el número de pares de bases es grande, digamos L = 100, obtenemos un comportamiento que se asemeja a una transición de fase . La gráfica de abajo a la izquierda muestra una serie de concentraciones de equilibrio divididas por el coeficiente binomial . (Esta multiplicación mostrará la población de una secuencia individual a esa distancia y producirá una línea plana para una distribución igual). La ventaja selectiva de la secuencia maestra se establece en a = 1.05. El eje horizontal es la distancia de Hamming d  . Las diversas curvas corresponden a distintas tasas de mutación totales . Se ve que para valores bajos de la tasa de mutación total, la población consiste en una cuasiespecie reunida en la vecindad de la secuencia maestra. Por encima de una tasa de mutación total de aproximadamente 1-Q = 0,05, la distribución se extiende rápidamente para poblar todas las secuencias por igual. La gráfica de abajo a la derecha muestra la población fraccional de la secuencia maestra en función de la tasa de mutación total. De nuevo, se ve que por debajo de una tasa de mutación crítica de aproximadamente 1-Q = 0.05, la secuencia maestra contiene la mayor parte de la población, mientras que por encima de esta tasa, contiene solo aproximadamente la población total.

Números de población en función de la distancia de Hamming d y la tasa de mutación (1-Q). El eje horizontal d   es la distancia de Hamming de las secuencias moleculares de la secuencia maestra. El eje vertical es el logaritmo de la población para cualquier secuencia a esa distancia dividido por la población total (por lo tanto, la división de n d por el coeficiente binomial). El número total de dígitos por secuencia es L = 100 y la secuencia maestra tiene una ventaja selectiva de a = 1.05.
La población de la secuencia maestra como una fracción de la población total ( n ) en función de la tasa de mutación general (1-Q). El número total de dígitos por secuencia es L = 100 y la secuencia maestra tiene una ventaja selectiva de a = 1.05. Se ve que la "transición de fase" ocurre aproximadamente en 1-Q = 0.05.

Se puede ver que hay una transición brusca en un valor de 1-Q   solo un poco mayor que 0.05. Para tasas de mutación por encima de este valor, la población de la secuencia maestra cae prácticamente a cero. Por encima de este valor, domina.

En el límite, cuando L tiende a infinito, el sistema tiene de hecho una transición de fase a un valor crítico de Q: . Se podría pensar en la tasa de mutación general (1-Q) como una especie de "temperatura", que "derrite" la fidelidad de las secuencias moleculares por encima de la "temperatura" crítica de . Para que se produzca una replicación fiel, la información debe "congelarse" en el genoma.

Ver también

Referencias