Secuencia de consenso - Consensus sequence

En biología molecular y bioinformática , la secuencia de consenso (o secuencia canónica ) es el orden calculado de los residuos más frecuentes, ya sean nucleótidos o aminoácidos , que se encuentran en cada posición de una secuencia de alineación . Representa los resultados de múltiples alineamientos de secuencia en los que las secuencias relacionadas se comparan entre sí y se calculan motivos de secuencia similares . Esta información es importante cuando se consideran enzimas dependientes de secuencia como la ARN polimerasa .

Importancia biológica

Un sitio de unión a proteínas, representado por una secuencia consenso, puede ser una secuencia corta de nucleótidos que se encuentra varias veces en el genoma y se cree que desempeña el mismo papel en sus diferentes ubicaciones. Por ejemplo, muchos factores de transcripción reconocen patrones particulares en los promotores de los genes que regulan. De la misma manera, las enzimas de restricción suelen tener secuencias consenso palindrómicas , que suelen corresponder al sitio donde cortan el ADN. Los transposones actúan de la misma manera en su identificación de secuencias diana para la transposición. Por último, los sitios de corte y empalme (secuencias que rodean inmediatamente los límites exón - intrón ) también pueden considerarse como secuencias consenso.

Por tanto, una secuencia consenso es un modelo para un sitio de unión de ADN putativo : se obtiene alineando todos los ejemplos conocidos de un determinado sitio de reconocimiento y se define como la secuencia idealizada que representa la base predominante en cada posición. Todos los ejemplos reales no deberían diferir del consenso en más de unas pocas sustituciones, pero contar los desajustes de esta manera puede generar inconsistencias.

Cualquier mutación que permita que un nucleótido mutado en la secuencia promotora central se parezca más a la secuencia consenso se conoce como mutación ascendente . Este tipo de mutación generalmente hará que el promotor sea más fuerte y, por lo tanto, la ARN polimerasa forma un enlace más fuerte con el ADN que desea transcribir y la transcripción se regula al alza. Por el contrario, las mutaciones que destruyen los nucleótidos conservados en la secuencia de consenso se conocen como mutaciones descendentes . Estos tipos de mutaciones regulan negativamente la transcripción, ya que la ARN polimerasa ya no puede unirse con tanta fuerza a la secuencia promotora central.

Análisis de secuencia

El desarrollo de software para el reconocimiento de patrones es un tema importante en genética , biología molecular y bioinformática . Los motivos de secuencia específicos pueden funcionar como secuencias reguladoras que controlan la biosíntesis, o como secuencias señal que dirigen una molécula a un sitio específico dentro de la célula o regulan su maduración. Dado que la función reguladora de estas secuencias es importante, se cree que se conservan durante largos períodos de evolución . En algunos casos, la relación evolutiva se puede estimar por la cantidad de conservación de estos sitios.

Notación

Los motivos de la secuencia conservada se denominan secuencias consenso y muestran qué residuos se conservan y cuáles son variables. Considere la siguiente secuencia de ADN de ejemplo :

A [CT] N {A} AÑO

En esta notación , A significa que una A siempre se encuentra en esa posición; [CT] significa C o T; N significa cualquier base; y {A} significa cualquier base excepto A. Y representa cualquier pirimidina y R indica cualquier purina .

En este ejemplo, la notación [CT] no da ninguna indicación de la frecuencia relativa de C o T que ocurren en esa posición. Un método alternativo de representar una secuencia de consenso utiliza un logotipo de secuencia . Ésta es una representación gráfica de la secuencia de consenso, en la que el tamaño de un símbolo está relacionado con la frecuencia con la que un nucleótido (o aminoácido) determinado aparece en una posición determinada. En los logotipos de secuencia, cuanto más conservado es el residuo, más grande se dibuja el símbolo de ese residuo; cuanto menos frecuente, más pequeño es el símbolo. Los logotipos de secuencia se pueden generar usando WebLogo o usando Gestalt Workbench , una herramienta de visualización disponible públicamente escrita por Gustavo Glusman en el Instituto de Biología de Sistemas .

Software

Las herramientas bioinformáticas son capaces de calcular y visualizar secuencias de consenso. Ejemplos de herramientas son JalView y UGENE .

Ver también

Referencias