Empalme de ARN - RNA splicing

El empalme de ARN es un proceso en biología molecular en el que una transcripción de ARN mensajero precursor (pre ARNm ) recién creada se transforma en un ARN mensajero maduro ( ARNm ). Funciona eliminando intrones (regiones no codificantes de ARN) y uniendo así exones (regiones codificantes). En el caso de los genes con codificación nuclear , el empalme se produce en el núcleo durante o inmediatamente después de la transcripción . En el caso de los genes eucariotas que contienen intrones, normalmente se necesita un empalme para crear una molécula de ARNm que pueda traducirse en proteína . Para muchos intrones eucariotas, el empalme se produce en una serie de reacciones que son catalizadas por el espliceosoma , un complejo de pequeñas ribonucleoproteínas nucleares ( snRNP ). Existen intrones auto-empalmados , es decir, ribozimas que pueden catalizar su propia escisión de su molécula de ARN parental.

Proceso de empalme de ARN

Vías de empalme

Varios métodos de empalme de ARN ocurren en la naturaleza; el tipo de empalme depende de la estructura del intrón empalmado y de los catalizadores necesarios para que se produzca el empalme.

Complejo spliceosomal

Intrones

La palabra intrón se deriva de los términos región intragénica e intracistrón , es decir, un segmento de ADN que se encuentra entre dos exones de un gen . El término intrón se refiere tanto a la secuencia de ADN dentro de un gen como a la secuencia correspondiente en la transcripción de ARN sin procesar. Como parte de la vía de procesamiento del ARN, los intrones se eliminan mediante el empalme del ARN poco después o al mismo tiempo que la transcripción . Los intrones se encuentran en los genes de la mayoría de los organismos y muchos virus. Pueden ubicarse en una amplia gama de genes, incluidos los que generan proteínas , ARN ribosómico (ARNr) y ARN de transferencia (ARNt).

Dentro de los intrones, se requieren un sitio donante (extremo 5 'del intrón), un sitio de ramificación (cerca del extremo 3' del intrón) y un sitio aceptor (extremo 3 'del intrón) para el empalme. El sitio donante de corte y empalme incluye una secuencia GU casi invariante en el extremo 5 'del intrón, dentro de una región más grande y menos altamente conservada. El sitio aceptor de empalme en el extremo 3 'del intrón termina el intrón con una secuencia AG casi invariante. Aguas arriba (5 ') del AG hay una región con alto contenido de pirimidinas (C y U), o tracto de polipirimidina . Más arriba del tracto de polipirimidina se encuentra el punto de ramificación, que incluye un nucleótido de adenina involucrado en la formación de lariat. La secuencia de consenso para un intrón (en notación de ácido nucleico IUPAC ) es: GG- [corte] -GURAGU (sitio donante) ... secuencia del intrón ... YURAC (secuencia de ramificación 20-50 nucleótidos cadena arriba del sitio aceptor) ... Y-rico-NCAG- [corte] -G (sitio aceptor). Sin embargo, se observa que la secuencia específica de elementos de corte y empalme intrónicos y el número de nucleótidos entre el punto de ramificación y el sitio aceptor 3 'más cercano afectan la selección del sitio de corte y empalme. Además, las mutaciones puntuales en el ADN subyacente o los errores durante la transcripción pueden activar un sitio de empalme críptico en parte de la transcripción que generalmente no se empalma. Esto da como resultado un ARN mensajero maduro al que le falta una sección de un exón. De esta manera, una mutación puntual , que de otro modo podría afectar solo a un único aminoácido, puede manifestarse como una deleción o truncamiento en la proteína final.

Ilustración simple de exones e intrones en pre-ARNm

Formación y actividad

El empalme es catalizado por el espliceosoma , un gran complejo de ARN-proteína compuesto por cinco pequeñas ribonucleoproteínas nucleares ( snRNP ). El ensamblaje y la actividad del espliceosoma se producen durante la transcripción del pre-ARNm. Los componentes de ARN de los snRNP interactúan con el intrón y participan en la catálisis. Se han identificado dos tipos de espliceosomas (mayor y menor) que contienen diferentes snRNP .

  • Los principales empalmes de espliceosomas son intrones que contienen GU en el sitio de empalme 5 'y AG en el sitio de empalme 3'. Se compone de los U1 , U2 , U4 , U5 y U6 snRNPs y es activo en el núcleo. Además, se requieren varias proteínas, incluido el factor auxiliar 1 de ARN nuclear pequeño U2 (U2AF35), U2AF2 (U2AF65) y SF1 para el ensamblaje del espliceosoma. El espliceosoma forma diferentes complejos durante el proceso de empalme:
  • Complejo E
    • El snRNP de U1 se une a la secuencia GU en el sitio de corte y empalme 5 'de un intrón;
    • El factor de empalme 1 se une a la secuencia de puntos de ramificación del intrón;
    • U2AF1 se une al sitio de corte y empalme 3 'del intrón;
    • U2AF2 se une al tracto de polipirimidina;
  • Complejo A (pre-spliceosome)
    • El U2 snRNP desplaza SF1 y se une a la secuencia de puntos de ramificación y el ATP se hidroliza;
  • Complejo B (espliceosoma precatalítico)
    • El trímero snRNP de U5 / U4 / U6 se une y el snRNP de U5 se une a los exones en el sitio 5 ', con la unión de U6 a U2;
  • Complejo B *
    • El snRNP de U1 se libera, el U5 se desplaza del exón al intrón y el U6 se une en el sitio de empalme 5 ';
  • Complejo C (espliceosoma catalítico)
    • Se libera U4, U6 / U2 cataliza la transesterificación, haciendo que el extremo 5 'del intrón se ligue al intrón A y forme un lazo, U5 se une al exón en el sitio de empalme 3' y el sitio 5 'se escinde, lo que da como resultado el formación del lazo;
  • Complejo C * (complejo post-espliceosomal)
    • U2 / U5 / U6 permanecen unidos al lazo, y el sitio 3 'se escinde y los exones se ligan usando hidrólisis de ATP. El ARN empalmado se libera, el lazo se libera y se degrada, y los snRNP se reciclan.
Este tipo de empalme se denomina empalme canónico o vía lariat , que representa más del 99% del empalme. Por el contrario, cuando las secuencias flanqueantes intrónicas no siguen la regla GU-AG, se dice que se produce un corte y empalme no canónico (ver "espliceosoma menor" más adelante).
  • El espliceosoma menor es muy similar al espliceosoma principal, pero en su lugar, empalma intrones raros con diferentes secuencias de sitios de empalme. Mientras que los espliceosomas menores y mayores contienen el mismo snRNP de U5 , el espliceosoma menor tiene snRNPs diferentes pero funcionalmente análogos para U1, U2, U4 y U6, que se denominan respectivamente U11 , U12 , U4atac y U6atac .

Empalme recursivo

En la mayoría de los casos, el empalme elimina los intrones como unidades individuales de las transcripciones de ARNm precursoras . Sin embargo, en algunos casos, especialmente en ARNm con intrones muy largos, el empalme ocurre en pasos, con parte de un intrón eliminado y luego el intrón restante se empalma en un paso siguiente. Esto se ha encontrado primero en el gen Ultrabithorax ( Ubx ) de la mosca de la fruta, Drosophila melanogaster , y algunos otros genes de Drosophila , pero también se han informado casos en humanos.

Trans-empalme

El empalme trans es una forma de empalme que elimina intrones u outrones y une dos exones que no están dentro de la misma transcripción de ARN.

Auto-empalme

El auto-empalme se produce para intrones raros que forman una ribozima , que realiza las funciones del espliceosoma solo mediante ARN. Hay tres tipos de intrones auto-empalmados, Grupo I , Grupo II y Grupo III . Los intrones de los grupos I y II realizan un corte y empalme similar al espliceosoma sin requerir ninguna proteína. Esta similitud sugiere que los intrones de los grupos I y II pueden estar relacionados evolutivamente con el espliceosoma. El auto-empalme también puede ser muy antiguo y puede haber existido en un mundo de ARN presente antes de la proteína.

Dos transesterificaciones caracterizan el mecanismo en el que se empalman los intrones del grupo I:

  1. 3'OH de un nucleósido de guanina libre (o uno ubicado en el intrón) o un cofactor de nucleótido (GMP, GDP, GTP) ataca al fosfato en el sitio de empalme 5 '.
  2. 3'OH del exón 5 'se convierte en un nucleófilo y la segunda transesterificación da como resultado la unión de los dos exones.

El mecanismo en el que se empalman los intrones del grupo II (dos reacciones de transesterificación como los intrones del grupo I) es el siguiente:

  1. El 2'OH de una adenosina específica en el intrón ataca el sitio de empalme 5 ', formando así el lazo
  2. El 3'OH del exón 5 'desencadena la segunda transesterificación en el sitio de empalme 3', uniendo así los exones.

empalme de ARNt

El empalme de ARNt (también similar al ARNt) es otra forma rara de empalme que generalmente ocurre en el ARNt. La reacción de empalme implica una bioquímica diferente a la de las vías espliceosomal y autoempalme.

En la levadura Saccharomyces cerevisiae , un heterotetrámero de endonucleasa de empalme de ARNt de levadura , compuesto de TSEN54 , TSEN2 , TSEN34 y TSEN15 , escinde el pre-ARNt en dos sitios del bucle aceptor para formar un ARNt medio 5 ', que termina en un 2', 3'-grupo fosfodiéster cíclico y una mitad de ARNt 3 ', que terminan en un grupo 5'-hidroxilo, junto con un intrón descartado. A continuación, la cinasa de ARNt de levadura fosforila el grupo 5'-hidroxilo usando trifosfato de adenosina . La fosfodiesterasa cíclica de ARNt de levadura escinde el grupo fosfodiéster cíclico para formar un extremo 3 'fosforilado en 2'. La ligasa de ARNt de levadura agrega un grupo de monofosfato de adenosina al extremo 5 'de la mitad 3' y une las dos mitades. La 2'-fosfotransferasa dependiente de NAD luego elimina el grupo 2'-fosfato.

Evolución

El empalme ocurre en todos los reinos o dominios de la vida, sin embargo, la extensión y los tipos de empalme pueden ser muy diferentes entre las principales divisiones. Los eucariotas empalman muchos ARN mensajeros que codifican proteínas y algunos ARN no codificantes . Los procariotas , por otro lado, se empalman raramente y en su mayoría ARN no codificantes. Otra diferencia importante entre estos dos grupos de organismos es que los procariotas carecen por completo de la vía espliceosomal.

Debido a que los intrones espliceosomales no se conservan en todas las especies, existe un debate sobre cuándo evolucionó el corte y empalme espliceosomal. Se han propuesto dos modelos: el intrón tardío y el intrón temprano (ver evolución del intrón ).

Empalme de la diversidad
Eucariotas Procariotas
Splicosomal + -
Auto-empalme + +
ARNt + +

Mecanismo bioquímico

Diagrama que ilustra la bioquímica de dos pasos del empalme

El empalme empalmado y el autoempalme empalmados implican un proceso bioquímico de dos pasos. Ambos pasos involucran reacciones de transesterificación que ocurren entre nucleótidos de ARN. El empalme de tRNA, sin embargo, es una excepción y no ocurre por transesterificación.

Las reacciones de transesterificación empalmadas y empalmadas se producen a través de dos reacciones de transesterificación secuenciales. En primer lugar, el 2'OH de un nucleótido de punto de ramificación específico dentro del intrón, definido durante el ensamblaje del espliceosoma, realiza un ataque nucleófilo sobre el primer nucleótido del intrón en el sitio de empalme 5 ', formando el lazo intermedio . En segundo lugar, el 3'OH del exón 5 'liberado realiza un ataque nucleófilo en el primer nucleótido que sigue al último nucleótido del intrón en el sitio de empalme 3', uniendo así los exones y liberando el intrón lariat.

Splicing alternativo

En muchos casos, el proceso de empalme puede crear una variedad de proteínas únicas variando la composición del exón del mismo ARNm. Este fenómeno se denomina empalme alternativo . El empalme alternativo puede ocurrir de muchas formas. Los exones se pueden extender u omitir, o se pueden retener intrones. Se estima que el 95% de las transcripciones de genes multiexon experimentan un corte y empalme alternativo, algunos casos de los cuales ocurren de una manera específica de tejido y / o bajo condiciones celulares específicas. El desarrollo de tecnología de secuenciación de ARNm de alto rendimiento puede ayudar a cuantificar los niveles de expresión de isoformas empalmadas alternativamente. Los niveles de expresión diferencial entre tejidos y linajes celulares permitieron desarrollar enfoques computacionales para predecir las funciones de estas isoformas. Dada esta complejidad, el corte y empalme alternativo de las transcripciones de pre-ARNm está regulado por un sistema de proteínas que actúan en trans (activadores y represores) que se unen a sitios de acción cis o "elementos" (potenciadores y silenciadores) en la propia transcripción de pre-ARNm. Estas proteínas y sus respectivos elementos de unión promueven o reducen el uso de un sitio de empalme particular. La especificidad de unión proviene de la secuencia y estructura de los elementos cis, por ejemplo, en el VIH-1 hay muchos sitios de corte y empalme donantes y aceptores. Entre los diversos sitios de empalme, ssA7, que es el sitio aceptor 3 ', se pliega en tres estructuras de bucle de tallo, es decir, silenciador de empalme intrónico (ISS), potenciador de empalme exónico (ESE) y silenciador de empalme exónico (ESSE3). La estructura de la solución del silenciador de empalme intrónico y su interacción con la proteína huésped hnRNPA1 dan una idea del reconocimiento específico. Sin embargo, para aumentar la complejidad del empalme alternativo, se observa que los efectos de los factores reguladores muchas veces dependen de la posición. Por ejemplo, un factor de empalme que sirve como activador de empalme cuando se une a un elemento potenciador intrónico puede servir como represor cuando se une a su elemento de empalme en el contexto de un exón, y viceversa. Además de los efectos dependientes de la posición de los elementos potenciadores y silenciadores, la ubicación del punto de ramificación (es decir, la distancia aguas arriba del sitio aceptor 3 'más cercano) también afecta al empalme. La estructura secundaria de la transcripción de pre-ARNm también juega un papel en la regulación del empalme, como al reunir elementos de empalme o enmascarar una secuencia que de otro modo serviría como elemento de unión para un factor de empalme.

Papel del empalme / empalme alternativo en la integración del VIH

El proceso de empalme está relacionado con la integración del VIH , ya que el VIH-1 se dirige a genes altamente empalmados.

Respuesta de empalme al daño del ADN

El daño del ADN afecta a los factores de empalme al alterar su modificación , localización, expresión y actividad postraduccionales . Además, el daño del ADN a menudo interrumpe el empalme al interferir con su acoplamiento a la transcripción . El daño del ADN también tiene un impacto en el empalme y el empalme alternativo de genes íntimamente asociados con la reparación del ADN . Por ejemplo, los daños en el ADN modulan el empalme alternativo de los genes de reparación del ADN Brca1 y Ercc1 .

Manipulación experimental de empalmes

Los eventos de empalme se pueden alterar experimentalmente uniendo oligos antisentido de bloqueo estérico como morfolinos o ácidos nucleicos peptídicos a sitios de unión de snRNP, al nucleótido de punto de ramificación que cierra el lazo, teoría del gen dividido o sitios de unión de elementos reguladores de empalme.

Errores de empalme y variación

Se ha sugerido que un tercio de todas las mutaciones que causan enfermedades tienen un impacto en el empalme . Los errores comunes incluyen:

  • Mutación de un sitio de empalme que da como resultado la pérdida de función de ese sitio. Da como resultado la exposición de un codón de parada prematuro , la pérdida de un exón o la inclusión de un intrón.
  • Mutación de un sitio de empalme que reduce la especificidad. Puede resultar en una variación en la ubicación del empalme, provocando la inserción o eliminación de aminoácidos, o muy probablemente, una interrupción del marco de lectura .
  • Desplazamiento de un sitio de empalme, que conduce a la inclusión o exclusión de más ARN de lo esperado, lo que resulta en exones más largos o más cortos.

Aunque muchos errores de empalme se protegen mediante un mecanismo de control de calidad celular denominado desintegración del ARNm mediada por sinsentidos (NMD), también existen varias enfermedades relacionadas con el empalme, como se sugirió anteriormente.

Es probable que las diferencias alélicas en el empalme de ARNm sean una fuente común e importante de diversidad fenotípica a nivel molecular, además de su contribución a la susceptibilidad a enfermedades genéticas. De hecho, los estudios de todo el genoma en humanos han identificado una variedad de genes que están sujetos a un empalme específico de alelos.

En las plantas, la variación de la tolerancia al estrés por inundaciones se correlacionó con el empalme alternativo inducido por el estrés de las transcripciones asociadas con la gluconeogénesis y otros procesos.

Empalme de proteínas

Además del ARN, las proteínas pueden sufrir un empalme. Aunque los mecanismos biomoleculares son diferentes, el principio es el mismo: se eliminan partes de la proteína, llamadas inteínas en lugar de intrones. Las partes restantes, llamadas exteínas en lugar de exones, se fusionan. El empalme de proteínas se ha observado en una amplia gama de organismos, incluidas bacterias, arqueas , plantas, levaduras y seres humanos.

Ver también

Referencias

enlaces externos