CXorf66 - CXorf66

CXorf66
Identificadores
Alias CXorf66 , SGPX, marco de lectura abierto 66 del cromosoma X
ID externos MGI: 3779666 HomoloGene: 82551 GeneCards: CXorf66
Ubicación de genes (humanos)
Cromosoma X (humano)
Chr. Cromosoma X (humano)
Cromosoma X (humano)
Ubicación genómica para CXorf66
Ubicación genómica para CXorf66
Banda Xq27.1 comienzo 139,955,728 pb
Fin 139,965,521 pb
Ortólogos
Especies Humano Ratón
Entrez
Ensembl
UniProt
RefSeq (ARNm)

NM_001013403

NM_001039240
NM_001382307

RefSeq (proteína)

NP_001013421

n / A

Ubicación (UCSC) Cr X: 139,96 - 139,97 Mb n / A
Búsqueda en PubMed
Wikidata
Ver / editar humano Ver / Editar mouse

CXorf66, también conocida como Cromosoma X Open Reading Frame 66 , es una proteína 361aa en humanos que está codificada por el gen CXorf66 . Se predice que la proteína codificada es una proteína transmembrana de tipo 1 ; sin embargo, actualmente se desconoce su función exacta. CXorf66 tiene un alias: RP11-35F15.2.

Existe una patente para CXorf66 con el archivo US 8586006 del Institute for Systems Biology and Integrated Diagnostics, Inc.

La proteína CXorf66 es un posible biomarcador de cáncer nuevo .

Gene

CXorf66 se encuentra en el cromosoma X en Xq27.1 y está en la hebra del complemento. El gen CXorf66 se encuentra entre ATP11C ATPasa , MIR505 y HNRNPA3P3 . Además de esto, según OMIM, CXorf66 se posiciona entre SOX3 , SPANXB1 y CDR1 .

Locus del gen humano CXorf66 en el cromosoma X

ARNm

Variantes de empalme

CXorf66 solo consta de una variante de empalme conocida con tres exones (1-117, 118-271 y 272-1288bp) y dos intrones . Las ubicaciones de las uniones se producen en 30aa [G] y 81aa [M].

Empalme del gen CXorf66

Se ha encontrado que CXorf66 solo tiene un solo sitio de poliadenilación .

Proteína

Composición

Con 57 serinas y 42 lisinas, la proteína CXorf66 es rica tanto en serina como en lisina . CXorf66 tiene un peso molecular de 39,9 kdal y un punto isoeléctrico de 9,89.

Dominios

La proteína CXorf66 tiene un péptido señal predicho de 1-19aa, un dominio topológico de 20-47aa, un dominio transmembrana de 48-68aa y un segundo dominio topológico de 69-361aa. Se prevé que se produzca un sitio de escisión del péptido señal entre 17-18aa. Al analizar la composición de la proteína (rica en serina y lisina) y las modificaciones postraduccionales (altos niveles de fosforilación), se predice que el primer dominio topológico [20-47aa] es extracelular , mientras que el dominio topológico [69-361aa] es citoplásmico. . Se puede ver una imagen en la Figura II .

Figura I. Sitios de fosforilación candidatos en la proteína CXorf66 humana
Gráfico II. Predicción SOSUI de la topología transmembrana de la proteína CXorf66

Se han encontrado tres motivos repetidos de DKPV [31-34 y 204-207aa], SEAK [97-100 y 287-290aa] y PKRS [161-164 y 245-248aa] en la proteína CXorf66 humana. Estas repeticiones se conservan en otros primates como Gorilla gorilla gorilla y Macaca mulatta , pero no están presentes en otros mamíferos.

SNP

Existe una variante natural de la población (frecuencia 0.436) en 233aa de prolina a leucina en la proteína CXorf66, siendo la prolina el aminoácido codificado ancestral. No se han observado efectos con esta mutación sin sentido .

Proteínas que interactúan

Según la interacción de proteínas predicha por STRING , CXorf66 tiene una puntuación de nivel medio por estar ligada a las proteínas enumeradas en la Figura III . Es importante señalar que todas las proteínas enumeradas no se determinan experimentalmente.

Regulación

Transcripción

Promotor

Solo hay un promotor conocido predicho por Genomatix para la proteína CXorf66 en la hebra negativa de 139047554-139048298 que tiene una longitud de 745 pb. Cuando se utilizó BLAT Search Alignment para el promotor CXorf66 generado, se recuperaron numerosos hits con alta identidad para varios genes en diferentes cromosomas. Los siguientes son algunos resultados de búsqueda generados con la mejor puntuación que comparten un alto porcentaje de identidad:

Nombre ID del gen Puntuación Span (bp) de 745 Identidad Cromosoma Hebra comienzo Fin
ZBTB8A 653121 282 656 88,2% 1 - 32994892 32995547
TESK2 10420 263 624 90,3% 1 - 45843093 45843716
TBCK 93627 244 639 91,5% 4 + 107146630 107147268
USP48 84196 241 631 89,0% 1 + 22014725 22015355
PTPN22 26191 227 281 90,0% 1 - 114365307 114365587
PSPH 5723 220 605 90,6% 7 - 56098319 56098923

De manera única, TESK2 es una proteína quinasa específica de testículo, que se correlaciona con la expresión tisular predicha de CXorf66.

Factores de transcripción

Mediante el uso de Genomatix, se generó una tabla de los 20 principales factores de transcripción y sus sitios de unión en el promotor CXorf66 (ver Figura IV ).

Figura IV: Lista generada de sitios de unión de factores de transcripción en el promotor CXorf66

Traducción

CXorf66 tiene dos miRNA , hsa-mir-1290 y hsa-miR-4446-5p que se predice que se unirán a la región 3 'UTR del mRNA.

Modificaciones postraduccionales

Un sitio de N-glicosilación ha sido predicho por de Expasy NetNGlyc en NGSS [24aa] con también un sitio secundario posible en NGTN [21aa]. Utilizando NetPhos , se han predicho un total de 48 sitios de fosforilación (41 serinas , 2 treoninas y 5 tirosinas ), todos los cuales ocurren después del dominio transmembrana predicho, lo que sugiere una topología citoplasmática. Usando YinOYang , se han predicho muchos sitios O-GlcNAc . Todo lo que incluye alto potencial ocurre después de la región transmembrana 48-68aa. Un análisis SUMOplot realizado de la proteína Homo sapiens CXorf66, descubrió una alta probabilidad de un motivo de sumatoria en la posición K241, junto con motivos de baja probabilidad en K316 y K186. Dado que la sumoilación tiene un papel en varios procesos celulares como el transporte citosólico nuclear y la regulación transcripcional, se espera que CXorf66 sea modificado por una proteína SUMO después de la traducción.

Localización subcelular

Figura V.Señales de localización nuclear de CXorf66 entre homólogos

Usando PSORT II, hay una señal de localización nuclear de PYKKKHL en 268aa. Se puede ver que esta señal se conserva en otras especies de primates; sin embargo, no está presente en otros mamíferos. Además de esto, siguiendo la predicción SAPS kNN de SDSC's Biology Workbench, la proteína CXorf66 para humanos y el homólogo de ratón tienen un 47,8% de probabilidad de terminar en la región nuclear de una célula. Sin embargo, para homólogos más distantes, como Bos taurus, que no tienen señales de localización nuclear, CXorf66 tiene una probabilidad del 34,8% de terminar en la región extracelular, incluida la pared celular, o en las regiones de la membrana plasmática. Para ver varios homólogos y sus señales de localización nuclear, ver Figura V .

Homologia

CXorf66 no tiene parálogos conocidos en humanos; sin embargo, CXorf66 ha conservado homólogos en todo el reino Mammalia . Muy conservado en primates, se ha observado una evolución rápida notable para CXorf66, ver Figura VI , que explica el mayor número de ortólogos en mamíferos, en lugar de en invertebrados, aves y reptiles.

Gráfico VI. Divergencia de homólogos de proteínas CXorf66
Proteína CXorf66 Especies Fecha de divergencia (MYA) ncbi número de acceso cubierta de consulta Valor E Identidad
Homólogo CXorf66 Chimpancé (Pan troglodytes) 6.3 XP_001139133.1 100% 0 98%
Homólogo CXorf66 Gorila (Gorilla gorilla gorilla) 8.8 XP_004065002.1 100% 0 98%
LOC631784 isoforma X1 Ratón (Mus musculus) 92,3 XP_006528296.1 98% 2E-41 34%
Isoforma X1 similar a CXorf66 Rata (Rattus norvegicus) 92,3 XP_001068529.2 84% 6E-32 32%
Homólogo CXorf66 Vaca (Bos taurus) 94,2 XP_005200949.1 96% 2.00E-46 35%
Homólogo CXorf66 Rinoceronte blanco (Ceratotherium simum simum) 94,2 XP_004441715.1 100% 8.00E-86 48%
Homólogo CXorf66 Caballo (Equus caallus) 94,2 XP_005614614.1 96% 8.00E-58 44%
Polipéptido medio de neurofilamento Pinzón cebra (Taeniopygia guttata) 296 XP_002197538.1 44% 2.00E-08 30%
Similar a la triadina, parcial Caimán (Alligator mississippiensis) 296 XP_006271227.1 53% 2.00E-12 23%
LOC590028 Erizo de mar (Strongylocentrotus purpuratus) 742,9 XP_794743.3 45% 2.00E-05 35,40%
Alfa-L-fucosidasa Streptococcus mitis 2535,8 WP_001083113.1 47% 7.00E-38 22%

Expresión

A partir de la visualización de abundancia de tejido de ADNc EST de Unigene y del Atlas de proteínas, CXorf66 tiene niveles de expresión moderadamente altos en los testículos, además de niveles de expresión más altos en el tejido del feto en comparación con otras etapas de desarrollo. La proteína CXorf66 también tiene una presencia notablemente baja tanto en el ARN total del endometrio de control como en el ARN total de la endometriosis . Se ha descrito que CXorf66 tiene una presencia notable en el plasma y las plaquetas . Según los datos de PaxDb, se ha encontrado que CXorf66 se encuentra en el 5% superior para un estudio de plasma humano y en el 25% superior para otro estudio realizado con plaquetas humanas. Además de esto, ha habido una presencia notable de proteína CXorf66 del 60% al 100% en el tejido del tabique de cardiomiopatía dilatada y que no falla . Además, CXorf66 tiene una presencia de proteína de ~ 75% en las células mononucleares de sangre periférica .

Datos de expresión tisular EST de Unigene para la proteína CXorf66 humana
GeneCards predijo la expresión tisular de la proteína CXorf66 humana

Referencias

enlaces externos