El nanoblog del Gonz: mayo 2021

En otra entrada vimos el éxito de 'genoma' desde el punto de vista lingüístico. Ahora vamos a abordar otro éxito completamente diferente.

Cuando en 1984 se empezaron a plantear si sería posible secuenciar el genoma humano, el grupo de Craig Venter ya estaba secuenciando el primer procariota (Hemophilus imfluenzae) con el que dio a conocer el sistema de secuenciación indiscriminada (shotgun sequencing), y en Europa estábamos (sí, yo puse mi grano de arena) poniendo en marcha la secuenciación del primer eucariota (la levadura Saccharomyces cerevisiae). El debate estaba en que abordar la secuenciación de nuestro genoma iba a tener un coste excesivo dadas las pocas secuencias codificantes que contenía (que se creía, inocentemente, que constituían el 10%; si llegan a saber que solo era un 1,1%, igual ni empiezan). En la imagen adjunta se puede ver lo que costó el primer genoma humano y cómo ha ido decayendo el coste con los años y los avances tecnológicos.

Tras poner en canción a un montón de grupos e investigadores, en 2001 se publicó el primer borrador y se indicó que era 25 veces más grande que cualquier otro conocido por entonces. En 2003 se publicó la secuencia de la eucromatina humana (el 92,1%). Hoy, 20 años después del primer hito, sabemos que contiene 20 437 genes que codifican proteínas (coding genes) y otros 23 988 genes no codificantes (non-coding genes), en un genoma de 3,096 Gpb que produce más de 235.000 transcritos diferentes.

Se han secuenciado cientos de genomas, desde virus a eucariotas complejos, y se ha visto que el de muchos animales y plantas oscila entre 0,4 y 0,7 Gpb (un gigapar de bases corresponde a 1 millón de pares de bases). Por tanto, nuestro genoma ya no es más que unas 10 veces mayor que el de muchos otros seres vivos. Así que de 25× en 2001 hemos pasado a un escaso 10× en 2021. O lo que es más denigrante para tantísimos homocéntricos: nuestro genoma es solo ligeramente superior al del ratón (2,72 Gpb) y tiene menos genes codificantes que una mala hierba, el arroz y, en general, que cualquier planta. Así que ¿tendremos el genoma más grande del planeta? La respuesta llegará en la próxima nanoentrada.

¿Son las proteínas metamórficas producto del metamorfismo, como las rocas que llevan el mismo adjetivo? Pues no, no son más que el producto de una traducción calquista del inglés metamorphic proteins, para variar, porque realmente derivan de metamorfosis, que tampoco es exclusiva de los insectos. Y es que el término metamórfico solo tiene asignado un significado en el ámbito de la geología en el DLE y seguramente en la mente de muchos de nosotros. Por eso, hubiera sido mucho más sensato acuñar y usar metamorfo, puesto que contamos en nuestro idioma con el sufijo -morfo para referirnos a la forma, como actinomorfo, alomorfo, zigomorfo, etc. Contamos también con otros términos más afines a este problema, como amorfo, dimorfo y polimorfo, por lo que metamorfo hubiera sido muy coherente. Por desgracia, se calca «metamófico» como adjetivo de «metamorfosis» en los contextos no geológicos, y me estoy temiendo que va a ocurrir lo mismo que con «hidrófobo», con el que la presión del inglés ha hecho que la RAE acepte el calco hidrofóbico. Ya falta poco para ~~hibridizarnos~~ del todo.

Una vez terminadas las disquisiciones lingüísticas, ¿qué son esas proteínas metamorfas (o metamóficas)? La teoría del plegamiento de las proteínas (protein folding) ya quedó establecida en 1973 por Anfinsen, con la idea de que una proteína solo adquiere una estructura tridimensional funcional. Pero 10 años después ya se empezaban a encontrar secuencias de aminoácidos que eran capaces de alternar entre dos plegamientos que le daban dos funciones distintas, como la RfaH de la imagen. En 1996 se reunieron bajo la denominación secuencias camaleónicas (chameleon sequences) todas las cadenas de aminoácidos capaces de adoptar más de una estructura de manera intercambiable (no como la β-amiloide del alzhéimer o la Prp de los priones, que cambian irreversiblemente). Con frecuencia, secuencia camaleónica, proteína metamórfica, y el híbrido proteína camaleónica se usan como si fueran sinónimos. Pero, como hemos indicado, el primero (secuencia camaleónica) hace referencia a la secuencia de aminoácidos, mientras que «proteína metamorfa» debería reservarse para la estructura adquirida, porque una secuencia camaleónica producirá al menos dos proteínas metamorfas. Seguimos sin tener claro por qué existen este tipo de proteínas, que inicialmente se creía que eran una etapa intermedia de evolución del plegamiento ya que se creía que cada proteína se plegaba de una sola forma. En 2023, ya se empieza a pensar que se trata de una capacidad adaptativa que se ha conservado y optimizado a lo largo de la evolución.

Quiero agradecer a los compañeros de @Tremedica el debate que me ayudó a conformar esta entrada.

El nanoblog del Gonz

21 may 2021

¿Es grande el genoma humano?

6 may 2021

Proteínas metamórficas, camaleónicas, o mejor metamorfas