Tramos de ADN escritos como un manual






Si una tecnología análoga a la nuestra hubiera operado en la Tierra hace un millón de años alterando algunos organismos ¿seríamos capaces de reconocer las huellas de la intervención?  El ADN se replica pasando de una generación a otra, de modo que si alguien hubiera introducido una modificación artificial, la secuencia alterada se habría replicado desde entonces. ¿Existe en el sistema biológico actual alguna huella que solo pueda provenir de una modificación artificial? Nosotros ya sabemos editar ADN. ¿lo habrá editado alguien antes que nosotros? Si ese fuera el caso ¿Qué deberíamos buscar?

La reproducción perpetuaría las huellas, pero el tiempo las puede borrar. Una intervención artificial en el pasado, debe haber sufrido mutaciones aleatorias sobre las que actuó una selección natural prefiriendo a los organismos más reproductores. Con el tiempo, la acumulación de mutaciones puede camuflar una intervención artificial preexistente como una selva ocultando los restos de una población antigua. ¿Es posible encontrar las ruinas debajo de la selva?

La idea de una mano mágica interviniendo en nuestro pasado biológico ha fundado grandes discusiones con el creacionismo, que intenta demostrar que esta o aquella estructura viviente sólo puede provenir de un diseño inteligente cuyo actor solo puede ser Dios. Esa discusión enrarece lo que estamos haciendo aquí, aunque parezca superficialmente similar. Asumimos que la tecnología no es solo un fenómeno local y actual sino universal y antiguo  y que  algunas de nuestras capacidades tecnológicas actuales ya fueron desarrolladas por otras especies en este u otros mundos en el pasado. No suponemos una inteligencia divina sino individuos tan naturales como nosotros, tal vez más antiguos, modificando algunos organismos vivos en la Tierra con técnicas de manipulación genética parecidas a las nuestras. 

Este trabajo sugiere que ciertas características concretas en la secuencia de algún ADN evidencian una ingeniería genética en el pasado.


ADN y proteínas

Si ya conoces qué es el ADN y como se expresa en proteínas puedes saltear este parágrafo. De lo contrario, aquí va un resumen.
La vida existe porque hay una molécula con capacidad de replicarse y promover una selección natural sobre las copias. En nuestro mundo, esa molécula es el ADN (ácido desoxiribonucleico), pero cualquier mundo con un replicador molecular habría iniciado un proceso biológico parecido. Además de replicarse, el ADN lleva escrita la información necesaria para construir un ser vivo. Los ladrillos de esa construcción son las proteínas.
El ADN es una enorme molécula en forma de cadena constituida por dos hilos enrollados helicoidalmente. Cada hilo es una cadena formada por millones de eslabones llamados nucleótidos. Hay sólo cuatro nucleótidos posibles: adenina (A), citosina (C), guanina (G) y timina (T). Realmente, solo nos interesa saber que hay cuatro letras, A, C, G y T. Nuestra cadena consta de largas sucesiones aleatorias de estas cuatro letras. Por ejemplo, una secuencia podría ser ...AATATCGCCG.... No importa que las letras se repitan. En general, las cadenas de ADN son muy largas. El ADN humano tiene unos 3000 millones de eslabones.
Como las adeninas de una cadena siempre se adhieren a las timinas de la otra y las citosinas siempre se adhieren a las guaninas, el segundo hilo queda determinado por el primero. 
Completando nuestro ejemplo de arriba, las dos cadenas serían así
$$\begin{matrix}A&A&T&A&T&C&G&C&C&G\\|&|&|&|&|&|&|&|&|&\\T&T&A&T&A&G&C&G&G&C\end{matrix}$$ donde la cadena de abajo está determinada por la de arriba. Si ahora retorcemos las dos cadenas helicoidalmente, tenemos una molécula de ADN.
Como el ADN es muy largo, está cortado en trozos llamados cromosomas. Si desenrollamos una molécula de ADN humano, la suma de los trozos mediría dos metros. 
Ocasionalmente, los dos hilos que forman el ADN se separan y cada uno de ellos funciona como molde para reconstruir la cadena faltante. El proceso de replicación es conceptualmente simple pero en la práctica es muy veloz, asimétrico y catalizado por la intervención de varias enzimas [video].
Podemos ver al ADN como una palabra muy larga escrita en un lenguaje de cuatro letras. En esa palabra está la información necesaria para construir un ser vivo. Cuando el ADN se replica, se reproduce también la información que contiene; pero la replicación es solo uno de los dos procesos que dispara, el segundo proceso es su expresión: La inmensa mayoría de los cuerpos están hechos de proteínas y el ADN controla su síntesis.
Las proteínas también son cadenas moleculares pero más cortas que el ADN, formadas desde unos cientos hasta decenas de miles de eslabones llamados aminoácidos. Hay 20 aminoácidos distintos, entonces las proteínas son como largas palabras de 20 letras. Cada aminoácido funciona como un imán que quiebra la cadena para uno u otro lado formando una suerte de bollito. Dos proteínas iguales tienen exactamente los mismos quiebres y se traducen exactamente en el mismo bollito. Algunos bollitos tienen varias hebras enrolladas, como la hemoglobina, que consta de cuatro cadenitas.
Todas las proteínas están escritas en el ADN. Existe un lenguaje que a cada terna de nucleótidos en el ADN le hace corresponder un aminoácido. Como existen 64 ternas y sólo 20 aminoácidos, las ternas alcanzan y sobran para representar a todos los aminoácidos. De hecho, existen varias ternas distintas que representan el mismo aminoácido. El criterio que a cada terna de nucleótidos le hace corresponder un aminoácido se llama código genético [tablas] y está en la base del proceso por el cuál un sector del ADN se traduce en una proteína. Las ternas de nucleótidos se llaman codones.
El mecanismo de transcripción involucra otro ácido nucleico llamado ARN (ácido ribonucleico); idéntico al ADN excepto en 3 cosas: está formado por un solo hilo en vez de dos, es mucho más corto y la timina (T) está reemplazada por una molécula llamada uracilo (U). Hay dos tipos de ARN, el ARN mensajero (ARMm) que es una copia de un trozo de ADN pero en un solo hilo; y el ARN transferencia (ARNt) que solo está formado por una terna de nucleótidos y que suele estar adherido a su aminoácido correspondiente.  
El ARNm se construye usando ADN como molde, luego se desprende del él y se lleva la información de la proteína que se debe fabricar [video]. En el citoplasma se sintetizan las proteínas dentro de unos orgánulos llamados ribosomas, utilizando al ARNm como un plano y a los ARNt como ladrillos que traen de uno por vez a los aminoácidos que se deben engarzar en la cadena [video]. 
Cada terna de letras del ADN se traduce en una terna en el ARNm, siguiendo la relación de complementariedad A-T y C-G, y luego, cada terna de ARNm se traduce en un aminoácido en la cadena de proteína.  
Todos los organismos vivos están hechos de proteínas. Cuando el ADN sintetiza proteínas está construyendo los ladrillos que edifican un cuerpo. La diferencia entre una célula de la sangre y otra de la piel no es su ADN, que es el mismo, sino las proteínas que el ADN sintetiza en cada caso.
  
Cuando las proteínas se asocian
Dentro de la célula existe un mundo hecho de proteínas. Si la célula fuera una bolsa esférica de un metro de diámetro, las proteínas serían unas bolitas de menos de un milímetro. Dentro de la bolsa, el paisaje sería maravilloso. Este cortometraje de tres minutos realizado para el Departamento de Biología Molecular y Celular de la Universidad de Harvard nos muestra algunas maravillas de ese mundo.



En muchas ocasiones, las funciones de las proteínas se expresan cuando actúan varias de ellas, ya sea como partes diferenciadas de una estructura física o como eslabones en una sucesión de acciones que solo reporta un beneficio al final. En ambos casos podemos preguntar que procesos construyeron las proteínas componentes si la utilidad aparece solo cuando el conjunto se ha completado.
En 1996, el bioquímico Michael Behe publica "La caja negra de Darwin" [1], donde sostiene que en algunos casos, las partes de una estructura funcional no pueden proceder de una sucesión de mutaciones aleatorias porque si las mutaciones no presentaron una ventaja replicativa las proteínas no podrían establecerse para componer luego una estructura mayor. Esta es la complejidad irreductible: No puede operarse una secuencia de mutaciones en las partes que casualmente produzcan al final una estructura compleja ventajosa.
El problema es que la complejidad irreductible no está probada. Dentro de la bolsa podrían existir proteínas "basura", que no cumplen ninguna función  y simplemente existen porque un proceso automático las genera desde el ADN y no son suficientemente malignas para alterar la reproducción de la célula. O bien podría ser que algunas proteínas que cumplen una función determinada se agreguen con otras que son basura o que cumplen otras funciones y generen una estructura compuesta que produzca alguna modificación dentro de la célula. Una selección natural haría el resto descartando la estructura o refinando la función compleja.

Un manual en el ADN
La complejidad irreductible no puede probarse  porque las partes que forman la estructura funcional podrían haberse formado por separado para luego unirse y refinar una función. Pero si ese fuera el caso, la secuencia de las proteínas participantes estaría escrita en cualquier parte del ADN y no una a continuación de la otra.
Si tres proteínas nacieron por separado escritas en lejanos tramos del ADN y se unieron luego para presentar una estructura útil, su escritura debería continuar separada a menos que encontremos un proceso de selección que las prefiera juntas. En ese caso, las mutaciones que acercan la escritura de unas y otras proteínas debería dejar más descendencia que sus alelos.
Figura 1. Flagelo bacteriano

Una de las estructuras más complejas conocidas a nivel celular, el flagelo bacteriano (Fig. 1), entrega un ejemplo muy potenciado de este caso. El flagelo rota como la hélice de una lancha permitiendo que la bacteria se desplace. Es una especie de motor que transforma energía eléctrica (de protones) en movimiento de giro. La estructura que forma el flagelo consta de unas  30 proteínas cuya función se verifica al final, cuando el flagelo está listo. A esto hay que adicionar las proteínas involucradas en la expresión de las anteriores y en la estructura química que decide el movimiento del flagelo 
Todas estas proteínas podrían haber nacido para otras cosas y luego juntarse en estructuras de complejidad creciente hasta llegar a formar un rotor que gira sobre un estator engarzado en la pared celular. Pero en el ADN, muchas de estas proteínas están escritas una a continuación de la otra, como si fueran un manual de instrucciones inserto allí. 
Un estudio reciente que investiga la expresión del conjunto flagelar en las Pseudomonas putida [2] refiere  una región del ADN denominada grupo flagelar, que incluye 59 genes potencialmente involucrados en la estructura y función del sistema flagelar colocados uno a continuación del otro salvo 3 excepciones .
En todos los casos, las proteínas que luego formaron parte una estructura funcional, nacieron aisladas unas de las otras, en diferentes regiones del ADN. La probabilidad de que se hayan originado una a continuación de la otra es despreciable. Por tanto, debe existir un proceso que acerca las secuencias de ADN de las proteínas que comienzan a funcionar juntas. En todos los casos, la mutación que acerca las secuencias proteicas en el ADN debe dejar más descendencia que la versión no mutada.
Imaginemos tres proteínas que han "descubierto" la ventaja de funcionar juntas y que están muy separadas en el ADN. Cada una podría constar de 500 nucleótidos y estar separadas unas de otras por 100.000 nucleótidos. En ese caso, el ARN mensajero lleva la información a la célula y se traduce en la proteína dentro de un ribosoma, pero las proteínas resultantes están muy lejos para encontrarse y formar la estructura en cuestión.  Para que ello ocurra, deben formarse muchas proteínas, lo cual resulta ineficiente. Una mutación que acerque los tramos de ADN donde están escritas las proteínas mejoraría la eficiencia y dejaría más descendientes.
Pero este proceso de acercamiento tiene un límite. Si los tramos de ADN que contienen la información para sintetizar las tres proteínas del ejemplo están separados por 100 nucleótidos en lugar de 100.000, entonces ya están lo suficientemente cerca para copiarse en ARNm, llegar a los ribosomas y traducirse en proteínas suficientemente cercanas. No constituye ninguna ventaja que además, uno esté a continuación del otro sin ruido en el medio. 
Supongamos que usted vive y trabaja en Buenos Aires y ha quedado en reunirse con su amiga en el teatro, luego del trabajo de ambos. Los dos trabajan en lugares distintos y quedaron en reunirse en el mismo teatro. Es claro que no importa si viven en el mismo edificio. Es importante que no vivan y trabajen en ciudades lejanas, pero si están en la misma ciudad, no necesitamos que vivan en el mismo edificio. 
La figura 2 muestra el caso donde la información para sintetizar las proteínas tiene un poco de ruido en el medio y como sería la síntesis en ese caso. 


Figura 2. Estructura de 3 proteínas expresada con ruido entre genes

La figura 3 muestra como sería la síntesis si esa información en el ADN estuviera una a continuación de la otra.

Figura 3. Estructura de 3 proteínas expresada sin ruido entre genes.

Comparando los gráficos podemos ver que no hay ventaja de una situación sobre la otra. En ambos casos el ARNm debe ir hasta un ribosoma para sintetizar la proteína. Es mejor estar cerca que lejos, pero no hay ninguna ventaja entre estar cerca y estar uno a continuación del otro.


¿Por qué hay un manual en el ADN?

La intrigante cuestión es que algunas veces la información que se expresa en proteínas que luego formarán parte de la misma estructura, están escritas una a continuación de la otra en el ADN, como en el grupo flagelar que mencionamos arriba. Ese trabajo [2] muestra claramente cómo la información de la mayoría de las proteínas que luego se unirán para formar el motor flagelar están escritas una a continuación de la otra como un conjunto de instrucciones insertas allí y no como proteínas aisladas, creadas para otras cosas y que de a poco se fueron acercando por selección natural.

Figura 4. Grupo flagelar [2]

La sección A de la Figura 4 muestra 59 secuencias de proteínas que intervienen en la expresión del flagelo de la Pseudomona Putida y tres zonas grisadas desconocidas. Las expresiones de las proteínas están una a continuación de la otra. Las flechas indican interruptores que activan y desactivan la transcripción de las proteínas a continuación. La sección B no nos interesa aquí pero es un resumen  que muestra las secuencias encontradas en diferentes especímenes.

La pregunta es ¿por qué razón encontramos secuencias de proteínas que colaboran en la misma estructura anotadas una a continuación de la otra en el ADN? ¿Cuál es la razón de este detalle si la estructura funciona igualmente bien cuando las proteínas se encuentran aceptablemente cercanas? Si el ruido entre dos proteínas contiguas fuera de solo 100 nucleótidos, hay $4^{100}$ combinaciones posibles que funcionan igual de bien. Si la separación fuera de 50 nucleótidos en lugar de 100 la naturaleza no tendría como preferir una versión respecto de la otra.

Los genes de las proteínas asociadas tienen un interruptor que decide cuando se debe sintetizar ARNm y cuando no. Ese interruptor es otra proteína que se pega allí e interrumpe la copia (o la interrumpe cuando se despega). En ocasiones, en células sin membrana nuclear, el mismo interruptor decide cuando se activa o desactiva la transcripción de un grupo de proteínas a la vez. Esta sería una ventaja para las proteínas que luego deben actuar juntas. Pero si las proteínas nacieron separadas y con interruptores diferentes, cuesta entender que una selección natural las haya acercado lo suficiente para que una mutación posterior las colocara una a continuación de la otra bajo el control del mismo interruptor.

En resumen, la forma como están escritas en el ADN las secuencias que se expresan en proteínas que actúan juntas, en algunos casos se parece mucho a la inserción de un trozo preconcebido utilizando ingeniería genética. Los vestigios de una acción natural y aleatoria se parecen mucho más a una lluvia de mutaciones sobre un manual preexistente que a las huellas de una eventual construcción evolutiva.


________________________



[1] Behe, Michael J. (2000). La caja negra de Darwin: el reto de la bioquímica a la evolución. Editorial Andrés Bello.

[2]Leal-Morales, A., Pulido-Sánchez, M., López-Sánchez, A. and Govantes, F. (2022), Transcriptional organization and regulation of the Pseudomonas putida flagellar system. Environ Microbiol, 24: 137-157. https://doi.org/10.1111/1462-2920.15857






Licencia Creative Commons
Tramos de ADN escritos como un manual por Cristian José Caravello se distribuye bajo una Licencia Creative Commons Atribución 4.0 Internacional.

No hay comentarios:

Publicar un comentario