“Abordar la tarea de secuenciar esta molécula, considerando el tamaño del ADN humano de cerca de cuatro mil millones de bases (los componentes estructurales del ADN), fue sin duda titánica: equivalente a componer una enciclopedia de miles de tomos letra a letra sin conocer previamente las palabras ni su orden”.

 

Horacio Cano Camacho

Corría febrero del 2001 y dos consorcios formados expresamente para ello (uno financiado con fondos públicos internacionales y otro por empresas privadas), acordaron publicar el primer borrador del genoma humano: el “libro de instrucciones” -como se le llamó entonces- para construir un ser humano estaba medianamente listo. Indudablemente se trató de una proeza científica, la culminación de una gigantesca aventura intelectual, científica, y tecnológica. Hasta entonces, obtener la secuencia completa y precisa del ADN se circunscribía a genes aislados o a genomas pequeños de organismos muy sencillos y virus, que, con todo, implicaban años de trabajo y análisis.

Abordar la tarea de secuenciar esta molécula, considerando el tamaño del ADN humano de cerca de cuatro mil millones de bases (los componentes estructurales del ADN), fue sin duda titánica: equivalente a componer una enciclopedia de miles de tomos letra a letra sin conocer previamente las palabras ni su orden. Fue necesario rediseñar las técnicas de secuenciación, crear equipos para hacerlo, diseñar desde cero sistemas de automatización, crear software de análisis, computadoras con la capacidad de procesamiento, coordinar a miles de científicos y técnicos en todo el mundo… y se logró.

Ese año se abrió la posibilidad de estudiar cada uno de los cromosomas humanos, base por base, comenzar a entender como están ordenados los genes, el contexto en que se encuentran, comparar diferentes individuos, asociar secuencias a características o defectos relacionados con enfermedades…

Las sorpresas comenzaron el mismo día de la publicación: teníamos menos genes de los previstos, no éramos más sofisticados -a ese nivel- que una mosca, una rana o una orquídea, las secuencia por si misma nos decía poco, la porción codificante de nuestro genoma era muy pequeña y se encontraba dentro de porciones gigantescas del ADN que no parecían tener información alguna ni “servir para nada” pero allí estaba y se heredaba. Para colmo, el genoma no estaba completo…

Solo se había obtenido un porcentaje de la secuencia que con el tiempo de avances y correcciones se fijó en el 92%. El 8% restante se publicó apenas hace unos días añadiendo 200 millones de letras para componer un texto de 3.055 millones de letras (tres mil cincuenta y cinco millones de letras como ATTGCTGAA…) además de corregir miles de errores del borrador original.

Ahora sí está completo, lo que es una magnífica noticia. Pero no esperemos ver un manual de instrucciones como a los que estamos acostumbrados. Este es un libro muy extraño, arreglado en diversas capas: Hay una capa con genes que tienen información para producir proteínas (anticuerpos, hormonas, catalizadores, sistemas de percepción) y a esta versión del genoma se le agregaron genes de proteínas desconocidas hasta ahora. También hay presuntos genes que habrá que estudiar más para agruparlos en algún lado.

Otra capa codifica para ARNs con diversas funciones, algunas muy novedosas y estos son aún más abundantes que la capa anterior. Hay una capa desconcertante que incluye a secuencias redundantes. Muchos genes están repetidos, una o dos veces, pero dependiendo de la persona cuyo genoma se uso de referencia en las pruebas. Algunas personas pueden tener hasta 25 o más repeticiones. Es como si la oración “hacer un dedo” se pudiera encontrar en diferentes personas en una sola vez, dos o 25… ¿Qué significado tiene esta repetición, si es que tienen alguno?

Hay una capa aún más desafiante, secuencias pequeñas repetidas dentro o en los alrededores de un gen. Pensemos en la secuencia ATGGCTA dentro de un gen. Otra persona tiene ATGGCTA ATGGCTA ATGGCTA. Y otras personas tienen repetida esa secuencia 40 veces. Por estudios anteriores con ciertas enfermedades, sabemos que la persona que tiene más de unos pocos repetidos sufrirá cáncer de colon o Corea de Hungtington y la enfermedad llegará más joven a medida de que la cadena de repetidos sea más larga, como una suerte de reloj macabro, pero ¿por qué? ¿qué función hacen o alteran esos repetidos?

Otra capa muy grande contiene pseudogenes, secuencias que por azar perdieron su capacidad de expresarse o secuencias que son evidencia de inserciones antiguas de material genético como transposones, virus endógenos, y otras que permanecen en nosotros desde la noche de los tiempos y muchas de las cuales ahora sabemos que pueden tener papeles activos en nuestra evolución…

Durante mucho tiempo se pensó que ese tipo de secuencias y otras más “sin sentido” encontradas ya desde el primer borrador eran eso, ADN sin información alguna y se le dio en feo nombre de ADN basura, sin embargo, cada día es más evidente que esas secuencias están lejos de ser basura y por el contrario, tienen muchas funciones vitales, el asunto es descubrirlas.

Hasta ahora el genoma de referencia es una suerte de retazos de algunas personas. Se han secuenciado los genomas de alrededor de 3000 personas (sobre todo europeos y anglosajones). Y esto supone un problema. Imaginemos que somos un aparato que agrega su manual de instrucciones. Un manual es valido para todos los aparatos del mismo modelo y las variaciones cercanas, pero no para todos los aparatos. Pero los humanos somos más de siete mil millones y ahora sabemos que no importa que seamos la misma especie, entre individuos podemos encontrar diferencias a veces no tan sutiles.

Compartimos, sin duda, la basta mayoría de los genes de las capas codificadoras de proteínas y ARNs, pero puede haber muchas diferencias en las secuencias redundantes, en los repetidos y en el contexto. Imagine que el gen “hacer un dedo” en la persona uno está contenido en una secuencia ATCC ATCC “hacer un dedo” ATCC ATCC, pero en la persona dos el contexto es ATCC ATCG “hacer un dedo” GCAT, si bien la secuencia es la misma y por lo tanto la función, el contexto importa. Puede ser que esa sola diferencia nos haga más o menos susceptibles al covid-19 o reproductivamente más prolíficos o longevos…

En fin, la noticia de la publicación del genoma completo es, sin duda, una magnifica noticia intelectual, científica y tecnológicamente hablando, pero aún falta mucho para poder entender por qué somos como somos y qué podemos aprender de estas diferencias, a veces evidentes, a veces muy sutiles. El famosos libro de instrucciones se convirtió en un libro multidimensional y con regulaciones espaciales, temporales y de control muy complejas. Seguiremos sobre este tema, esté pendiente…


Fotografía: The Digital Artist | Pixabay


Originario de un pueblo del Bajío michoacano, toda mi formación profesional, desde la primaria hasta el doctorado la he realizado gracias a la educación pública. No hice kínder, por que en mi pueblo no existía. Ahora soy Profesor-Investigador de la Universidad Michoacana desde hace mucho, en el área de biotecnología y biología molecular… Además de esa labor, por la que me pagan, me interesa mucho la divulgación de la ciencia o como algunos le dicen, la comunicación pública de la ciencia. Soy el jefe del Departamento de Comunicación de la Ciencia en la misma universidad y editor de la revista Saber Más y dedico buena parte de mi tiempo a ese esfuerzo.