“La secuenciación del genoma humano y de otras especies, a principios del siglo XXI precipitó la necesidad de contar con sistemas informáticos cada vez más poderosos para lidiar con miles de millones de datos, pues se nos vino una avalancha de estos…”
Horacio Cano Camacho
La palabra de hoy no es muy nueva, aunque se potenció su uso entre los expertos con la publicación del genoma humano allá por el año 2000. Podríamos preguntarnos entonces ¿por qué la incorporo al diccionario de términos “nuevos” que debemos aprender con este asunto de la pandemia y las que vienen? La bioinformática se define como la aplicación de las herramientas computacionales para investigar, desarrollar y analizar datos biológicos.
La gran ventaja de usar una computadora es la velocidad y precisión para analizar grandes volúmenes de datos. Cuando yo estudiaba el doctorado (y no soy antediluviano), comenzaba a desarrollarse software especializado para hacer, por ejemplo, comparaciones de secuencias genómicas. Antes de esto las hacíamos a mano con el consiguiente gasto de tiempo, errores muy frecuentes y un trabajo muy largo e ineficiente. Imaginemos esta situación: obteníamos por medio de técnicas entonces ultramodernas y ahora muy rudimentarias, la secuencia de un gen, es decir el orden de acomodo de los nucleótidos. Pensemos que nuestra secuencia tiene mil de estos ladrillos, es decir mil letras (A, T, G y C). Algo así como ATGCTAAATATACGCCTTACATAGGC… hasta completar mil. Ahora yo quiero encontrar una secuencia específica dentro de esta, digamos TATA y alrededor de 200 nucleótidos adelante un ATG.
Nuestro sistema requería que fuéramos leyendo letra por letra y en la mente llevar la cuenta y la secuencia precisa que buscamos (y en el ejemplo es una secuencia muy corta y fácil). Cualquier distracción nos hacia perder el hilo y venia el desastre. Hay que volver a iniciar. Ahora un programa de computo hace eso por nosotros en segundos y además nos propone otras secuencias de importancia potencial y en mi ejemplo, incluso puede encontrar secuencias un poco distintas a TATA, pero que, por el contexto, cubran la misma función.
Ahora pensemos que deseamos comparar nuestra secuencia con otras publicadas de otros individuos y especies con la finalidad de encontrar afinidades y diferencias… La tarea llevaba semanas, meses o años de trabajo dependiendo del tamaño y número de secuencias a comparar. Recuerdo que si había un apagón o alguien por accidente le meneaba a la computadora se producía un desastre. El software nuevo lo hace también en segundos, incluso ni siquiera requiero tener instalado un software o capturar una secuencia, se hace en línea.
La secuenciación del genoma humano y de otras especies, a principios del siglo XXI precipitó la necesidad de contar con sistemas informáticos cada vez más poderosos para lidiar con miles de millones de datos, pues se nos vino una avalancha de estos y no solo me refiero a las secuencias, también a su significado: Identificar genes, mutaciones, secuencias con sentido, señales del genoma, etc. Pensemos en que tenemos la comparación de varios genomas, ahora ¿podemos establecer las divergencias entre estos? Es decir, el momento en que debieron separarse para ir generando nuevas especies. Esto nos permite establecer las relaciones de parentesco y evolutivas entre diversas especies. De esta manera sabemos qué nos hace parecidos y qué y cuándo se produjeron los cambios que ahora nos separan. Hablamos de comparar miles de millones de datos.
Y la informática recurrió a la estadística y a la probabilidad para establecer estos patrones evolutivos. ¿Por qué decimos que el SARS-CoV2 es un virus surgido por un proceso natural evolutivo y no una creación humana? Precisamente estos sistemas de comparación nos permiten ver como los diferentes coronavirus van divergiendo, el proceso gradual de sus cambios y el número de “pasos mutacionales” que los van separando. Un virus “Frankenstein” resultaría de la adición de secuencias que no tendrían relación filial unas con otras y en el análisis se notaría de inmediato. Dicen los defensores de estas puntadas, por ejemplo, que el virus SARS-CoV2 tienen una porción del virus del VIH (SIDA), lo cual es una falsedad si lo sometemos al proceso de análisis bioinformático. En cambio, son evidentes sus similitudes con el SARS-CoV y el MERS-CoV (ambos pandémicos y zoonóticos), así como los otros coronavirus que causan catarros comunes. Podemos rastrear las mutaciones o cambios espontáneos que fueron generando el bicho que nos tiene asolados ahora.
Pero la bioinformática ya es más que el análisis de secuencias. En la actualidad nos puede “predecir” la estructura molecular de una proteína alimentando los programas con la secuencia de aminoácidos (que dedujimos de la secuencia de nucleótidos de sus genes) y usando la probabilidad y la termodinámica, calcular la estructura tridimensional más probable, que es a su vez, la forma activa de estas macromoléculas. Anteriormente este tipo de estudios requería purificar a homogeneidad la molécula y cristalizarla, y analizarla con cristalografía de rayos X, lo cual implicaba años de trabajo muy pesado.
La determinación de todo el proteoma humano (unas 20 mil proteínas distintas) le llevó a una computadora solamente unos días de trabajo, lo cual es un avance impresionante. Y ahora está avanzando con los proteomas de muchas otras especies y por supuesto, comparándolas para entender el significado de las diferencias.
Pero hay más, con estas herramientas podemos predecir y hacer modelos sobre cómo interactúan las macromoléculas, por ejemplo, la famosa proteína S del virus con sus receptores en nuestras células, cómo la atacan los anticuerpos y cuáles son las mutaciones del virus que pueden provocar que este escape de nuestras defensas, o buscar medicamentos que ataquen al virus (dianas farmacológicas), o cualquier otra enfermedad, y luego hacer las pruebas clínicas a los candidatos surgidos del análisis, avanzando rápidamente en tiempo y esfuerzo al servir de criba de miles de moléculas distintas en pocos minutos.
La bioinformática está entre las áreas más importantes que posibilitaron que tengamos vacunas, sistemas de diagnóstico precisos y varios candidatos a tratamientos en menos de un año de investigación, incluso sin contar con el virus propiamente dicho, sino sólo su secuencia en la computadora, en contraste con las décadas de trabajo e instalaciones de investigación muy sofisticadas requeridas anteriormente.
La bioinformática es una actividad con un enorme futuro para estudiar y desarrollarse laboralmente. Es, en gran medida una verdadera carrera del futuro… ya presente…
|