En la BUAP crean brújula para navegar en el vasto mar de la información genómica

Ciencia BUAP

Martes, Agosto 21, 2018

Se trata de un software que rastrea secuencias de genes en los genomas de los microorganismos, de forma masiva y rápida

Los genes son la unidad de información del ADN. Rastrearlos en la totalidad del material genético de cada especie es útil, debido a las funciones de determinadas secuencias o grupos de genes. Conocer cuáles de estos están presentes o ausentes en un genoma permite entender las capacidades fisiológicas y el potencial ecológico de cada organismo. Sin embargo, también es una labor tediosa por el volumen de datos, hoy de varios órdenes de magnitud superiores al de hace tan solo unos años. Por ello, investigadores de la BUAP desarrollaron un software que hace esta búsqueda en genomas microbianos en cuestión de minutos: BLAST-XYplot viewer.

A la totalidad del material genético de cada organismo se le denomina genoma, que consiste en la secuencia completa de información de ADN. Cualquier función de un organismo depende de los genes contenidos en su genoma. Encontrar en cuáles genomas están determinadas secuencias y sus posiciones a lo largo de estos ayuda a estudiantes e investigadores a hacer uso de las capacidades de los genes. Por ejemplo, en el combate de bacterias resistentes a antibióticos, un problema que alarma a la comunidad médica, pues si la tendencia se mantiene, en 2050 estos microorganismos matarán a más personas que el cáncer.

Comparar secuencia por secuencia, genoma por genoma, es una labor que implica mucho tiempo y hoy en día existe la necesidad de desarrollar aplicaciones que faciliten esta labor. Con la herramienta creada en el Instituto de Ciencias (ICUAP) es posible rastrear de forma más rápida y masiva grupos de genes involucrados en la síntesis y degradación de algún compuesto de interés, en la cantidad de genomas que se desee.

Además de ser más efectivo en el rastreo, es el único sistema que muestra todos los resultados en un solo pantallazo: un gráfico tipo XY, que en el eje “x” (la línea horizontal) indica la posición de las secuencias genéticas a lo largo de los genomas, y en el “y”, la cantidad de genomas en los que las secuencias están presentes. Cada punto en la gráfica es un resultado. El usuario es, pues, quien determina cuáles genomas secuenciados se incluyen, inclusive la totalidad de estos que son miles.

Yagul Pedraza Pérez, candidato a doctor en Ciencias Microbiológicas del ICUAP y desarrollador de este sistema, destacó que lo novedoso de BLAST-XYplot viewer es que permite ver todos los resultados de búsqueda de forma simultánea e interactuar con ellos en tiempo real. Por ejemplo, “hacer zoom” sobre algún grupo de resultados o colocar el cursor sobre uno de ellos para obtener información específica de ese gen.

Explicó que el software, para iniciar, toma todas las secuencias genéticas que el usuario ingresó y las busca sistemáticamente en los genomas indicados. Cuando termina, genera un archivo único de resultados, los ordena y filtra. Finalmente, los proyecta en la gráfica: cada punto representa un resultado de búsqueda, es decir, la comparación entre la secuencia genética que el usuario ingresó y la secuencia presente en el genoma de un determinado microorganismo.

“Esta búsqueda permite ver si un genoma tiene o no un gen que interesa, de forma masiva. Puedes buscar al mismo tiempo, por ejemplo, 4 mil genes en 5 mil genomas”, comentó Pedraza Pérez, quien sostuvo que el sistema se especializa en organismos microbianos, por lo que en este momento es de interés para investigadores en ciencias microbiológicas, aunque, en principio, “cualquier científico del área biológica busca algún gen en algún microorganismo”.

De esta forma es posible la búsqueda de nuevos compuestos antimicrobianos, continuó, una actividad necesaria dado el aumento de la resistencia de las bacterias a los fármacos. También puede ser útil en la tarea de buscar enzimas capaces de degradar sustancias tóxicas, como insecticidas, pues hay bacterias con genes que codifican dichas enzimas.

Hay más información en el genoma de una rata que en la Enciclopedia Británica

Los genomas están compuestos por cuatro bases nucleótidas (A, C, G y T), cuya secuencia y orden dictan cómo es cada organismo, qué funciones tienen, así como su fisiología y ecología. Actualmente se cuenta con aproximadamente 10 mil genomas totalmente secuenciados de bacterias y arqueobacterias, más los de organismos eucariontes (animales, plantas, hongos y otros que no pueden clasificarse dentro los tres primeros grupos). A medida que se obtienen se hacen públicos; cualquier individuo puede tener acceso a ellos. Es información que está disponible para ser analizada.

Cada genoma contiene una cantidad enorme de datos. Tan solo en el ratón doméstico, una de las primeras especies en ser secuenciadas completamente, su información equivale a 2.8 gigabytes u 11 veces los 32 tomos de la Enciclopedia Británica. De tal manera que es una labor titánica navegar entre las bases de datos que concentran la información de genomas completos, secuencias y proteínas de diversos organismos.

Pedraza Pérez y Luis Ernesto Fuentes Ramírez, investigador del ICUAP, identificaron esta problemática durante sus investigaciones enfocadas en la búsqueda de nuevos compuestos antibióticos, llamados bacteriocinas. Por eso crearon BLAST-XYplot viewer: “las bacteriocinas están codificadas en genes muy diversos. Rastrearlos de manera individual iba a ser laborioso. Queríamos que una computadora hiciera todas las búsquedas y que además arrojara la información de forma ordenada e intuitiva, para hacer la interpretación biológica más fácilmente. No había herramienta que cubriera nuestra necesidad, así que nosotros la desarrollamos”.

En otros programas de búsqueda de secuencias el usuario tiene que generar sus propias bases de datos. Tienen la ventaja que pueden usar el genoma de cualquier organismo. En BLAST-XYplot viewer la base de datos ya está generada, aunque por ahora solo abarca genomas bacterianos y de arqueas. BLAST es la aplicación que se encarga de la comparación de las secuencias en cada genoma. En BLAST-XYplot viewer se usa BLAST, sin embargo, generaron un código especial para que los resultados se presentaran en el gráfico tipo XY. Pedraza Pérez es biólogo de formación, pero aprendió a programar para este propósito.

El artículo que refiere a este software fue publicado por la revista G3 Genes Genomes Genetics. Este ha sido presentado en varios congresos, el último fue el Tercer Simposio Internacional de Bioinformática Morelos 2018, con el cartel “BLAST-XYplot viewer: una herramienta de búsqueda multi-secuencias en genomas bacterianos”, con el cual obtuvieron el primer lugar en el concurso de carteles. En colaboración con el doctor Gustavo Rubín y el ahora graduado Rodrigo Cuevas, de la Facultad de Ciencias de la Computación, se ha desarrollado un servidor que brinda acceso libre a la herramienta,  disponible en el sitio: www.blast-xyplot-viewer.icuap.buap.mx.

Imagen_sin_texto: