Combinando una serie de genomas antiguos y modernos, un equipo de científicos ha conseguido construir un nuevo árbol genealógico mundial, un logro que sentará las bases para futuros estudios sobre nuestra evolución y expansión por todo el planeta.
Miles y miles de genomas humanos —tanto antiguos como nuevos— han sido integrados en una única genealogía unificada, como explica una nueva investigación publicada en Science. Es un proceso similar a un árbol genealógico, solo que en versión gigante, ya que contiene los datos de casi 27 millones de antepasados, convirtiéndose así en la genealogía humana más grande jamás creada. Este nuevo mapa podría usarse para estudiar la evolución humana e incluso ayudar con las investigaciones médicas que tengan que ver con enfermedades hereditarias.
“Básicamente, hemos construido un gran árbol genealógico, una genealogía de toda la humanidad que modela con exactitud cómo se generaron todas las variaciones genéticas que encontramos en los humanos de hoy en día”, explicaba Yan Wong, genetista evolutivo del Big Data Institute y coautor del estudio, en un comunicado de la Universidad de Oxford. “Esta genealogía nos permite ver cómo la secuencia genética de cada persona se relaciona entre sí a lo largo de todos los puntos del genoma”.
Esta red muestra cómo personas de todo el mundo se relacionan entre sí y vienen de ancestros comunes. Incluso explica cuándo vivieron y de dónde habían venido. También consigue explicar eventos clave de la historia de la humanidad, como las migraciones desde África o la dispersión por otras partes del mundo.
Los investigadores han estado recopilando genomas humanos durante años, pero el desafío ha consistido en darle sentido a todo esto desde una perspectiva holística más amplia. Establecer comparaciones entre estos genomas ha sido difícil debido a los dispares métodos de recopilación de datos, la presencia de diferentes bases de datos y el propio análisis de estos datos. Para agravar un poco más el problema, hay que tener en cuenta que cada genoma humano contiene segmentos de múltiples ancestros, ya sea de varios grupos étnicos o de diferentes poblaciones humanas, como los neandertales y los denisovanos. Estos ancestros también existieron durante vastas escalas temporales, lo cual representa otro desafío. Para hacer converger todo esto hacían falta algoritmos que pudiesen adaptarse a estos desafíos, y eso es exactamente lo que han diseñado los investigadores.
Para crear el mapa, Wong y sus compañeros, aplicaron un “método de registro no paramétrico” para todos los genomas humanos, cuyo registro más antiguo data de hace cientos de miles de años. Hablé con Sharon Browning, una bioestadística de la Universidad de Washington que no había participado en la investigación, para conocer su opinión sobre este logro.
“Esta investigación consiste principalmente de una gran herramienta nueva para hacer estudios genéticos llamada tskit (abreviatura de ‘tree sequence kit’)”, nos explicaba Browning por correo electrónico. Se denominan árboles porque, “si consideras una pequeña parte del genoma de una cantidad de individuos y rastreas su evolución, eventualmente llegas a un único ancestro, como una especie de ‘Eva mitocondrial’ dentro del genoma mitocondrial. “Ese ancestro único es la raíz del árbol, y el conjunto de individuos que estas analizando son las ramas de ese árbol”. Browning explicó que este árbol se ve diferente a lo largo de diferentes partes del genoma debido a la recombinación (cuando el intercambio de material genético da como resultado una variación), y que tskit “se usa para inferir los árboles a lo largo del genoma secuenciado”.
De hecho, los algoritmos funcionan observando la variación genética y prediciendo dónde deberían estar en el árbol genealógico evolutivo los ancestros comunes. Y debido a que los genomas están geoetiquetados, es capaz de predecir dónde vivieron estos ancestros comunes.
“Esencialmente, estamos reconstruyendo los genomas de nuestros antepasados y usándolos para formar una amplia red de relaciones”, afirmó Anthony Wilder Wohns, otro de los autores principales del estudio. “Así que podemos estimar cuándo y dónde vivieron estos antepasados. El poder de nuestro enfoque es que hace muy pocas conjeturas sobre los datos subyacentes y también puede incluir muestras de ADN modernas y antiguas”.
Browning dijo que había una versión anterior de tskit que parecía prometedora, pero resultó que tenía limitaciones significativas. Los investigadores ahora han abordado esas limitaciones, “obteniendo una herramienta que debería ser extremadamente útil en muchos estudios diferentes”. A lo que agregó: “Aunque los autores brinden un par de aplicaciones, incluida su genial visualización de dónde provienen los ancestros humanos, el alcance de sus posibles usos es muy amplio, y seguro que veremos una gran actividad entre los investigadores que las desarrollan”.
Browning advirtió que los árboles que ofrece tskit “no son capaces de medir el nivel de incertidumbre”, por lo que estos resultados serán más útiles a la hora de plantear nuevas hipótesis que a la hora de probarlas. “Todavía se necesitarán otros métodos más especializados para las tareas de verificación”, dijo.
De cara al futuro, el equipo espera poder agregar nueva información genética al sistema a medida que la vayan obteniendo.