L’inférence démographique à partir de données génétiques permet de reconstituer l’histoire évolutive des populations, même en l’absence de données paléontologiques ou historiques précises. En analysant les séquences d’ADN des individus actuels, il est possible de remonter dans le temps pour détecter des événements passés tels que des expansions, des goulots d’étranglement, des migrations ou des séparations de populations.
Cette approche est devenue centrale en génétique des populations et en biologie évolutive, notamment grâce aux progrès du séquençage et aux outils bioinformatiques.
1. Fondements de l’inférence démographique
L'inférence démographique repose sur l'idée que les événements historiques laissent des signatures spécifiques dans les génomes. Par exemple :
-
Une expansion démographique rapide entraîne une accumulation de mutations récentes
-
Un goulot d’étranglement provoque une perte de diversité génétique
-
Une migration laisse une trace d’introgression génétique entre populations
Les modèles d’évolution neutres (comme la coalescence) sont utilisés comme référence pour détecter les écarts dus à ces événements.
2. Types de données utilisées
Plusieurs types de données génétiques peuvent être exploités :
-
Microsatellites : utiles pour des périodes récentes
-
SNP (Single Nucleotide Polymorphisms) : très utilisés pour leur abondance et leur stabilité
-
Séquences mitochondriales : souvent utilisées pour retracer les lignées maternelles
-
Génomes entiers : permettent une résolution fine à toutes les échelles temporelles
3. Principaux événements détectables
Les analyses génétiques permettent d’inférer :
-
Des changements de taille effective de population (Ne)
-
Des événements de colonisation ou de fragmentation
-
Des flux de gènes entre groupes
-
Des divergences temporelles entre populations
-
Des métissages anciens ou récents
4. Méthodes d’inférence démographique
a) Méthodes basées sur le site frequency spectrum (SFS)
Ces méthodes comparent la fréquence des allèles observée dans les données à celle attendue sous différents scénarios démographiques.
Outils : ∂a∂i, fastsimcoal2
b) Modèles coalescents simulés
Basés sur la coalescence généalogique, ils modélisent la façon dont les gènes remontent à des ancêtres communs. Les modèles peuvent inclure des changements de taille de population, des flux génétiques ou des événements de spéciation.
Outils : ms, msprime, BEAST, DIYABC
c) Approximate Bayesian Computation (ABC)
L’ABC permet de comparer de nombreux scénarios démographiques simulés à partir de paramètres donnés, puis d’identifier ceux qui correspondent le mieux aux données observées.
d) Histoire démographique basée sur la distribution des longueurs d’haplotypes
En utilisant les liens de déséquilibre de liaison entre loci, on peut estimer le moment où des événements de croisement (crossovers) ont eu lieu, ce qui permet de dater les événements démographiques.
Outils : PSMC, MSMC, SMC++
5. Exemples d’applications
-
Origine des populations humaines : Les études basées sur le génome humain ont permis de détecter des goulots d’étranglement lors de la sortie d’Afrique, des flux de gènes avec les Néandertaliens et des expansions démographiques récentes.
-
Domestication des plantes et des animaux : L’analyse génétique des espèces domestiquées permet de dater leur domestication et de suivre les migrations humaines.
-
Conservation de la biodiversité : La détection d’événements démographiques récents permet de déterminer si une population est en déclin et d’adapter les plans de gestion.
6. Limites et défis
-
La qualité des inférences dépend de la qualité des données et de la représentativité des échantillons
-
Les modèles sont souvent simplifiés et ne tiennent pas compte de toutes les complexités biologiques (sélection, structure spatiale fine)
-
Le choix du modèle peut fortement influencer les résultats
-
Certains événements démographiques anciens peuvent laisser des signatures génétiques similaires, rendant leur distinction difficile
Conclusion
L’inférence démographique par les données génétiques est une approche puissante pour explorer l’histoire évolutive des espèces. Elle fournit des informations cruciales sur les dynamiques passées des populations, leurs migrations, leurs interactions, et leurs réponses aux changements environnementaux. Grâce aux nouvelles technologies et à l’amélioration des modèles statistiques, ces méthodes jouent un rôle croissant en génomique évolutive, en conservation de la biodiversité et en anthropologie génétique.