L’identification des virus inconnus est un défi majeur pour la recherche en virologie, la santé publique et la prévention des épidémies. Avec l’émergence régulière de nouveaux agents pathogènes viraux, comme le SARS-CoV-2, le virus Nipah ou d’autres virus zoonotiques, la capacité à détecter rapidement et précisément un virus encore non caractérisé est essentielle. Les méthodes de séquençage, et notamment le séquençage à haut débit, ont transformé la manière dont les scientifiques identifient, classifient et suivent les virus dans l’environnement, chez l’animal et chez l’homme. Cet article présente les principales techniques utilisées pour séquencer les virus inconnus et leur importance dans la surveillance et le diagnostic.
Pourquoi séquencer un virus inconnu ?
Lorsqu’un virus inconnu provoque une infection, les outils classiques comme la culture virale ou la PCR ciblée ne sont souvent pas suffisants. En l’absence d’information préalable sur sa structure ou son génome, seul le séquençage non ciblé permet d’obtenir une vue d’ensemble du matériel génétique présent dans un échantillon. Cela permet :
-
L’identification rapide du virus responsable
-
La découverte de nouveaux virus encore jamais décrits
-
L’analyse de l’évolution virale (mutations, recombinaisons)
-
La surveillance des variants ou des souches émergentes
-
Le développement de tests diagnostiques ciblés (PCR, anticorps, etc.)
Principales méthodes de séquençage utilisées
1. Séquençage Sanger
Méthode historique du séquençage d’ADN, mise au point dans les années 1970, le séquençage Sanger est très précis mais limité en débit. Il nécessite de connaître la région à amplifier (via des amorces spécifiques), ce qui le rend peu adapté à la détection de virus inconnus. Il reste toutefois utilisé pour la validation de résultats ou pour séquencer des fragments spécifiques.
2. Séquençage à haut débit (NGS)
Le séquençage de nouvelle génération (Next-Generation Sequencing, NGS) est devenu la méthode de référence pour l’identification des virus inconnus. Il permet de lire simultanément des millions de fragments d’ADN ou d’ARN présents dans un échantillon, offrant une vision complète et non biaisée du matériel génétique.
Les plateformes NGS les plus utilisées incluent Illumina, Ion Torrent ou BGI. Elles permettent de générer une quantité massive de données utilisables pour identifier les séquences virales par comparaison avec des bases de données.
3. Métagénomique virale
La métagénomique consiste à séquencer l’ensemble des acides nucléiques présents dans un échantillon biologique (sang, salive, fèces, environnement…). Cette approche non ciblée est idéale pour découvrir des virus inconnus. Elle repose sur plusieurs étapes :
-
Extraction de l’ADN et/ou ARN total
-
Élimination des séquences d’origine humaine ou bactérienne
-
Amplification et séquençage des acides nucléiques restants
-
Analyse bioinformatique pour identifier des séquences virales nouvelles ou connues
Elle a permis la découverte de nombreux virus dans les océans, les sols, ou chez des hôtes animaux inhabituels.
4. Séquençage d’ARN (RNA-seq)
Pour les virus à ARN (grippe, SARS-CoV-2, virus de la dengue…), il est nécessaire de convertir l’ARN en ADN complémentaire (ADNc) avant le séquençage. Le RNA-seq est particulièrement utile pour étudier les virus en phase de réplication active dans les cellules hôtes. Il permet aussi de repérer les ARN subgénomiques ou les variants d’épissage.
5. Nanopore sequencing (Oxford Nanopore)
La technologie Nanopore (ex. : MinION) permet un séquençage portable, rapide et en temps réel. Elle est particulièrement adaptée aux situations d’urgence sur le terrain (épidémies, zones isolées). Elle peut lire des fragments très longs, utile pour reconstituer des génomes viraux complets sans assemblage complexe. Bien que moins précise que le NGS classique, elle est précieuse pour une identification rapide de virus inconnus.
Étapes de l’identification d’un virus par séquençage
-
Collecte de l’échantillon (tissu, liquide biologique, échantillon environnemental)
-
Extraction de l’ARN ou ADN viral
-
Conversion ARN → ADNc (si virus à ARN)
-
Préparation de la librairie de séquençage (fragmentation, adaptation, amplification)
-
Séquençage sur la plateforme choisie
-
Analyse bioinformatique : nettoyage des données, suppression des séquences hôtes, assemblage, annotation, comparaison avec les bases de données virales (GenBank, NCBI, ViPR…)
-
Interprétation : identification de virus connus, mise en évidence de séquences nouvelles, recherche de variants
Avantages du séquençage pour l’identification virale
-
Non dépendant d’hypothèses : pas besoin de connaître le virus à l’avance
-
Haute sensibilité : détection de virus présents à faible abondance
-
Découverte de virus nouveaux : dont la séquence n’est pas référencée
-
Identification de co-infections virales
-
Étude complète du génome : mutations, recombinaisons, gènes accessoires
Limites et défis
-
Coût et complexité des plateformes de séquençage haut débit
-
Nécessité d’analyses bioinformatiques avancées
-
Contamination croisée possible lors de l’extraction ou du séquençage
-
Difficulté d’interprétation si la séquence virale est très éloignée de celles connues
-
Exigences en qualité d’échantillon : dégradation possible de l’ARN, faible charge virale
Cas emblématiques
-
SARS-CoV-2 : identifié en décembre 2019 grâce au séquençage métagénomique d’échantillons pulmonaires de patients à Wuhan
-
Virus de Schmallenberg : détecté en Europe chez le bétail par séquençage d’ARN inconnu
-
Découverte de centaines de virus océaniques par métagénomique marine, changeant notre vision de la diversité virale
Vers une virosphère encore inconnue
Les analyses métagénomiques ont révélé que la majorité des séquences virales détectées dans les écosystèmes ne correspondent à aucun virus connu. Cette « virosphère sombre » constitue un immense réservoir d’information génétique non encore caractérisée. De nombreux virus découverts n’infectent pas l’homme mais jouent un rôle dans l’équilibre microbien, la régulation des populations ou le transfert de gènes.
Conclusion
Les méthodes de séquençage, et en particulier le séquençage à haut débit et la métagénomique, ont révolutionné la capacité des chercheurs à identifier des virus inconnus. Ces outils permettent une détection rapide, sensible et sans a priori, essentielle pour répondre aux menaces sanitaires émergentes, comprendre la biodiversité virale et anticiper les futures pandémies. L’avenir de la virologie repose en grande partie sur l’amélioration de ces technologies et sur le développement d’outils bioinformatiques capables d’analyser l’immense complexité des données génétiques virales.