

L'Institut Pasteur lance ABSD : la plus grande base ouverte mondiale de séquences d'anticorps

Une collaboration entre virologistes et bioinformaticiens de l'Institut Pasteur a récemment donné naissance à ABSD (AntiBody Sequence Database) : la base de séquences d’anticorps publique la plus exhaustive à ce jour. Elle centralise plus de 1 750 000 séquences d'anticorps provenant du monde entier, tout en éliminant les redondances.
Conçue comme une ressource évolutive et ouverte à la communauté scientifique internationale, ABSD s’inscrit dans la priorité scientifique 1 « Menaces infectieuses » du plan stratégique Pasteur 2030. Elle représente une avancée majeure pour accélérer la recherche sur les anticorps et approfondir la compréhension de leur diversité biologique.
Pourquoi cette base de données est-elle importante ?
Les anticorps constituent la première ligne de défense contre les infections virales et autres menaces sanitaires. Pour développer de nouveaux diagnostics et traitements, les chercheurs ont besoin d'accéder facilement à l'ensemble des données disponibles sur ces molécules.
Jusqu'à présent, ces informations étaient dispersées dans de multiples bases de données, souvent redondantes et difficiles à exploiter. Cette fragmentation représentait un obstacle majeur, notamment pour l'entraînement des modèles d'intelligence artificielle nécessitant des données standardisées et exhaustives.
Une solution innovante made in Pasteur
Bertrand Saunier, chercheur dans l’unité Virologie structurale, Simon Malesys, Rachel Torchet et Nicolas Maillet, bioinformaticien(ne)s au Hub de Bioinformatique et biostatistiques, ont uni leurs expertises pour créer cette nouvelle plateforme qui :
- Centralise les données de 15 bases internationales majeures (dont CATNAP-HIV, CoV-AbDab, GeneBank, IMGT, KABAT, OAS, PDB et UniProt),
- Standardise tous les formats de séquences pour faciliter leur utilisation,
- Élimine les doublons tout en préservant la traçabilité des sources,
- Se met à jour automatiquement et permet d’ajouter aisément de nouvelles ressources grâce à son architecture modulaire.
Des applications concrètes pour la recherche
ABSD vous servira d'outil de référence dans :
- Le développement de nouveaux tests diagnostiques
- La conception de thérapies par anticorps
- L'entraînement de modèles d'intelligence artificielle
- L'étude de la diversité immunitaire chez différentes espèces
Une validation scientifique rigoureuse
L'étude publiée dans Nucleic Acids Research - Genomics and Bioinformatics démontre que la méthodologie employée préserve la représentativité des séquences, sans introduire de biais dans la sélection. Cette validation garantit la fiabilité de la ressource pour l'ensemble des applications envisagées.