• The Conversation

Prix Nobel de chimie 2024 : design des protéines et prédiction de leurs structures, deux facettes d’une même médaille

Le prix Nobel de chimie 2024 récompense les travaux de David Baker, professeur à l’Université de Washinghton à Seattle, et ceux de Demis Hassabis et John Jumper, de DeepMind – une entité de Google connue du grand public pour le développement des logiciels d’intelligence artificielle AlphaGo (qui a battu le champion du monde de go en 2017) puis AlphaFold.

En travaillant sur les protéines grâce à des outils informatiques, ces trois chercheurs ont permis de mieux comprendre ces molécules indispensables à la vie.

Le prix Nobel de chimie 2024 est la reconnaissance de deux avancées spectaculaires en sciences des protéines – des molécules qui jouent un rôle crucial dans les processus cellulaires. Ainsi, comprendre comment les protéines interagissent est essentiel pour dévoiler les mécanismes qui gouvernent la vie, et permettre d’éclairer à l’avenir la susceptibilité aux maladies et leur gravité, tout en facilitant le déchiffrement des liens entre gènes, maladies et médicaments.

Les protéines sont des chaînes d’acides aminés qui se replient sur elles-mêmes. Ce qui est remarquable, c’est que la forme tridimensionnelle est codée dans la séquence des acides aminés. Cela signifie que nous devrions être capables de prédire cette structure tridimensionnelle à partir de la seule séquence des acides aminés. C’est là tout l’enjeu de la prédiction de la structure des protéines.

D’un autre côté, une fois la structure connue, on peut se demander si l’on peut trouver une séquence qui la produit : c’est ce qu’on appelle la conception ou design de protéines, c’est-à-dire la création de protéines totalement nouvelles et jamais vues dans la nature.

Ce prix Nobel met en lumière la puissance de la biologie computationnelle et les immenses possibilités qu’elle ouvre pour les sciences du vivant dans les années à venir.

La contribution de David Baker : concevoir des protéines jamais vues dans la nature

Le problème du design des protéines a été résolu par David Baker en 2003, avec la création de protéines jamais observées auparavant. Son logiciel, Rosetta, permet de concevoir une séquence qui correspond à une structure donnée.

Depuis, David Baker a ouvert un nouveau monde de structures protéiques inédites. Pour lui, l’objectif était de comprendre comment « maîtriser » les structures protéiques à travers la conception de protéines nouvelles et complexes, afin d’exploiter la nature à nos propres fins.

Exemples de nanoparticules faites de protéines nouvelles, conçues par David Baker et ses collègues. E.C. Yang et coll., Nature Structural & Molecular Biology, 31, 1404–1412 (2024)., CC BY

En combinant optimisation combinatoire, chimie et physique, Rosetta permet aujourd’hui aux scientifiques de concevoir des protéines aux formes et fonctions spectaculaires, jusque-là inconnues.

La contribution de Demis Hassabis et John Jumper : prédire la structure de protéines à partir de la séquence d’acides aminés

Demis Hassabis et John Jumper cherchaient, eux, à résoudre une question en suspens depuis des décennies : reconstruire une structure protéique à partir de sa séquence d’acides aminés. Ils ont réussi à décrypter le code des protéines, rendant possible la prédiction de la structure de presque toutes les protéines naturelles non désordonnées.

En 2020, ils ont présenté AlphaFold2, qui a atteint une précision d’environ 90 % par rapport aux structures cristallographiques connues, en accord avec les erreurs expérimentales lors de la détermination des structures.

Cette avancée spectaculaire a bouleversé le monde de la biologie : du jour au lendemain, la « bibliothèque de protéines » accessibles aux chercheurs est passée des 200 000 structures cristallographiques à 200 millions de modèles AlphaFold2, quasiment identiques aux structures des cristaux !

Désormais, un biologiste, virologue ou médecin peut soumettre une séquence d’acides aminés à AlphaFold2, et obtenir instantanément sa structure tridimensionnelle. Cette visualisation précise de la position des atomes permet d’analyser les points vulnérables d’une protéine lors de ses interactions, qui peuvent être exploités pour concevoir des médicaments bloquant ces interactions. Elle permet également d’identifier les résidus sensibles aux mutations futures, ainsi que ceux impliqués dans les interactions avec des partenaires moléculaires potentiels.

Ainsi, cela ouvre la voie à la découverte de nouvelles facettes, souvent inattendues, de la biologie d’un organisme, ainsi que des interactions entre différents organismes.

Un Nobel de chimie à la croisée de la biologie et de l’informatique

Ces deux avancées fondamentales pour la chimie et la biologie n’auraient pas été possibles sans la combinaison indispensable de plusieurs éléments : d’un côté l’abondance des séquences protéiques disponibles dans nos bases de données et le vaste nombre de structures cristallisées grâce au travail des biologistes expérimentateurs, et de l’autre grâce aux progrès de l’intelligence artificielle qui permet d’explorer d’immenses volumes de données et d’en déduire des informations complexes, de haute précision en se basant sur l’apprentissage profond et la technologie des GPU.

La moitié des protéines humaines sont désordonnées : elles se replient moins bien que les protéines structurées, mais restent très importantes pour les interactions au sein des cellules. Ici, le code couleur représente l’incertitude de prédiction de structure par AlphaFold2. Protéine ARX, base de données d’AlphaFold. Des mutations de cette protéine entraînent une déficience cognitive et de l’épilepsie, Fourni par l'auteur

Les prochaines étapes dans ce domaine complexe de la science des protéines consistent à décrypter leur fonction (c’est-à-dire comprendre ce qu’elles font lorsqu’elles interagissent), à explorer leur dynamique (c’est-à-dire la manière dont elles changent de forme pendant ces interactions), à étudier comment les protéines non structurées – pour lesquelles AlphaFold2 ne peut pas prédire de structure et qui représentent environ la moitié des protéines humaines – interagissent avec d’autres protéines ; et enfin, à concevoir des protéines dotées de nouvelles fonctions, en lien avec les avancées que la biologie synthétique nous apportera dans les années à venir.

Ces quatre grands défis sont au cœur des recherches actuelles, et leur résolution conduira à des percées majeures en biologie.

À l’avenir, les deux avancées reconnues par le prix Nobel de chimie 2024 s’articuleront avec ces nouvelles questions, permettant ainsi la reconstruction d’interactomes (des réseaux d’interaction entre des milliers de molécules – dont les protéines – dans une cellule ou un tissu biologique) à grande échelle, qu’ils soient entièrement nouveaux ou naturels, pour toute espèce, individu ou groupe d’organismes.


Alessandra Carbone, Professeur d'informatique et membre senior de l'Institut Universitaire de France, Sorbonne Université

Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire l’article original.