Conception de Protéines par AI et Labo Humide : Impact Réel en Découverte de Médicaments

La conception de protéines par AI (AI protein design) a dépassé le stade où chaque percée se limitait à un graphique de référence. Le changement le plus intéressant est désormais pratique : les modèles computationnels (computational models) commencent enfin à survivre au contact du laboratoire humide (wet lab). Cela est important car la découverte de médicaments (drug discovery) n'a jamais souffert d'un manque de prédictions astucieuses. Elle a souffert de l'attrition brutale qui se produit lorsque des idées élégantes in silico rencontrent une biologie désordonnée, une synthèse coûteuse et la réalité expérimentale.

La nouvelle histoire en science et biotechnologie (biotech) n'est pas que l'AI puisse imaginer de nouvelles protéines. C'est qu'un nombre croissant de groupes de recherche et d'entreprises construisent des systèmes qui bouclent la boucle entre la sortie du modèle, la synthèse, l'essai (assay) et la reconception. Ce cycle de rétroaction est l'endroit où la conception de protéines (protein design) cesse d'être une démonstration et commence à ressembler à une infrastructure pour les thérapies (therapeutics), l'ingénierie enzymatique (enzyme engineering) et les diagnostics.

La conception de protéines quitte l'ère des classements

Au cours des dernières années, l'AI en biologie a été dominée par quelques capacités phares. AlphaFold a rendu la prédiction de la structure des protéines (protein structure prediction) beaucoup plus utile. Les modèles de langage de protéines (protein language models) ont montré que les données de séquence pouvaient être traitées un peu comme le langage naturel. Les systèmes génératifs (generative systems) ont ensuite promis de concevoir des protéines entièrement nouvelles avec les propriétés souhaitées. Ces développements étaient réels, mais ils ont également encouragé un mode d'échec familier : le domaine est devenu très doué pour célébrer les performances des modèles avant de prêter suffisamment attention à la question de savoir si une protéine proposée pouvait réellement être exprimée, repliée et validée en laboratoire.

Cette préoccupation explique pourquoi le moment actuel semble plus substantiel. Des rapports récents et des travaux publiés indiquent une transition plus large de l'évaluation axée sur les bancs d'essai (benchmark-centric evaluation) à la validation expérimentale (experimental validation). Drug Target Review a récemment mis en lumière un ensemble d'études de 2026 où des molécules conçues par AI (AI-designed molecules) et des outils biologiques ont non seulement été générés par calcul, mais aussi testés dans des contextes précliniques (preclinical settings). Cela peut sembler incrémental, mais cela modifie le standard de preuve. Un modèle n'est plus jugé uniquement sur sa capacité à prédire un candidat prometteur. Il est jugé sur la capacité du candidat à survivre à la synthèse, à se lier comme prévu et à produire un effet biologique mesurable.

Une fois que cela devient la norme, l'économie du domaine commence à changer. Un modèle qui économise des semaines de criblage mais produit toujours des candidats de faible qualité est moins intéressant qu'un modèle qui réduit l'espace de recherche tout en préservant les taux de réussite expérimentaux (experimental hit rates). Dans la découverte de médicaments (drug discovery), l'objectif n'est pas d'avoir plus de molécules plausibles sur une lame. C'est d'avoir moins d'impasses coûteuses.

Les cibles les plus difficiles sont ce qui rend cela intéressant

Une raison pour laquelle la conception de protéines (protein design) a attiré tant d'attention est que la biologie contient encore de vastes régions d'obscurité thérapeutique (therapeutic darkness). De nombreuses protéines pertinentes pour les maladies sont difficiles à cibler car elles ne présentent pas de poches de liaison stables et bien définies (stable, well-behaved binding pockets). Les régions intrinsèquement désordonnées (Intrinsically disordered regions) en sont un exemple classique. Elles sont importantes dans le cancer et les maladies neurodégénératives (neurodegenerative disease), mais leurs structures flexibles et changeantes les rendent peu adaptées à la découverte traditionnelle de petites molécules (traditional small-molecule discovery).

C'est pourquoi les récents travaux du laboratoire de David Baker (David Baker’s lab) ont attiré tant d'attention. Comme l'a rapporté Chemistry World, l'équipe a utilisé une approche de conception générative (generative design approach) appelée logos pour créer des liants (binders) pour des régions de protéines désordonnées (disordered protein regions) qui avaient longtemps été considérées comme effectivement non druggables (undruggable). Les chiffres rapportés étaient frappants : 39 liants forts (tight binders) sur 43 cibles testées. Plus important que le ratio, cependant, était ce que cela impliquait. Si la conception guidée par AI (AI-guided design) peut générer des liants pour des cibles mobiles et structurellement ambiguës, alors elle élargit la classe de protéines que les chercheurs peuvent raisonnablement poursuivre au lieu de simplement optimiser les mêmes cibles traitables que tout le monde poursuit déjà.

C'est là que l'AI devient scientifiquement précieuse plutôt que simplement efficace sur le plan opérationnel. Elle aide les biologistes à explorer des régions de l'espace de conception moléculaire (molecular design space) qui étaient auparavant trop coûteuses, trop incertaines ou trop laborieuses à rechercher avec des méthodes conventionnelles.

Les outils de conception deviennent utilisables par les biologistes en exercice

Un autre changement sous-estimé est l'utilisabilité. Un excellent modèle de protéines a un impact limité si seul un petit groupe de spécialistes en machine learning peut l'opérer. Le MIT a récemment présenté OpenProtein.AI, une entreprise fondée par des chercheurs issus du MIT qui s'efforce de rendre les outils avancés de conception de protéines (protein-design tooling) accessibles via une interface sans code (no-code interface). C'est un enjeu plus important qu'il n'y paraît. Dans la plupart des organisations des sciences de la vie, le goulot d'étranglement n'est pas seulement la qualité du modèle. C'est la couche de traduction entre les méthodes computationnelles (computational methods) et les personnes qui mènent réellement les expériences.

Lorsque les ingénieurs de protéines (protein engineers) peuvent télécharger des données, comparer des candidats et affiner des flux de travail (workflows) sans construire de pipelines ML personnalisés (custom ML pipelines) à partir de zéro, l'adoption semble très différente. La plateformisation de ces outils pourrait faire pour la biologie computationnelle (computational biology) ce que l'infrastructure cloud a fait pour les startups logicielles : réduire l'énergie d'activation nécessaire pour tenter des choses ambitieuses.

Il y a aussi une conséquence stratégique ici. Les meilleurs systèmes d'AI biologique (biological AI systems) ne seront peut-être pas ceux avec les modèles bruts les plus flashy. Ce pourraient être ceux qui intègrent l'accès au modèle, le suivi des expériences, le retour d'information des essais (assay feedback) et les flux de travail collaboratifs dans un environnement unique auquel les équipes de laboratoire humide (wet-lab teams) peuvent faire confiance. En d'autres termes, le fossé concurrentiel pourrait de plus en plus résider dans le cycle de conception-construction-test (design-build-test cycle) plutôt que dans le seul point de contrôle du modèle (model checkpoint).

L'industrie pharmaceutique traite l'IA comme un mécanisme de pipeline, non comme un projet annexe

Les grandes entreprises pharmaceutiques sont devenues plus explicites concernant ce changement. AstraZeneca, par exemple, a déclaré fin 2025 que plus de 90 % de son pipeline de découverte de petites molécules (small-molecule discovery pipeline) est assisté par AI, tout en poussant l'AI plus profondément dans la conception de produits biologiques (biologics) et de peptides (peptide design). Son travail MapDiff sur le repliement inverse des protéines (inverse protein folding) reflète un mouvement industriel plus large : utiliser l'AI non pas comme une expérience de laboratoire d'innovation séparée, mais comme une couche intégrée à travers la découverte et la conception.

Cette intégration est importante car la plupart des cycles de battage médiatique (hype cycles) de la biotechnologie (biotech) s'effondrent au point de transfert. Un modèle impressionne dans un article, mais il ne devient jamais une partie d'un système d'exploitation durable pour les équipes de recherche. Lorsqu'une grande entreprise pharmaceutique commence à décrire l'AI comme faisant partie de la machinerie de découverte de routine, cela suggère que le domaine est en train de passer d'un succès technique isolé à un changement de processus.

Cela révèle également ce qui intéresse réellement les entreprises. Elles veulent des systèmes qui améliorent l'identification des succès (hit identification), aident à optimiser les candidats plus rapidement, réduisent le gaspillage d'essais (assay waste) et augmentent les chances que les programmes entrant en phase préclinique (preclinical work) disposent de preuves sous-jacentes plus solides. En pratique, les outils gagnants seront ceux qui améliorent les décisions de portefeuille (portfolio decisions), et pas seulement l'esthétique des protéines.

Ce qui fait encore obstacle

Rien de tout cela ne signifie que la conception de protéines par AI (AI protein design) est résolue. La biologie reste impitoyable. Les données d'entraînement (Training data) sont inégales, les conditions d'essai (assay conditions) varient, et de nombreux traits souhaitables sont difficiles à optimiser simultanément. Un candidat peut bien se lier et échouer tout de même en raison de sa fabricabilité (manufacturability), de sa stabilité (stability), de son immunogénicité (immunogenicity), de sa toxicité (toxicity) ou d'un comportement faible in vivo. Le laboratoire humide (wet lab) est toujours l'endroit où l'optimisme est mis à l'épreuve.

Il existe également un risque que le domaine surcorrige vers un nouveau type de battage médiatique (hype). La validation expérimentale (experimental validation) est meilleure que les bancs d'essai synthétiques (synthetic benchmarks), mais quelques études de cas solides ne sont pas la même chose qu'une fiabilité large et reproductible à travers toutes les classes de cibles. Les scientifiques doivent encore poser des questions difficiles sur la spécificité (specificity), la reproductibilité (reproducibility) et la capacité de ces modèles à se généraliser au-delà des démonstrations soigneusement choisies.

Et puis il y a le goulot d'étranglement pratique de la génération de données. Le prochain avantage pourrait venir d'organisations capables de connecter l'expérimentation automatisée (automated experimentation), le criblage à haut débit (high-throughput screening) et la capture de rétroaction riche à leurs modèles de conception. En ingénierie des protéines (protein engineering), les bons modèles comptent. Les bonnes boucles comptent davantage.

Pourquoi ce domaine est important maintenant

La raison de suivre la conception de protéines par AI (AI protein design) en 2026 n'est pas qu'elle éliminera magiquement le coût et la complexité de la découverte de médicaments (drug discovery). Ce ne sera pas le cas. La raison de la suivre est que la discipline converge enfin vers la bonne question : l'AI peut-elle aider les scientifiques à produire des molécules qui fonctionnent dans le monde réel, et pas seulement sur papier ?

Cela semble modeste, mais c'est exactement la bonne ambition. Si la réponse continue de tendre vers l'affirmative, l'effet pourrait être substantiel. Les chercheurs obtiennent des cycles d'itération plus rapides. Des équipes plus petites peuvent poursuivre des cibles plus difficiles. Les programmes de médicaments qui nécessitaient autrefois des années de recherche à l'aveugle peuvent commencer avec de meilleures priors. Et la frontière entre la conception computationnelle (computational design) et la biologie expérimentale (experimental biology) devient moins rigide chaque année.

Le laboratoire humide (wet lab) reste le juge final. Ce qui a changé, c'est que l'AI devient un témoin plus crédible.

La conception de protéines par AI rencontre enfin le laboratoire humide