El diseño de proteínas con AI finalmente llega al laboratorio húmedo

El diseño de proteínas con AI (AI protein design) ha superado la etapa en la que cada avance residía en un gráfico de referencia. El cambio más interesante ahora es práctico: los modelos computacionales (computational models) finalmente están empezando a sobrevivir al contacto con el laboratorio húmedo (wet lab). Esto es importante porque el descubrimiento de fármacos (drug discovery) nunca ha carecido de predicciones inteligentes. Ha sufrido la brutal erosión que ocurre cuando las elegantes ideas in silico se encuentran con la biología desordenada, la síntesis costosa y la realidad experimental.
La nueva historia en ciencia y biotecnología (biotech) no es que la AI pueda imaginar nuevas proteínas. Es que un número creciente de grupos de investigación y empresas están construyendo sistemas que cierran el ciclo entre la salida del modelo, la síntesis, el ensayo (assay) y el rediseño. Ese ciclo de retroalimentación es donde el diseño de proteínas (protein design) deja de ser una demostración y comienza a parecerse a una infraestructura para terapias (therapeutics), ingeniería de enzimas (enzyme engineering) y diagnósticos.
El diseño de proteínas abandona la era de las tablas de clasificación
Durante los últimos años, la AI en biología ha estado dominada por unas pocas capacidades destacadas. AlphaFold hizo que la predicción de la estructura de proteínas (protein structure prediction) fuera mucho más útil. Los modelos de lenguaje de proteínas (protein language models) mostraron que los datos de secuencia podían tratarse un poco como el lenguaje natural. Luego, los sistemas generativos (generative systems) prometieron diseñar proteínas completamente nuevas con propiedades deseadas. Estos desarrollos fueron reales, pero también fomentaron un modo de fallo familiar: el campo se volvió muy bueno celebrando el rendimiento del modelo antes de prestar suficiente atención a si una proteína propuesta podía realmente expresarse, plegarse y validarse en el laboratorio.
Esa preocupación es la razón por la que el momento actual se siente más sustancial. Informes recientes y trabajos publicados apuntan a una transición más amplia de la evaluación centrada en los puntos de referencia a la validación experimental (experimental validation). Drug Target Review destacó recientemente un grupo de estudios de 2026 donde las moléculas diseñadas con AI (AI-designed molecules) y las herramientas biológicas no solo se generaron computacionalmente, sino que también se probaron en entornos preclínicos (preclinical settings). Esto puede sonar incremental, pero cambia el estándar de la evidencia. Un modelo ya no se juzga solo por si predice un candidato prometedor. Se juzga por si el candidato sobrevive a la síntesis, se une como se esperaba y produce un efecto biológico medible.
Una vez que eso se convierte en el estándar, la economía del campo comienza a cambiar. Un modelo que ahorra semanas de cribado pero aún produce candidatos de baja calidad es menos interesante que un modelo que reduce el espacio de búsqueda mientras preserva las tasas de éxito experimental (experimental hit rates). En el descubrimiento de fármacos (drug discovery), el objetivo no es tener más moléculas plausibles en una diapositiva. Es tener menos callejones sin salida costosos.
Los objetivos más difíciles son lo que hace esto interesante
Una razón por la que el diseño de proteínas (protein design) ha atraído tanta atención es que la biología todavía contiene grandes regiones de oscuridad terapéutica (therapeutic darkness). Muchas proteínas relevantes para enfermedades son difíciles de atacar porque no presentan sitios de unión estables y bien comportados (stable, well-behaved binding pockets). Las regiones intrínsecamente desordenadas (Intrinsically disordered regions) son un ejemplo clásico. Son importantes en el cáncer y las enfermedades neurodegenerativas (neurodegenerative disease), pero sus estructuras flexibles y cambiantes las hacen poco adecuadas para el descubrimiento tradicional de moléculas pequeñas (traditional small-molecule discovery).
Por eso el reciente trabajo del laboratorio de David Baker (David Baker’s lab) atrajo tanta atención. Como cubrió Chemistry World, el equipo utilizó un enfoque de diseño generativo (generative design approach) llamado logos para crear ligantes (binders) para regiones de proteínas desordenadas (disordered protein regions) que durante mucho tiempo habían sido tratadas como efectivamente inabordables farmacológicamente (undruggable). Los números reportados fueron sorprendentes: 39 ligantes fuertes (tight binders) de 43 objetivos probados. Más importante que la proporción, sin embargo, fue lo que implicaba. Si el diseño guiado por AI (AI-guided design) puede generar ligantes para objetivos móviles y estructuralmente ambiguos, entonces expande la clase de proteínas que los investigadores pueden perseguir razonablemente en lugar de solo optimizar los mismos objetivos tratables que todos los demás ya están persiguiendo.
Aquí es donde la AI se vuelve científicamente valiosa en lugar de meramente eficiente operativamente. Ayuda a los biólogos a explorar regiones del espacio de diseño molecular (molecular design space) que antes eran demasiado caras, demasiado inciertas o demasiado intensivas en mano de obra para buscar con métodos convencionales.
Las herramientas de diseño son cada vez más utilizables por los biólogos en activo
Otro cambio subestimado es la usabilidad. Un gran modelo de proteínas tiene un impacto limitado si solo un pequeño grupo de especialistas en machine learning puede operarlo. El MIT perfiló recientemente OpenProtein.AI, una empresa fundada por investigadores con raíces en el MIT que está tratando de hacer que las herramientas avanzadas de diseño de proteínas (protein-design tooling) sean accesibles a través de una interfaz sin código (no-code interface). Eso es más importante de lo que parece. En la mayoría de las organizaciones de ciencias de la vida, el cuello de botella no es solo la calidad del modelo. Es la capa de traducción entre los métodos computacionales (computational methods) y las personas que realmente realizan los experimentos.
Cuando los ingenieros de proteínas (protein engineers) pueden cargar datos, comparar candidatos y ajustar flujos de trabajo (workflows) sin construir pipelines de ML personalizados (custom ML pipelines) desde cero, la adopción se ve muy diferente. La plataformización de estas herramientas podría hacer por la biología computacional (computational biology) lo que la infraestructura en la nube hizo por las startups de software: reducir la energía de activación necesaria para intentar cosas ambiciosas.
También hay una consecuencia estratégica aquí. Los mejores sistemas de AI biológica (biological AI systems) pueden no ser los que tienen los modelos brutos más llamativos. Pueden ser los que integran el acceso al modelo, el seguimiento de experimentos, la retroalimentación de ensayos (assay feedback) y los flujos de trabajo de colaboración en un único entorno en el que los equipos de laboratorio húmedo (wet-lab teams) puedan confiar. En otras palabras, la ventaja competitiva puede residir cada vez más en el ciclo de diseño-construcción-prueba (design-build-test cycle) en lugar de solo en el punto de control del modelo (model checkpoint).
Las farmacéuticas tratan la IA como maquinaria de pipeline, no como un proyecto secundario
Las grandes compañías farmacéuticas se han vuelto más explícitas sobre este cambio. AstraZeneca, por ejemplo, dijo a finales de 2025 que más del 90 por ciento de su pipeline de descubrimiento de moléculas pequeñas (small-molecule discovery pipeline) está asistido por AI, al tiempo que impulsa la AI más profundamente en el diseño de productos biológicos (biologics) y péptidos (peptide design). Su trabajo MapDiff sobre el plegamiento inverso de proteínas (inverse protein folding) refleja un movimiento más amplio de la industria: usar la AI no como un experimento de laboratorio de innovación separado, sino como una capa incrustada en todo el descubrimiento y diseño.
Esa integración importa porque la mayoría de los ciclos de hype de la biotecnología (biotech hype cycles) colapsan en el punto de entrega. Un modelo impresiona en un artículo, pero nunca se convierte en parte de un sistema operativo duradero para los equipos de investigación. Cuando una importante compañía farmacéutica comienza a describir la AI como parte de la maquinaria de descubrimiento rutinaria, sugiere que el campo está madurando de un éxito técnico aislado a un cambio de proceso.
También revela lo que realmente les importa a las empresas. Quieren sistemas que mejoren la identificación de éxitos (hit identification), ayuden a optimizar candidatos más rápido, reduzcan el desperdicio de ensayos (assay waste) y aumenten las probabilidades de que los programas que ingresan al trabajo preclínico (preclinical work) tengan una evidencia subyacente más sólida. En la práctica, las herramientas ganadoras serán las que mejoren las decisiones de cartera (portfolio decisions), no solo la estética de las proteínas.
Lo que todavía se interpone en el camino
Nada de esto significa que el diseño de proteínas con AI (AI protein design) esté resuelto. La biología sigue siendo implacable. Los datos de entrenamiento (Training data) son desiguales, las condiciones de ensayo (assay conditions) varían y muchos rasgos deseables son difíciles de optimizar simultáneamente. Un candidato puede unirse bien y aun así fallar debido a la fabricabilidad (manufacturability), la estabilidad (stability), la inmunogenicidad (immunogenicity), la toxicidad (toxicity) o un comportamiento débil in vivo. El laboratorio húmedo (wet lab) sigue siendo donde el optimismo va a ser auditado.
También existe el riesgo de que el campo corrija en exceso hacia un nuevo tipo de hype. La validación experimental (experimental validation) es mejor que los puntos de referencia sintéticos (synthetic benchmarks), pero unos pocos estudios de caso sólidos no son lo mismo que una fiabilidad amplia y repetible en todas las clases de objetivos. Los científicos aún deben hacer preguntas difíciles sobre la especificidad (specificity), la reproducibilidad (reproducibility) y qué tan bien se generalizan estos modelos más allá de las demostraciones cuidadosamente elegidas.
Y luego está el cuello de botella práctico de la generación de datos. La próxima ventaja puede provenir de organizaciones que puedan conectar la experimentación automatizada (automated experimentation), el cribado de alto rendimiento (high-throughput screening) y la captura de retroalimentación rica a sus modelos de diseño. En la ingeniería de proteínas (protein engineering), los buenos modelos importan. Los buenos bucles importan más.
Por qué este campo es importante ahora
La razón para observar el diseño de proteínas con AI (AI protein design) en 2026 no es que vaya a eliminar mágicamente el costo y la complejidad del descubrimiento de fármacos (drug discovery). No lo hará. La razón para observarlo es que la disciplina finalmente está convergiendo en la pregunta correcta: ¿puede la AI ayudar a los científicos a producir moléculas que funcionen en el mundo, no solo en papel?
Eso suena modesto, pero es exactamente la ambición correcta. Si la respuesta sigue tendiendo hacia el sí, el efecto podría ser sustancial. Los investigadores obtienen ciclos de iteración más rápidos. Equipos más pequeños pueden perseguir objetivos más difíciles. Los programas de fármacos que antes requerían años de búsqueda a ciegas pueden comenzar con mejores priors. Y el límite entre el diseño computacional (computational design) y la biología experimental (experimental biology) se vuelve menos rígido cada año.
El laboratorio húmedo (wet lab) sigue siendo el juez final. Lo que ha cambiado es que la AI se está convirtiendo en un testigo más creíble.