Optimización de candidatos: el punto donde los fármacos triumfan o fracasan

Fuentes: An idiot’s guide to lead optimisation for proteins
Optimización de candidatos: el punto donde los fármacos triumfan o fracasan
Imagen generada con IA

La optimización de candidatos (lead optimisation) es una etapa crítica en el diseño de fármacos donde se toma una molécula que funciona parcialmente y se busca mejorar su rendimiento para que sea realmente efectiva. Este proceso representa el punto donde muchas campañas de diseñotriunfan o fracasan en la práctica.

Las proteínas son cadenas formadas por 20 tipos diferentes de aminoácidos, representados como cadenas de caracteres donde cada letra corresponde a un aminoácido específico. Por ejemplo, la mioglobina (que transporta oxígeno en nuestras células) se representa como una secuencia de cientos de letras. Estas cadenas se pliegan en formas tridimensionales específicas que les permiten realizar funciones biológicas. Predecir esta forma a partir de la secuencia es un problema extremadamente complejo que AlphaFold2 resolvió parcialmente, ganando el Premio Nobel de Química.

La optimización de candidatos implica proponer cambios a una molécula inicial, probarlos en el laboratorio y repetir el ciclo hasta lograr el rendimiento deseado. El método tradicional es la evolución directa, que introduce mutaciones aleatorias de forma iterativa. Sin embargo, con grandes bases de datos de proteínas y el aprendizaje profundo, se pueden obtener mejores resultados.

Cradle, una startup de biotecnología, desarrolló un sistema de optimización basado en aprendizaje automático que usa un modelo de lenguaje proteico transformer. Este modelo se pre-entrena con decenas de millones de secuencias naturales para aprender las características de proteínas funcionales. El proceso de entrenamiento usa "masked language modelling", donde se oculta un aminoácido y el modelo debe predecir cuál falta basándose en el contexto de los demás residuos. Este enfoque genera distribuciones de probabilidad sobre los aminoácidos posibles en cada posición.

El sistema de Cradle destaca por operar su propio laboratorio húmedo, lo que permite integrar rápidamente las sugerencias del modelo con retroalimentación experimental. Han demostrado resultados impresionantes en colaboración con grandes farmacéuticas como Novo Nordisk, Bayer y Johnson & Johnson.

Entre las consideraciones importantes está que la función de una proteína rara vez se puede resumir en una sola propiedad: generalmente hay múltiples objetivos que pueden entrar en conflicto. Además, aunque los modelos de lenguaje proteico aprenden patrones útiles de proteínas naturales, predecir completamente cómo afectará un cambio a la función sigue siendo un desafío.