Markov Biosciences, una startup con sede en San Francisco, defiende que la biología está a las puertas de su propio 'momento GPT'. Su fundador, Adam Green, sostiene que el campo de las células virtuales ha invertido excesamente en costosos datos de perturbación experimental, cuando lo que realmente limita el avance es el cómputo y la función de pérdida del modelo. La compañía se inspira en la 'bitter lesson' de Richard Sutton: grandes conjuntos de datos no sesgados y el objetivo de entrenamiento adecuado suelen superar a los modelos repletos de reglas codificadas a mano y conocimiento previo humano.
El artículo describe el enfoque técnico de Markov: tratar los datos de secuenciación de ARN de célula única (scRNA-seq) como un problema de ordenamiento en lugar de recuentos brutos, una idea rastreable hasta un artículo de psicofísica de 1927. Empleando 'ranking generativo' basado en el modelo geométrico de Plackett-Luce, entrenan células virtuales con datos observacionales ordinarios. El resultado, según Green, son leyes de escalado limpias: a medida que los modelos crecen, mejoran de forma monótona al predecir perturbaciones no vistas, superando a un modelo de referencia construido específicamente para esa tarea.
Como primera predicción prospectiva con relevancia clínica, Markov publicó un análisis sobre conjugados anticuerpo-fármaco (ADCs) en oncología —la modalidad más caliente del momento, con cientos de ensayos en marcha— aplicados al receptor TROP2. Su modelo predice que la internalización del complejo depende de la co-localización con una tetraspanina concreta, lo que explicaría las diferencias farmacocinéticas entre Datroway (AstraZeneca) y Trodelvy (Gilead). Es una hipótesis falsificable, susceptible de验证 experimental y, según Green, el primer caso de predicción clínica prospectiva generada por una célula virtual.
