Ingenieros del MIT utilizan IA para optimizar la producción de proteínas en levadura industrial

Ingenieros químicos del MIT utilizaron un modelo de lenguaje de gran tamaño para optimizar la producción de proteínas en levadura industrial. El modelo de IA mejoró los rendimientos de cinco de seis proteínas analizadas, incluido un anticuerpo monoclonal contra el cáncer, lo que podría reducir los costos de desarrollo de fármacos.

Ingenieros químicos del MIT han aprovechado la inteligencia artificial para optimizar el desarrollo de nuevos procesos de fabricación de proteínas en levadura industrial, lo que podría reducir los costos generales de desarrollo y producción de biofármacos.

Utilizando un modelo de lenguaje de gran tamaño (LLM, por sus siglas en inglés), el equipo del MIT analizó el código genético de la levadura industrial Komagataella phaffii — específicamente, los codones que utiliza. Existen múltiples codones posibles, o secuencias de ADN de tres letras, que pueden usarse para codificar un aminoácido en particular, y los patrones de uso de codones son diferentes para cada organismo.

El nuevo modelo del MIT aprendió esos patrones para K. phaffii y luego los utilizó para predecir qué codones funcionarían mejor para fabricar una proteína determinada. Esto permitió a los investigadores aumentar la eficiencia de la producción de seis proteínas diferentes en la levadura, incluida la hormona de crecimiento humana y un anticuerpo monoclonal utilizado para tratar el cáncer.

Levaduras como K. phaffii y Saccharomyces cerevisiae (levadura de panadería) son los caballos de batalla de la industria biofarmacéutica, produciendo cada año miles de millones de dólares en fármacos proteicos y vacunas. Para diseñar levaduras destinadas a la producción industrial de proteínas, los investigadores toman un gen de otro organismo, como el gen de la insulina, y lo modifican para que el microbio lo produzca en grandes cantidades. Esto requiere encontrar una secuencia de ADN óptima para las células de levadura, integrarla en el genoma de la levadura, diseñar condiciones de crecimiento favorables y, finalmente, purificar el producto final.

Para los nuevos fármacos biológicos — medicamentos grandes y complejos producidos por organismos vivos — este proceso de desarrollo puede representar entre el 15 y el 20 por ciento del costo total de comercialización del medicamento.

El equipo del MIT implementó un tipo de modelo de lenguaje de gran tamaño conocido como codificador-decodificador. En lugar de analizar texto, los investigadores lo utilizaron para analizar secuencias de ADN y aprender las relaciones entre los codones que se utilizan en genes específicos. Sus datos de entrenamiento, obtenidos de un conjunto de datos público del National Center for Biotechnology Information, consistieron en las secuencias de aminoácidos y las secuencias de ADN correspondientes de todas las aproximadamente 5,000 proteínas producidas naturalmente por K. phaffii.

"El modelo aprende la sintaxis o el lenguaje de cómo se utilizan estos codones", dijo el autor principal del estudio, profesor de ingeniería química en el MIT y miembro del Koch Institute for Integrative Cancer Research. "Tiene en cuenta cómo se colocan los codones uno al lado del otro, y también las relaciones de larga distancia entre ellos".

Una vez entrenado el modelo, los investigadores le pidieron que optimizara las secuencias de codones de seis proteínas diferentes, incluida la hormona de crecimiento humana, la albúmina sérica humana y el trastuzumab, un anticuerpo monoclonal utilizado para tratar el cáncer. También generaron secuencias optimizadas de estas proteínas utilizando cuatro herramientas comerciales de optimización de codones. Los investigadores insertaron cada una de estas secuencias en células de K. phaffii y midieron la cantidad de proteína diana que generaba cada secuencia. Para cinco de las seis proteínas, las secuencias del nuevo modelo del MIT funcionaron mejor.

El estudio aparece esta semana en la revista Proceedings of the National Academy of Sciences.

Related Entities

Related Articles

References

  1. Oncotelic Therapeutics Advances Toward Commercial Launch of AI-Enabled Robotics ... - BioSpace · biospace.com
  2. Harnessing AI to optimize the development of new protein manufacturing processes · news-medical.net
  3. Walid Kamoun: AI's Power to Lower Costs while Elucidating Tumor Progression - Oncodaily · oncodaily.com