Des ingénieurs du MIT utilisent l'IA pour optimiser la production de protéines dans la levure industrielle

Des ingénieurs chimistes du MIT ont utilisé un grand modèle de langage pour optimiser la production de protéines dans la levure industrielle. Le modèle d'IA a amélioré les rendements pour cinq des six protéines testées, dont un anticorps monoclonal anticancéreux, ce qui pourrait réduire les coûts de développement des médicaments.

Des ingénieurs chimistes du MIT ont exploité l'intelligence artificielle pour optimiser le développement de nouveaux procédés de fabrication de protéines dans la levure industrielle, ce qui pourrait réduire les coûts globaux de développement et de fabrication des médicaments biopharmaceutiques.

À l'aide d'un grand modèle de langage (LLM), l'équipe du MIT a analysé le code génétique de la levure industrielle Komagataella phaffii — plus précisément, les codons qu'elle utilise. Il existe plusieurs codons possibles, ou séquences d'ADN de trois lettres, qui peuvent être utilisés pour coder un acide aminé particulier, et les schémas d'utilisation des codons sont différents pour chaque organisme.

Le nouveau modèle du MIT a appris ces schémas pour K. phaffii, puis les a utilisés pour prédire quels codons fonctionneraient le mieux pour fabriquer une protéine donnée. Cela a permis aux chercheurs d'augmenter l'efficacité de la production de six protéines différentes par la levure, notamment l'hormone de croissance humaine et un anticorps monoclonal utilisé pour traiter le cancer.

Des levures telles que K. phaffii et Saccharomyces cerevisiae (levure de boulanger) sont les chevaux de bataille de l'industrie biopharmaceutique, produisant chaque année des milliards de dollars de médicaments protéiques et de vaccins. Pour concevoir une levure destinée à la production industrielle de protéines, les chercheurs prélèvent un gène d'un autre organisme, comme le gène de l'insuline, et le modifient afin que le microbe le produise en grandes quantités. Cela nécessite de trouver une séquence d'ADN optimale pour les cellules de levure, de l'intégrer dans le génome de la levure, de concevoir des conditions de croissance favorables et enfin de purifier le produit final.

Pour les nouveaux médicaments biologiques — des médicaments volumineux et complexes produits par des organismes vivants — ce processus de développement peut représenter 15 à 20 % du coût total de commercialisation du médicament.

L'équipe du MIT a déployé un type de grand modèle de langage connu sous le nom d'encodeur-décodeur. Au lieu d'analyser du texte, les chercheurs l'ont utilisé pour analyser des séquences d'ADN et apprendre les relations entre les codons utilisés dans des gènes spécifiques. Leurs données d'entraînement, provenant d'un ensemble de données publiquement accessible du National Center for Biotechnology Information, comprenaient les séquences d'acides aminés et les séquences d'ADN correspondantes pour la totalité des quelque 5 000 protéines naturellement produites par K. phaffii.

« Le modèle apprend la syntaxe ou le langage de la manière dont ces codons sont utilisés », a déclaré l'auteur principal de l'étude, professeur de génie chimique au MIT et membre du Koch Institute for Integrative Cancer Research. « Il prend en compte la façon dont les codons sont placés les uns à côté des autres, ainsi que les relations à longue distance entre eux. »

Une fois le modèle entraîné, les chercheurs lui ont demandé d'optimiser les séquences de codons de six protéines différentes, notamment l'hormone de croissance humaine, l'albumine sérique humaine et le trastuzumab, un anticorps monoclonal utilisé pour traiter le cancer. Ils ont également généré des séquences optimisées de ces protéines à l'aide de quatre outils d'optimisation de codons disponibles dans le commerce. Les chercheurs ont inséré chacune de ces séquences dans des cellules de K. phaffii et mesuré la quantité de protéine cible générée par chaque séquence. Pour cinq des six protéines, les séquences issues du nouveau modèle du MIT ont donné les meilleurs résultats.

L'étude paraît cette semaine dans les Proceedings of the National Academy of Sciences.

Related Entities

Related Articles

References

  1. Oncotelic Therapeutics Advances Toward Commercial Launch of AI-Enabled Robotics ... - BioSpace · biospace.com
  2. Harnessing AI to optimize the development of new protein manufacturing processes · news-medical.net
  3. Walid Kamoun: AI's Power to Lower Costs while Elucidating Tumor Progression - Oncodaily · oncodaily.com