Engenheiros do MIT usam IA para otimizar produção de proteínas em levedura industrial

Engenheiros químicos do MIT utilizaram um modelo de linguagem de grande escala para otimizar a produção de proteínas em levedura industrial. O modelo de IA melhorou o rendimento de cinco das seis proteínas testadas, incluindo um anticorpo monoclonal contra o câncer, o que pode reduzir os custos de desenvolvimento de medicamentos.

Engenheiros químicos do MIT utilizaram inteligência artificial para otimizar o desenvolvimento de novos processos de fabricação de proteínas em levedura industrial, o que pode reduzir os custos totais de desenvolvimento e produção de biofármacos.

Usando um modelo de linguagem de grande escala (LLM), a equipe do MIT analisou o código genético da levedura industrial Komagataella phaffii — especificamente, os códons que ela utiliza. Existem múltiplos códons possíveis, ou sequências de DNA de três letras, que podem ser usados para codificar um determinado aminoácido, e os padrões de uso de códons são diferentes para cada organismo.

O novo modelo do MIT aprendeu esses padrões para K. phaffii e, em seguida, os utilizou para prever quais códons funcionariam melhor para fabricar uma determinada proteína. Isso permitiu que os pesquisadores aumentassem a eficiência da produção da levedura para seis proteínas diferentes, incluindo o hormônio do crescimento humano e um anticorpo monoclonal usado no tratamento do câncer.

Leveduras como K. phaffii e Saccharomyces cerevisiae (levedura de pão) são os cavalos de batalha da indústria biofarmacêutica, produzindo bilhões de dólares em medicamentos proteicos e vacinas todos os anos. Para engenheirar a levedura para a produção industrial de proteínas, os pesquisadores pegam um gene de outro organismo, como o gene da insulina, e o modificam para que o microrganismo o produza em grandes quantidades. Isso requer a criação de uma sequência de DNA ideal para as células de levedura, sua integração no genoma da levedura, o desenvolvimento de condições favoráveis de crescimento e, finalmente, a purificação do produto final.

Para novos medicamentos biológicos — fármacos grandes e complexos produzidos por organismos vivos — esse processo de desenvolvimento pode representar de 15 a 20% do custo total de comercialização do medicamento.

A equipe do MIT utilizou um tipo de modelo de linguagem de grande escala conhecido como codificador-decodificador. Em vez de analisar texto, os pesquisadores o utilizaram para analisar sequências de DNA e aprender as relações entre os códons usados em genes específicos. Seus dados de treinamento, provenientes de um conjunto de dados públicos do National Center for Biotechnology Information, consistiam nas sequências de aminoácidos e nas sequências de DNA correspondentes de todas as aproximadamente 5.000 proteínas produzidas naturalmente por K. phaffii.

"O modelo aprende a sintaxe ou a linguagem de como esses códons são usados", disse o autor sênior do estudo, professor de engenharia química do MIT e membro do Koch Institute for Integrative Cancer Research. "Ele leva em consideração como os códons são colocados uns ao lado dos outros, bem como as relações de longa distância entre eles."

Uma vez treinado o modelo, os pesquisadores solicitaram que ele otimizasse as sequências de códons de seis proteínas diferentes, incluindo o hormônio do crescimento humano, a albumina sérica humana e o trastuzumabe, um anticorpo monoclonal usado no tratamento do câncer. Eles também geraram sequências otimizadas dessas proteínas usando quatro ferramentas comerciais de otimização de códons. Os pesquisadores inseriram cada uma dessas sequências em células de K. phaffii e mediram quanto da proteína alvo cada sequência gerava. Para cinco das seis proteínas, as sequências do novo modelo do MIT funcionaram melhor.

O estudo aparece esta semana na Proceedings of the National Academy of Sciences.

Related Entities

Related Articles

References

  1. Oncotelic Therapeutics Advances Toward Commercial Launch of AI-Enabled Robotics ... - BioSpace · biospace.com
  2. Harnessing AI to optimize the development of new protein manufacturing processes · news-medical.net
  3. Walid Kamoun: AI's Power to Lower Costs while Elucidating Tumor Progression - Oncodaily · oncodaily.com