
Os modelos de células virtuais podem ajudar a prever como as células tumorais (foto) respondem a medicamentos experimentais. Crédito: Steve Gschmeissner/Science Photo Library
Se Stephen Quake conseguir o que quer, os biólogos no futuro gastarão muito menos tempo empunhando pipetas. “Nosso objetivo”, diz ele, “é criar ferramentas computacionais para que a biologia celular passasse de 90% experimental e 10% computacional e o contrário”.
Quake, chefe de ciência da Chan Zuckerberg Initiative (CZI) em Redwood City, Califórnia, está entre os pesquisadores que lideram uma acusação para criar células virtuais. Esses são modelos de inteligência artificial (IA) que podem gerar os tipos de insights que atualmente levam semanas de experimentos a responder – como como as células tumorais responderão a um medicamento específico.
“Será uma ferramenta muito poderosa para entender o que dá errado na doença”, diz Quake, que prevê que os cientistas usarão experimentos principalmente para validar previsões feitas por células virtuais.
Eu disse à AI para me tornar uma proteína. Aqui está o que surgiu
Os esforços para criar células virtuais estão em seus primeiros dias, mas a idéia atraiu intenso interesse nos laboratórios acadêmicos e da indústria em todo o mundo. A CZI, uma organização sem fins lucrativos que desenvolve conjuntos e ferramentas de dados abertos, planeja gastar centenas de milhões de dólares na criação de células virtuais na próxima década. O Google Deepmind, em Londres, também possui um projeto de células virtuais, disse seu executivo-chefe Demis Hassabis no início deste ano.
“Esta é uma tarefa gigantesca”, diz Jan Ellenberg, biólogo molecular do Science for Life Laboratory, uma organização nacional de pesquisa em Solna, Suécia. Ele está co-liderando o modelo de células virtuais do laboratório chamado Alpha Cell, que será lançado em 2026. “O que é possível agora e necessário agora é ter os primeiros projetos pioneiros que mostram isso, em princípio, trabalho”.
Mas alguns cientistas dizem que a pressa de desenvolver células virtuais-embora uma importante meta de longo prazo para a biologia-tenha muito hype, mas não muitos resultados concretos ou um caminho claro para o sucesso.
“Está sendo usado principalmente como um grito de guerra e um mecanismo de financiamento, e está funcionando”, diz Anshul Kundaje, biólogo computacional da Universidade de Stanford, na Califórnia. “Os investidores estão colocando uma enorme quantidade de financiamento nesse espaço”.
Bugs na máquina
Os biólogos usam computadores para modelar o comportamento celular há décadas. Em 2012, os cientistas criaram o primeiro modelo computacional de uma célula inteira, capturando o funcionamento interno das bactérias Mycoplasma genitaliumque tem apenas 525 genes1.
Mas esses e outros esforços iniciais “muitas vezes tentavam realmente construir um modelo mecanicista completo da célula”, diz Silvana Konermann, um biólogo computacional do Arc Institute em Palo Alto, Califórnia.
Por outro lado, o esforço atual para desenvolver células virtuais aproveita os avanços na IA que podem desenvolver representações sofisticadas de dados, como texto no caso de grandes modelos de idiomas, quando alimentados com vastas quantidades dele. “Construir modelos que aprendem com os dados são revolucionários”, diz Quake.
Cinco perguntas de design de proteínas que ainda desafiam ai
As ofertas precoces de células virtuais se concentraram amplamente em um tipo de dados: aqueles de experimentos que sequenciam todas as moléculas de RNA mensageiro em células individuais, totalizando um catálogo de atividade gênica e um instantâneo do estado atual da célula.
Esses dados formam a base de ‘atlas’ que mapeiam diferentes tipos de células entre humanos e outros organismos, revelando a diversidade subestimada. Os pesquisadores estão agora produzindo conjuntos de dados ‘sequenciamento de célula única’ para ajudar a alimentar suas células virtuais. A CZI planeja liberar dados de sequenciamento de um bilhão de células (expandindo um banco de dados de mais de 100 milhões) e, em fevereiro, o ARC divulgou dados de sequenciamento de 100 milhões de células cancerígenas tratadas com centenas de medicamentos.
Os dados de sequenciamento de célula única são atraentes, diz o biólogo de sistemas Hani Goodarzi no Instituto ARC, porque pode ser gerado de maneira acessível em uma escala semelhante à da qual grandes modelos de idiomas começam a obter recursos sofisticados-nas centenas de bilhões de pontos de dados.