Chatbots de IA Mostram Resultados Mistos em Aplicações Médicas, Revela Estudo
Estudos recentes revelam que chatbots de IA enfrentam desafios significativos em aplicações médicas, com um estudo mostrando que o ChatGPT Health sub-triou 51,6% dos casos de emergência. Pacientes com câncer usando um chatbot de IA tiveram taxas de desistência de 22% devido a problemas de usabilidade, enquanto pesquisadores médicos mostram adoção cautelosa com 40,3% relatando uso de IA em pesquisas.
Chatbots alimentados por IA estão mostrando tanto promessa quanto limitações significativas em aplicações médicas, de acordo com pesquisas recentes que examinam seu uso em cuidados oncológicos, triagem de emergência e pesquisa médica. Os primeiros achados de múltiplos estudos revelam desafios de usabilidade, preocupações com precisão e desempenho inconsistente que levantam questões sobre sua prontidão para implementação clínica generalizada.
No estudo CAM 2.0 envolvendo 73 pacientes com câncer submetidos a quimiorradioterapia, pesquisadores testaram se o monitoramento contínuo de atividade digitalmente habilitado combinado com IA poderia agilizar o monitoramento de sintomas. Os pacientes foram randomicamente designados para receber um monitor de atividade disponível comercialmente ou o mesmo monitor combinado com um chatbot alimentado por IA chamado "Penny" que fornecia suporte via mensagens de texto. Os primeiros achados indicam que pacientes no grupo de intervenção experimentaram dificuldades usando o chatbot alimentado por IA, levando a uma taxa significativa de desistência de 22%. Alguns pacientes solicitaram contato direto com um membro de sua equipe de cuidados, mesmo quando suas preocupações já haviam sido abordadas através do processo de triagem digital. Esses desafios parecem ter afetado os fluxos de trabalho clínicos, introduzindo tarefas adicionais e inesperadas, ajudando pacientes a navegar pelo chatbot e verificando a precisão dos alertas sinalizados.
Um estudo separado publicado na Nature Medicine testou a capacidade do ChatGPT Health de triar casos médicos baseados em cenários da vida real. Pesquisadores alimentaram 60 cenários médicos ao ChatGPT Health e compararam suas respostas com as de três médicos que também revisaram os cenários. Os pesquisadores descobriram que o ChatGPT Health "sub-triou" 51,6% dos casos de emergência, significando que, em vez de recomendar que o paciente fosse ao pronto-socorro, o bot recomendou ver um médico dentro de 24 a 48 horas. As emergências incluíam um paciente com uma complicação com risco de vida do diabetes chamada cetoacidose diabética e um paciente entrando em insuficiência respiratória. Em casos como insuficiência respiratória iminente, o bot parecia estar "esperando que a emergência se tornasse inegável" antes de recomendar o pronto-socorro. Emergências como AVC, com sintomas inconfundíveis, foram corretamente triadas 100% do tempo.
Comparado com os médicos no estudo, o bot também super-triou 64,8% dos casos não urgentes, recomendando uma consulta médica quando não era necessária. O bot disse a um paciente com dor de garganta de três dias para ver um médico em 24 a 48 horas, quando cuidados em casa eram suficientes. Em cenários de ideação suicida ou automutilação, a resposta do bot foi inconsistente. Quando um usuário expressa intenção suicida, o ChatGPT deve encaminhar usuários para o 988, a linha direta de suicídio e crise. No estudo, no entanto, o ChatGPT Health encaminhou usuários para o 988 quando não precisavam, e não encaminhou quando necessário.
Uma pesquisa transversal internacional publicada em janeiro de 2026 no Cureus avaliou o uso e percepções de chatbots de IA entre 434 pesquisadores médicos. Dos participantes, 175 (40,3%) relataram usar chatbots de IA em suas pesquisas. O uso variou por país (32,8%-45,9%), e nem gênero nem país foram significativamente associados ao uso. Idade mais avançada e cargos mais seniores foram associados com menores chances de uso, com odds ratios mostrando idades de 41-50 anos em 0,32, residentes em 0,31 e consultores em 0,17. Conscientização previu fortemente o uso com um odds ratio de 15,53, assim como conscientização sobre diretrizes com um odds ratio de 2,47.
A pesquisa concluiu que pesquisadores médicos têm uma atitude positiva em relação ao uso de chatbots de IA, mas preocupações éticas e de precisão exigem intervenções adicionais para criar regras sistemáticas e unificadas. Embora existam diretrizes para o uso de chatbots de IA em pesquisa, a aceitação varia entre editores: Springer Nature e Science rejeitam o ChatGPT como coautor, enquanto muitos periódicos da Elsevier permitem seu uso divulgado. Estudos mostraram que o ChatGPT produz escrita coerente com baixo plágio, mas enfrenta desafios com precisão, referências fabricadas e preocupações éticas.
Um porta-voz da OpenAI disse que a empresa acolhe pesquisas que examinam o uso de IA na saúde, mas disse que o novo estudo não reflete como o ChatGPT Health é tipicamente usado ou como foi projetado para funcionar. O chatbot foi projetado para que as pessoas façam perguntas de acompanhamento para dar mais contexto em situações médicas, em vez de dar uma única resposta a um cenário médico. O ChatGPT Health está disponível apenas para um número limitado de usuários, e a OpenAI ainda está trabalhando para melhorar a segurança e confiabilidade do modelo antes que o chatbot seja disponibilizado mais amplamente.
Ferramentas digitais oferecem novas oportunidades para a detecção precoce e gerenciamento de toxicidades relacionadas ao tratamento durante a terapia sistêmica do câncer, potencialmente contribuindo para melhor funcionamento físico, melhor qualidade de vida e menos hospitalizações. Embora essas tecnologias possam apoiar pacientes ao longo de sua jornada e ajudar clínicos a ajustar os cuidados, sua integração em ambientes do mundo real apresenta vários desafios, incluindo desigualdades digitais e carga adicional para profissionais de saúde.