Crédito, Reuters

  • Author, Adrian Barnett e Nicole White
  • Role, The Conversation*

Suponha que você se sinta mal e decida consultar seu médico.

Você responde a algumas perguntas e faz um exame de sangue. Alguns dias depois, alguém liga para você e diz que você foi diagnosticado com uma doença específica.

Qual é a probabilidade de que você realmente tenha aquela doença? Bem, para alguns exames de diagnóstico comuns, a chance é surpreendentemente baixa.

Poucos exames médicos são 100% precisos. Parte da razão é que as pessoas são inerentemente diferentes entre si, mas muitos exames também são elaborados em amostras limitadas ou tendenciosas — e o nosso próprio trabalho demonstrou que os pesquisadores podem superestimar deliberadamente a eficácia dos novos testes.

Nada disso significa que devemos deixar de confiar nos exames de diagnóstico, mas a melhor compreensão das suas potencialidades e fraquezas é essencial se quisermos empregá-los de maneira inteligente.

Cada pessoa é diferente

Um exemplo de exame imperfeito que é amplamente utilizado é o exame do Antígeno Prostático Específico (PSA, na sigla em inglês), que mede o nível de uma proteína específica no sangue como indicador de câncer da próstata.

Esse exame detecta cerca de 93% dos cânceres, mas apresenta índice muito alto de falsos positivos.

Cerca de 80% dos homens com resultado positivo, na verdade, não são portadores de câncer.

E, para estes 80%, o resultado cria estresse desnecessário e, provavelmente, leva à realização de exames adicionais, incluindo dolorosas biópsias.

Os testes rápidos de antígeno para covid-19 são outro tipo de exame imperfeito e amplamente empregado.

Uma análise desses testes concluiu que, das pessoas sem sintomas com resultado positivo, apenas 52%, na verdade, tiveram covid.

Já entre as pessoas com sintomas de covid e resultado positivo, a precisão do exame aumenta para 89%.

Esses índices comprovam que o desempenho do exame não pode ser resumido em um único número — ele depende do contexto individual.

Mas por que os exames de diagnóstico não são perfeitos?

Uma das principais razões é o fato de que as pessoas são diferentes entre si.

Uma temperatura alta para você, por exemplo, pode ser perfeitamente normal para outra pessoa.

Nos exames de sangue, diversos fatores externos podem influenciar os resultados, como a hora do dia ou há quanto tempo você se alimentou pela última vez.

A própria medição da pressão sanguínea, sendo tão comum, também pode ser imprecisa.

Seus resultados podem variar, dependendo se a braçadeira está bem ajustada ao seu braço, se as suas pernas estão cruzadas e se você falar durante a realização do exame.

Crédito, EPA

Amostras pequenas e fraudes estatísticas

Existe uma enorme quantidade de pesquisas sobre novos modelos de diagnóstico.

Os novos modelos chegam com frequência às manchetes como “inovações da medicina” — a sua letra pode detectar Doença de Parkinson, o seu cartão de fidelidade da farmácia pode detectar câncer do ovário na fase inicial ou os movimentos dos olhos podem detectar esquizofrenia, por exemplo.

Mas cumprir o que as manchetes prometem, muitas vezes, é outra história.

Muitos modelos de diagnóstico são desenvolvidos com base em um pequeno número de amostras.

Uma análise concluiu que a metade dos estudos de diagnóstico utiliza apenas pouco mais de 100 pacientes.

É difícil ter um quadro real da precisão de um exame de diagnóstico com amostras tão pequenas.

Para obter resultados precisos, os pacientes que utilizam o teste devem ter características similares às pessoas empregadas para o seu desenvolvimento.

A avaliação de risco de Framingham, por exemplo, é amplamente utilizada para identificar pessoas com alto risco de doenças cardíacas.

Ela foi desenvolvida nos Estados Unidos e sabe-se que sua eficácia é baixa entre os aborígenes australianos e as pessoas das ilhas do Estreito de Torres, no norte da Austrália.

Disparidades de precisão similares foram encontradas nas “avaliações de risco poligênico”, que combinam informações sobre milhares de genes para prever o risco de doenças.

Elas foram desenvolvidas entre populações europeias e apresentam maus resultados entre populações de fora da Europa.

E, recentemente, identificamos outro problema importante. Existem pesquisadores que exageram a precisão de alguns modelos para serem publicados.

Existem muitas formas de superestimar o desempenho de um exame, como retirar pacientes de difícil previsão da amostra.

Alguns exames também não trazem previsões, na verdade, porque incluem informações futuras, como um modelo de previsão de infecções que inclui se o paciente havia recebido prescrição de antibióticos.

Talvez o exemplo mais extremo de exagero do poder de um exame de diagnóstico tenha sido o escândalo da Theranos.

A empresa afirmou que um exame de sangue retirado de um dedo do paciente, supostamente, diagnosticaria diversas condições de saúde, atraindo centenas de milhões de dólares de investidores.

Mas era bom demais para ser verdade — e a artífice do projeto, Elizabeth Holmes, foi condenada por fraude.

Grandes dados não fazem a perfeição

Na era da medicina de precisão e dos megadados, parece tentador combinar dezenas ou centenas de informações sobre um paciente — talvez, usando aprendizado de máquina ou inteligência artificial — para fornecer previsões com alta precisão.

Mas, até agora, as promessas não estão se tornando realidade.

Um estudo estimou que 80 mil novos modelos de previsão foram publicados entre 1995 e 2020. São cerca de 250 modelos novos a cada mês.

Será que eles estão transformando a assistência médica?

Não vemos sinais de que isso esteja acontecendo — e, se eles realmente tivessem grande impacto, certamente não precisaríamos de um fluxo tão grande de novos modelos.

Para muitas doenças, existem problemas com os dados que nenhum modelo pode solucionar, por mais sofisticado que seja, como erros de medição ou dados faltantes que impossibilitem previsões precisas.

Alguns males ou doenças, provavelmente, são inerentemente aleatórios e envolvem cadeias complexas de eventos que um paciente não consegue descrever e que nenhum modelo será capaz de prever.

Exemplos podem incluir lesões ou doenças de décadas atrás, não incluídas nos registros médicos, e que o paciente já esqueceu.

Os exames de diagnóstico nunca serão perfeitos.

Reconhecer suas imperfeições fornecerá aos médicos e seus pacientes a fundamentação necessária para discutir o que significa cada resultado — e, o mais importante, o que deve ser feito em seguida.

* Adrian Barnett é professor de estatística da Universidade de Tecnologia de Queensland, na Austrália.

Nicole White é pesquisadora sênior de estatística da Universidade de Tecnologia de Queensland, na Austrália.