Como pensar como um epidemiologista

Como pensar como um epidemiologista

O teorema de Bayes ganha destaque em um momento de incertezas, como a que a covid-19 proporciona

Siobhan Roberts, The New York Times - Life/Style

22 de agosto de 2020 | 05h00

Há uma tréplica de um estatístico - às vezes no sentido de crítica irônica, às vezes como um conselho honesto - que poderia ser um melhor slogan para nossos tempos. “Atualize suas noções a priori”.

No jargão dos estatísticos, “a priori” sãos seus conhecimentos e crenças anteriores, inevitavelmente vagos e incertos, não são evidências. A evidência leva a uma atualização e então mais evidências levam a novas atualizações e assim por diante. Este processo repetitivo intensifica a certeza e gera um acúmulo coerente de conhecimento.

No começo da pandemia de coronavírus, por exemplo, a transmissão da covid-19 pelo ar não era considerada provável, mas no início de julho a Organização Mundial da Saúde (OMS), com mais evidências científicas, admitiu que este é um fator, especialmente em ambientes internos. A OMS então adaptou seus conhecimentos apriorísticos e mudou sua orientação.

Esta foi a ideia central da análise feita por Thomas Bayes, ministro presbiteriano do século 18, que também era matemático. Ela captura a incerteza em termos de probabilidade: o teorema de Bayes, ou regra, é um instrumento para adaptar racionalmente suas crenças e incertezas “a priori” com base em evidências.

Bayes expôs suas ideias no seu livro An Essay Toward Solving a Problem in the Doctrine of Chances, publicado postumamente em 1763, que depois foi aperfeiçoado pelo pregador e matemático Richard Price e incluiu o teorema de Bayes. Alguns séculos mais tarde e as estruturas e o método Bayesiano, alimentados pela computação, estão no centro dos vários modelos no campo da epidemiologia e outras áreas científicas.

Como Marc Lipsitch, epidemiologista no campo das doenças infecciosas na Universidade Harvard, observou no Twitter, o raciocínio Bayesiano é muito próximo da sua definição de racionalidade. “À medida que aprendemos mais, nossas crenças mudam”, afirmou ele em uma entrevista. “Um extremo é você decidir o que pensa e resistir às novas informações. Outro extremo é privilegiar exageradamente a última coisa que aprendeu. Em termos gerais, a lógica Bayesiana é uma maneira baseada em princípios de integrar o que você pensava anteriormente com o que aprendeu e chegar a uma conclusão que incorpora ambas as ideias, dando às duas o peso apropriado.

Com uma nova doença como a covid-19 e todas as incertezas que ela traz, há um interesse muito grande em se definir os parâmetros para os modelos: qual é o número de reprodução básico, a taxa à qual novos casos surgem? O quão mortal ela é? Qual é a taxa de mortalidade da infecção, a proporção de pessoas que o vírus mata?

Mas há um pequeno ponto quando se tenta estabelecer números fixos, disse Natalie Dean, professora assistente de bioestatística na Universidade da Flórida. “Deveríamos nos concentrar menos em descobrir uma única “verdade” e focarmos no estabelecimento de uma faixa racional, reconhecendo que o real valor pode variar entre as populações”, disse ela. “A análise Bayesiana nos permite incluir esta variabilidade de um modo claro e depois propagar esta incerteza através do modelo”.

A lógica da incerteza

Joseph Blitzstein, estatístico de Harvard, se aprofunda na utilidade da análise Bayesiana no seu curso Statistics 110: Probability. Como introdução ao curso, na primeira aula, ele afirma: “Matemática é a lógica da certeza e a estatística é a lógica da incerteza. Todo mundo tem incertezas. Se você tiver 100% de certeza sobre tudo, alguma coisa está errada com você”.

No final da aula, ele chega ao teorema de Bayes - seu teorema favorito porque é matematicamente simples, mas poderoso conceitualmente.

“Literalmente, a prova é apenas uma frase de álgebra. O teorema basicamente reduz a uma fração: expressa a probabilidade P de um evento A ocorrer devido à ocorrência de outro evento B”

"Ingenuamente, você pensaria, 'o que você consegue a partir disto?'", diz Blitztein. “Acontece que isto gera consequências incrivelmente profundas e aplicáveis a praticamente todos os campos de investigação - das finanças à genética, à ciência política e estudos históricos. A abordagem Bayesiana é aplicada na análise das disparidades raciais no policiamento (na avaliação das decisões dos policiais de fazer revistas em motoristas durante uma parada de trânsito) e em operações de busca e salvamento (a área de busca se torna mais estreita à medida que novos dados são adicionados). Cientistas cognitivos indagam: ‘O cérebro é Bayesiano?’. Filósofos da ciência afirmam que a ciência como um todo é um processo Bayesiano - como é o modo de pensar no geral.

É o caso do teste de diagnóstico. Neste cenário, a aplicação do teorema de Bayes pode usar eventos rotulados como T para um teste com resultado positivo e C para a presença de anticorpos da covid-19.  

Agora, suponha que a prevalência de casos é 10% (o que ocorreu na cidade de Nova York no primeiro semestre) e você terá um resultado positivo de um teste com uma precisão de 87,5% e 97,5% de especificidade. Manejando os números por meio de engrenagens bayesianas a probabilidade de que o resultado esteja correto e de que você tem de fato anticorpos é de 79,5%. Probabilidade decente, considerado todo o conjunto. Se quer mais certeza, obtenha uma segunda opinião. E continue a ser cauteloso.

Uma colaboração internacional de pesquisadores, médicos e desenvolvedores criou outra estratégia Bayesiana, combinando o resultado de um teste com um questionário para produzir uma melhor estimativa quanto a se o resultado pode ser um falso negativo ou um falso positivo. A ferramenta coleta informação contextual: você trabalhou durante o lockdown? O que você fez para evitar contrair a covid-19? Alguém na sua casa teve a covid-19?

“É um pouco similar a ter dois ‘médicos especialistas’”, afirmou Claire Donnat, que recentemente concluiu seu PhD em estatística em Stanford e fez parte da equipe. Um especialista tem acesso aos dados sobre os antecedentes e sintomas de um paciente, o outro tem acesso ao teste, os dois diagnósticos são combinados para produzir um dado mais exato e estimativas de imunidade mais confiáveis. Os dados anteriores (a priori) são atualizados com a adição de novas informações.

“À medida que novas informações são inseridas, atualizamos nossos dados precedentes o tempo todo”, disse Susan Holmes, estatística de Stanford, atualmente na zona rural em Portugal, onde inesperadamente ficou presa por 105 dias por causa da pandemia, quando em visita à sua mãe.

Essa foi a base a partir da qual Holmes refinou um estudo antes da sua impressão, em coautoria com Claire Donnat, que oferece um outro exemplo da análise Bayesiana. Observando uma pesquisa anterior realizada em março sobre como a pandemia poderia evoluir, elas notaram que os modelos epidemiológicos clássicos tendem a usar parâmetros fixos, ou constantes, para o número de reprodução.

Mas na realidade, o número de reprodução depende de fatos incertos, aleatórios: cargas virais e suscetibilidade, comportamento e redes sociais, cultura e classe socioeconômica, ar condicionado e fatores desconhecidos.

Com uma perspectiva Bayesiana, a incerteza é colocada como aleatoriedade. As pesquisadoras partiram da suposição de que o número reprodutivo tinha várias distribuições (a priori). Depois modelaram a incerteza usando uma variável aleatória que flutua, com uma faixa de valores que ia de um muito pequeno de 0,6 a tão grandes como 2.2, ou 3.5. Numa espécie de processo de encaixe, a variável aleatória tem parâmetros que flutuam ao acaso e esses parâmetros também possuem parâmetros aleatórias, etc. Os efeitos se acumulam numa “hierarquia Bayesiana”, disse Holmes.

Os efeitos de todas essas flutuações aleatórias se multiplicam. Como resultado, o estudo concluiu que o uso de variáveis aleatórias para números reprodutivos prevê de maneira mais realista os eventos mais perigosos da causa, ou seja, eventos mais raros, mas mais significativos por sua super propagação.

Os humanos, por si mesmos, sem a ajuda de um modelo Bayesiano, são conhecidamente ruins em compreender o risco individual.

“As pessoas, incluindo as crianças muito pequenas, podem e usam a inferência Bayesiana inconscientemente”, disse Alison Gopnick, psicóloga na Universidade da Califórnia. “Mas para isto elas precisam de evidências diretas sobre a frequência dos eventos”.

Grande parte da informação que guia nosso comportamento no contexto da covid-19 é aleatória. Por exemplo, segundo algumas estimativas, se você for infectado pelo coronavírus, existe 1% de possibilidade de morrer, mas na realidade as probabilidades podem variar milhares de vezes ou mais, dependendo da idade e outros fatores. “No caso de uma doença, a maior parte das evidências é indireta e as pessoas são muito ruins em lidar com informações fortuitas explícitas”, disse Gopnick. / TRADUÇÃO DE TEREZINHA MARTINO

The New York Times Licensing Group - Todos os direitos reservados. É proibido todo tipo de reprodução sem autorização por escrito do The New York Times.

Tudo o que sabemos sobre:
coronavírusciênciaepidemia

Encontrou algum erro? Entre em contato

Comentários

Os comentários são exclusivos para assinantes do Estadão.

Tendências:

O Estadão deixou de dar suporte ao Internet Explorer 9 ou anterior. Clique aqui e saiba mais.