Epidemiologia para principiantes

É muito difícil fazer previsões. Especialmente sobre o futuro.
Karl Kristian Steincke, político dinamaquês, 1937-38
Essa frase é tão verdadeira que já foi atribuída a várias pessoas, como o grande escritor norteamericano Mark Twain e a Niels Bohr, um dos pais da Mecânica Quântica.
Em sua primeira entrevista coletiva como ministro da saúde, Nelson Teich suspeitou do modelo epidemiológico mais usado na pandemia de Covid-19.
"Eles falavam que 1.150.000 pessoas morreriam no Brasil, mas com algum tipo de cuidado específico isso cairia para 44.000. Isso é impossível. Não tem medida que cai de 1.150.000 para 44.000"
Essa afirmação evidencia duas coisas: por um lado a dificuldade das pessoas para entender um modelo fortemente não-linear, no qual uma pequena modificação num parâmetro inicial altera dramaticamente o resultado. Por outro mostra o despreparo do ministro para um cargo tão importante no qual as decisões devem ser sempre baseadas em ciência e não na sua opinião ou limitada percepção pessoal.
Aqui vou discutir o que é e como funciona um modelo epidemiológico para não repetir o erro grosseiro do ministro. Nesses tempos todos devemos ter um entendimento mínimo de epidemiologia para podermos acompanhar o que acontece pelo mundo.
Epidemias são fenômenos muito complexos. Eu tenho dificuldade em imaginar o tamanho da desgraça que seriam 1 milhão de mortos no Brasil. Outras pessoas, provavelmente com um sentimento similar de impotência e limitações para entender os modelos negam a magnitude do problema. O próprio presidente se referiu à Covid-19 como um "resfriadinho" ou uma "gripezinha".
Figura 1. Resultado do Modelo SIR usando ß = 0.5 e µ = 0.1 (R0=5) ao longo de um ano. Note que a população I aumenta rapidamente e o máximo ocorre no dia 25. Calculado usando o código de Epidemiology101 modificado. A população total é normalizada em 1.
Como é possível prever o número de vítimas de uma epidemia com boa precisão? Por que esse número pode variar tanto? As previsões envolvem modelos sofisticados para levar em conta vários aspectos práticos. O modelo ao qual o ministro Teich se referia é o do Imperial College. Ele se tornou célebre porque suas previsões fizeram o Reino Unido e os Estados Unidos mudarem suas políticas em relação à pandemia. Essa é uma área de pesquisa ativa e muita gente dedica sua carreira a aprimorar modelos existentes e mesmo escrever novos modelos. O modelo mais básico no qual todos os demais estão baseados foi proposto em 1927  pelos escoceses Anderson Gray McKendrick e William Ogilvy Kermack. Ele divide a população em compartimentos (grupos) de indivíduos Suscetíveis, Infectados e Recuperados, e por isso são genericamente chamados de modelos SIR. Modelos do tipo SIR são chamados de compartimentais porque cada indivíduo precisa estar em um dos compartimentos. Algumas regras são definidas: Uma pessoa Suscetível pode continuar Suscetível ou se tornar Infectada por contágio a partir de um Infectado com uma probabilidade ß. Uma pessoa Infectada pode continuar Infectada ou se tornar Recuperada com uma probabilidade µ. Uma pessoa Recuperada não pode ser Infectada novamente, ganhando imunidade. São escritas as equações que conectam os diferentes grupos. A solução das equações determina a evolução de cada grupo com o tempo. No início da epidemia, quando o valor absoluto de Infectados é pequeno, o crescimento de Infectados é exponencial, ou seja, a taxa de variação de Infectados é proporcional ao valor de Infectados. Nessas condições o expoente que controla o crescimento exponencial é proporcional a R0 = ß/µ. R0 tem como significado a taxa de infecção, ou seja, quantos indivíduos Suscetíveis um Infectado em média infecta. Esse parâmetro é muito importante para a evolução da epidemia. Os resultados do modelo dependem fortemente de ß e µ e consequentemente de R0. Isso é ilustrado nas Figuras 1 e 2. Nelas é mostrada a evolução dos valores de S, I e R ao longo de um ano para µ=0.1. Na Figura 1 ß=0.5 (R0=5) e na Figura 2 ß=0.2 (R0=2). Essa pequena diferença em ß muda bastante o comportamento da curva rosa, a população de Infectados. Com R0=5 o número de Infectados aumenta rapidamente e o máximo ocorre 25 dias após o início da epidemia. No pico metade da população está infectada. Com R0=2 o número de Infectados aumenta bem mais devagar e o máximo ocorre 90 dias após o início da epidemia. No pico apenas 1/6 da população está infectada. Reduzir o valor de R0 é o que chamamos de achatar a curva. Se a capacidade de internação desse lugar fictício corresponder a 1/6 da população (na verdade é muito menos que isso) todos os Infectados terão chance de tratamento, o que não ocorre quando R0=5 e 1/3 da população ficará sem atendimento. Esse modelo super simplificado reproduz muito bem características gerais das epidemias e nos permite que entender como os modelos funcionam. O grande problema é obter experimentalmente valores confiáveis dos parâmetros, que dependem da natureza da epidemia.
Figura 2. Resultado do Modelo SIR usando ß = 0.2 e µ = 0.1 (R0=2) ao longo de um ano. Note que a população I aumenta devagar e o máximo ocorre no dia 90. Calculado usando o código de Epidemiology101 modificado. A população total é normalizada em 1.
Para enfatizar a diferença entre as duas situações representei na Figura 3 somente a evolução de Infectados durante 100 dias em escala logaritmica, como normalmente esses dados são representados. Em escalas logarítmicas as exponenciais viram retas. Note que na escala vertical cada divisão é 10 vezes maior que a anterior. Na curva verde, com R0=5 a subida é muito mais vertical, atingindo o máximo rapidamente. Note que depois do máximo o decaimento também é exponencial mas com uma inclinação bem menor. A recuperação demora mais que a infecção. A curva rosa representa o aumento mais suave que ocorre quando R0=2. Não só o máximo ocorre bem mais tarde como o valor número de Infectados no máximo é bem menor. Como verificamos antes, R0 corresponde a quantos Suscetíveis cada Infectado infecta em média. Portanto é um parâmetro sobre o qual a sociedade pode agir através de diminuição das chances de contaminação. Esse é o motivo pelo qual todos os países adotaram medidas de isolamento social para conter a epidemia. O isolamento social tem base científica. No caso extremo de lockdown R0 é aproximadamente igual a 0 e em poucas semanas a epidemia desaparece pela ausência de contágio. Essa situação extrema exige que deixe de existir contato entre pessoas, forçando a uma paralisação econômica total do país. Com isolamento social idealmente podemos chegar a uma situação de R0 próximo de 1.
Figura 3. Comparação entre a população de Infectados para R= 2 e R= 5 em uma escala logaritmica. Note a diferença entre as taxas de subida, as datas dos máximos e os valores dos máximos. Isso é o achatamento da curva. Calculado usando o código de Epidemiology101 modificado. A população total é normalizada em 1.
O modelo simples discutido até aqui é bom para entendermos suas principais características, mas está longe de representar uma epidemia real. Por exemplo, nesse modelo ninguém morre. Precisamos sofisticá-lo. Primeiramente, podemos incluir mais compartimentos além de S, I e R. Por exemplo, o compartimento E para Expostos assintomáticos (que transmitem a doença sem apresentar os sintomas), e o compartimento D para os mortos (Dead em inglês). Cada novo compartimento tem  suas regras de transição (de onde, para onde) e coeficientes (probabilidades de transição) associados. Outra forma de criar mais compartimentos e deixar o modelo mais realista é dividir a população por faixa etária para considerar diferenças de letalidade e de probabilidade de contágio. A população também pode ser dividida em classes sociais. As pessoas podem ser colocadas em cidades que se comunicam pouco. Pode ser incluído o tempo de incubação da doença de forma que ela leve um tempo entre a infecção e o início do contágio (perto de 5 dias em média para Covid-19). O modelo simples considera que Recuperados ficam imunes para sempre. Essa imunidade pode ser temporária de forma que os Recuperados se tornam Suscetíveis novamente depois de um tempo. Modelos mais realistas consideram também a capacidade de atendimento hospitalar mudando a probabilidade de cura ou de letalidade para um Infectado hospitalizado. Na medida em que os modelos se sofisticam mais parâmetros numéricos são necessários para fazer previsões confiáveis. Quanto tempo leva para dobrar o número de infectados? Qual a taxa de mortalidade dos infectados para cada faixa etária (os números para o Covid-19 ainda são contraditórios e dependem da faixa etária, mas em média é algo entre 0.6 e 1%)? Em quanto a internação diminui as chances de óbito? Qual a taxa de recuperação? Quantos leitos hospitalares e de UTI estão disponíveis? Os parâmetros são obtidos por especialistas a partir da observação da evolução real da epidemia e são constantemente revisados. O número de parâmetros de um modelo realista é muito grande mas uma vez determinados permitem fazer previsões com boa margem de acerto. No Brasil ainda estamos na fase de crescimento exponencial. Para o Covid-19, R0 foi inicialmente estimado em 2,5, depois ficou claro que na verdade o valor está entre 3,0 e 3,3. Isso significa que nas condições sociais em que vivíamos no início da pandemia, um infectado em média infecta pouco mais de 3 pessoas. Isso obviamente é uma média: alguns infectados não infectarão ninguém, outros infectarão 40 ou 50 pessoas. Se tivéssemos mantido a vida normal como era no início de 2020, com R0=3.3 teríamos mais de 1 milhão de vítimas no Brasil. O objetivo do isolamento social é baixar o valor de R0. Como o sistema amplifica o sinal durante o crescimento exponencial, quanto mais cedo isso é feito, maior é o efeito sobre o menor é o número total de óbitos. Se tivéssemos feito um lockdown nos primeiros dias da doença o modelo previa entre 2 e 5 mil vítimas no Brasil ao longo de toda a epidemia. Isso não foi feito e essa cifra já foi superada. Se conseguimos manter R0 abaixo de 1 durante várias semanas a epidemia vai terminar pois nessa condição cada infectado em média infecta menos de uma pessoa. É essa a base do plano da chanceler Angela Merkel para a retomada das atividades na Alemanha. Se conseguirmos o mesmo para o Brasil a  a mortalidade diminui e chegamos a algo entre 5 e 10 mil óbitos, talvez um pouco mais pois nessas condições o sistema de saúde consegue dar conta de atender a grande parte dos doentes. Com R0 maior que 1 o número total de óbitos cresce muito rapidamente, chegando a mais de 1 milhão para R0=3.3. Essa enorme variação no número de óbitos com uma pequena variação de R0 é uma característica do que chamamos de sistemas não-lineares. Nesses sistemas um pequeno estímulo é rapidamente amplificado. Transistores são componentes não lineares que transformam uma pequena corrente numa corrente até 200 vezes maior. Nos modelos epidemiológicos uma pequena variação em R0 muda radicalmente o resultado. Isso não é intuitivo porque em nossa experiência cotidiana os sistemas são lineares e os efeitos são proporcionais às causas. Por isso alguns políticos como o ministro da saúde, o presidente e outras pessoas com conhecimento limitado de ciência consideram alarmismo quando os cientistas comunicam as previsões corretas do modelo. Infelizmente elas não são exageradas. Os modelos usados atualmente foram empregados para prever números de infectados e de óbitos em outras epidemias, inclusive recentes. Acertaram sempre. O número de vítimas do Covid-19 só não atingiu valores desesperadores porque o mundo inteiro adotou medidas de isolamento social e reduziram R0. Os lugares que não as adotaram ou as relaxaram antes da hora sofreram as consequências.
Para quem quer saber mais há vídeos e simulações computacionais que ilustram muito bem os modelos e permitem aprofundar os conhecimentos, inclusive variando os parâmetros e verificando os efeitos não-lineares. Dependendo dos seus conhecimentos computacionais é possível usar repositórios públicos com código, inclusive o que modifiquei para gerar as figuras usadas aqui.
Os cientistas também gostariam que essa pandemia fosse só mais uma “gripezinha”. Ninguém "torce" pelo vírus. No entanto é importante alertar a sociedade para a real dimensão do problema para que decisões corretas baseadas em ciência sejam tomadas pelos políticos. O distanciamento social já teve efeito sobre a evolução da pandemia e reduziu o valor de R0 de forma que muito provavelmente não chegaremos nem perto de um milhão de vítimas no Brasil. No entanto, é uma ilusão achar que poderemos relaxar o distanciamento social antes de termos certeza de que estamos na descendente da curva de Infectados. Os modelos são complicados mas espero que esse texto tenha ajudado a entender seus princípios. Há pesquisadores trabalhando dia e noite pelo mundo todo em busca de uma droga eficaz ou de uma vacina contra o Covid-19. Todos esperamos que tenham sucesso e possamos brevemente deixar o isolamento social com o menor número de vítimas possível. A decisão sobre o momento certo para isso certamente virá da ciência.

Comentários

Legal cara adorei o texto!
Marcia Araujo® disse…
Ótimo texto! Vou distribuir.