A história completa dos 271 átomos (ou serão 241?) e da fraude que não existiu nas eleições de 2014

Update (31/7/2021): Ao preparar outro post me dei conta de que o astrólogo Chut não é a pessoa que apresenta as "evidências" mas só corrobora os resultados. Como isso não altera as conclusões do texto, manterei como está.


Astrólogos são pessoas muito  interessantes. Eles acreditam que a posição dos astros influencia ou mesmo define as ações e relações humanas, mesmo não havendo nenhum mecanismo plausível para isso. Eu tenho um profundo fascínio pelo tipo de mecanismo mental que causa esse tipo de crença. Ela faz com que eles encontrem relações entre eventos mesmo que obviamente elas não existam, e buscam basear suas crenças em rigorosos cálculos matemáticos. O uso da matemática e de mapas do céu passa a impressão de que as relações que eles usam estão corretas. Aqui mostrarei que essa vontade de encontrar correlações aliada a pouca intimidade com tratamento de dados pode ter consequências nefastas.

Depois do post sobre os 271 átomos do presidente muita informação apareceu. Eu recomendo escutar o aparte do Medo e Delírio em Brasília dos dias 928, 929 e 930 e ler o excelente texto de Conrado Gouvêa.

Neste post mostrarei que as provas de fraude nas eleições de 2014 que o presidente Bolsonaro promete apresentar são resultado de uma teoria delirante de um astrólogo seguida de erros grosseiros de cálculos. O presidente assistiu o vídeo e não entendeu quase nada, mas tem apontado suas conclusões como prova definitiva de fraude nas eleições de 2014.

A teoria está exposta por seu autor, o astrólogo Alexandre Chut, num vídeo feito por Naomi Yamaguchi, irmã da top cloroquiner Nise Yamaguchi. Vale a pena assistir até o fim. É um amontoado de bobagens.


Ele usa dois argumentos igualmente errados:

  1. Uma suposta série regular de alterações na variação da variação (em termos técnicos, a segunda derivada do número de votos totalizados em relação ao tempo). Segundo o astrólogo essa segunda derivada variou de forma regular 241 vezes seguidas ao longo da apuração.
  2. Uma suposta violação da lei de Benford.
O presidente Bolsonaro assistiu o vídeo e entendeu tudo errado. Isso não é uma surpresa dada sua notória limitação intelectual e cognitiva. Segundo o presidente:
  1. A  imprensa "obviamente não teve acesso" aos dados parciais minuto a minuto. Na verdade os dados foram obtidos do G1.
  2. O líder na totalização mudou a cada minuto depois que os parciais se cruzaram. Isso é obviamente falso, como mostrei no post anterior.
  3. Ele confundiu 241 com 271, o que não é muito grave. Confundiu também a quantidade de átomos na terra com a via láctea, o que se por um lado é grave em termos numéricos não é grave para sustentar seu argumento.
Grave é acreditar numa teoria mirabolante sem ao menos conferir os cálculos (tenho dúvidas se o presidente conseguiria) e tentar enganar o país inteiro
.

1. A suposta oscilação regular da variação da variação dos votos (você não leu errado, é variação da variação mesmo)

Vamos tentar entender cada argumento de Chut. Ele tabulou as parciais minuto a minuto, calculou sua variação no tempo (a velocidade de contagem) e a variação da variação (a aceleração da contagem). 
Não existe motivo nenhum para a contagem, a velocidade ou a aceleração terem algum padrão. Elas dependem somente da ordem na qual as urnas vão sendo totalizadas. Segundo Chut, a aceleração variar num padrão seria indício de fraude. Ele afirma que a cada minuto o valor da aceleração muda, o que é esperado e mais que isso alterna tendo Dilma o valor maior num minuto, Aécio um valor maior no minuto seguinte. Segundo ele, isso aconteceu 241 vezes e a chance de obter essa regularidade ao acaso é 1/2240 que corresponde aproximadamente 1/2x1072. Nossa galáxia tem aproximadamente 1067 átomos, de forma que o inverso da chance disso acontecer é efetivamente comparável ao número de átomos na galáxia. Isso significa algo? Não.
A chance de obtermos qualquer sequência particular de cara/coroa jogando uma moeda 241 vezes é a mesma. Portanto, alguma sequência ocorreria de qualquer forma.  A chance de inversão da maior aceleração a cada minuto é precisamente a mesma de isso ocorrer a casa 2 minutos, ou 5, ou nenhuma vez, ou qualquer outra combinação. Se pudéssemos adivinhar combinações aleatórias a loteria não teria a menor graça. A chance de o resultado da mega-sena ser 01-02-03-04-05-06 é precisamente a mesma de ser 05-16-25-36-42-44. A diferença é que essa combinação foi sorteada. Antes de sabermos o resultado não tínhamos como adivinhar. Ou seja, uma determinada combinação de qual aceleração é maior não pode ser considerada evidência de fraude. Mas a situação é pior. Ao contrário do que Chut afirmou, isso não ocorreu.
Nas figuras abaixo eu reproduzo o total de votos, a velocidade e a aceleração da contagem durante todo o período de apuração. Qualquer estudante que já tenha feito esse tipo de medida com a posição de um carrinho se deparou com algo parecido. Pequenas variações na posição viram ruído na velocidade e ainda mais ruído na aceleração. Até aí nada de estranho.


Acontece que Chut afirma que o valor da aceleração varia de forma regular minuto a minuto. Para verificar isso coloquei o gráfico da aceleração em uma escala maior, que torna mais fácil a visualização. 

Olhando com atenção notamos que a aceleração de Dilma e Aécio variam de forma ruidosa, sem nenhum padrão definido. A afirmação de Chut não é verdadeira.

Não é correto afirmar que a variação da variação da contagem de votos oscila regularmente de minuto a minuto por 241 minutos.

Não que isso tivesse algum significado, mas não ocorre. Ao longo dos 489 minutos que a apuração durou, a aceleração dos dados mudou de líder 219 e não 241 vezes como afirma Chut.
Nesse ponto me deparei com a excelente análise feita pelo Conrado Gouvêa.
Conrado se deu conta de que por algum motivo desconhecido Chut definiu e calculou a aceleração da apuração de uma forma que não corresponde ao que ele falou no vídeo. Na verdade usou fórmulas que não calculam a aceleração. As fórmula estão tão erradas  que a aceleração de Chut nem tem dimensão de aceleração [voto/min2], mas de [voto], e ele ainda transformou o resultado em porcentagem. Com as fórmulas de Chut, descritas em detalhe no texto do Conrado, as linhas pares da Dilma representam o valor parcial percentual até aquele momento e nas linhas ímpares seu complemento, ou seja, o que falta para atingir 100%. Para Aécio ocorre o contrário: as linhas ímpares representam o percentual até aquela linha, as pares o complemento. Como só tem 2 candidatos, uma vez que os números parciais se estabilizam é óbvio que teremos numa linha Dilma na frente, na outra Aécio na frente. Isso está mostrado na figura abaixo para o mesmo intervalo da figura anterior.
Esse resultado não poderia ser diferente dada a forma como é obtido. Para mostrar isso de forma radical, Conrado criou uma planilha semelhante com números aleatórios de votos a cada intervalo e obteve o mesmo resultado. Um modelo matemático que sempre dá o mesmo resultado, independente dos dados de entrada não pode estar certo.

Chut enunciou uma teoria sem fundamento (Um padrão oscilatório regular da aceleração das contagens a cada minuto seria evidência de fraude). Demonstrando pouca intimidade com processamento de dados, calculou errado as acelerações  obtendo valores oscilatórios. Com o método que usou para tratar os dados, qualquer distribuição de votos daria o mesmo resultado.

Chut afirma que isso prova uma fraude. Não prova nada além da sua incapacidade para tratar dados.

2. Lei de Benford

A lei de Benford ou lei do primeiro dígito resulta de uma observação muito interessante: quando enumeramos uma quantidade com várias ordens de grandeza, ou seja, envolvendo números com 1, 2, 3, 4 dígitos há uma ocorrência maior de algarismos menores do que maiores no primeiro dígito. Isso tem uma razão simples: quando por algum motivo uma sequência é interrompida, há maior chance de termos contado números baixos. Imagine por exemplo a numeração de casas nas ruas. Elas vão sendo enumeradas até que a rua termine. Imaginemos uma rua curta, com 5 casas com números 1, 2, 3, 4, 5. Outra mais longa, com 45 casas, numeradas 1, 2, ..., 44, 45. Outra com 358 casas numeradas: 1, 2, ...., 357, 358. Se olharmos todas as ruas da cidade, cerca de 30% dos números das casas começa com 1, 17% começa com 2, e essas percentagens vão diminuindo até que menos que 5% dos números das casas começa com 9. A lei de Benford se aplica a casos em que contamos uma grandeza que varia algumas ordens de grandeza. uma rua pode ter entre uma e milhares de casas. Números de casas. Saldos bancários de todos os correntistas de um banco, que podem variar entre R$ 1 e alguns milhões. No caso de bancos, distribuições de saldos que não seguem a lei de Benford foram usadas para detectar fraudes
A lei de Benford, no entanto, não se aplica em casos em que as distribuições de números não cobrem ordens de grandeza. Esse é o caso de urnas em eleições. Como os eleitores são agrupados em seções com mais ou menos o mesmo tamanho, os números de votos não cobrem várias ordens de grandeza.
Houve uma acusação de fraude nas eleições americanas de 2020 com base na lei de Benford onde ela não pode ser aplicada: resultados parciais de urnas em que os votos de cada distrito variam entre 100 e 1000, somente uma ordem de grandeza. A acusação foi refutada num vídeo bem didático. A lei de Benford precisa ser modificada.
 em íde, havendo inclusive artigos científicos explicando porque não se pode aplicar a lei de Benford a eleições.

Chut dessa vez nem errado está.

Na sua tentativa de aplicar a lei de Benford, em lugar de buscar uma distribuição de dígitos nos resultados parciais, ou seja, na velocidade com que os dados chegavam, ele fez um histograma dos resultados totalizados minuto a minuto. Se olhamos o gráfico dos votos, perto das 19:40h, ou seja, depois de aproximadamente 1/4 do tempo total de contagem, os números se estabilizaram em torno de 50 milhões de votos pada cada candidato. Não é surpreendente que 5 seja o dígito que mais aparece para os dois candidatos como ele mostrou, dado que esse foi o primeiro dígito 3/4 do tempo. Também a ocorrência de 6, 7, 8, e 9 é praticamente zero. Os gráficos mostrados por Chut no vídeo estão na figura abaixo, junto com a curva esperada pela lei de Benford.



Pelos motivos mencionados acima a curva não segue a distribuição de Benford. Nem teria como.
Se Chut tivesse feito o gráfico certo, considerando a distribuição de votos que chegavam minuto a minuto ele teria encontrado a distribuição abaixo.


Ainda assim a curva não segue exatamente a distribuição de Benford. A explicação está no artigo científico que trata da lei de Benford e eleições: 
"Numa eleição envolvendo dois candidatos em distritos onde a magnitude da contagem varia entre 100 e 1000, o primeiro dígito modal para a contagem de votos de cada candidato não será 1 ou 2, mas na verdade 4, 5 ou 6."

No nosso gráfico o primeiro dígito modal, ou seja, com maior incidência é 3 seguido de 1 para Dilma e 1 seguido de 4 para Aécio. A explicação para isso está no gráfico da velocidade. Ela não cobre muitas ordens de grandeza. A maior parte do tempo as velocidades ficaram entre 100 e 500 mil votos/minuto, em lugar de entre 100 e 1000, com a distribuição de Dilma mais larga. Isso obviamente faz a distribuição pender para números menores, justificando as anomalias em 3 e 4 observadas 

Chut usou a lei de Benford original onde ela deveria ter sido modificada. E ainda assim usou mais uma vez valores errados, reforçando sua dificuldade com tratamento de dados.

3. Conclusões

A prova matemática definitiva de fraude na eleição de 2014 apresentada por Bolsonaro não prova nada. Ela deriva de um modelo sem base científica e de erros graves no tratamento dos dados. Aparentemente o astrólogo Alexandre Chut, responsável pelo modelo e pelos cálculos, pode saber muito de astrologia mas tem pouca intimidade com processamento elementar de dados. A forma como calculou a variação da variação do número de votos está errada. Ela sempre leva ao mesmo resultado, não importando a distribuição de votos de entrada. A aplicação da lei de Benford, que não se aplica a eleições, foi ainda mais errada considerando os votos totais a cada minuto em lugar de considerar o número de votos enviados a cada minuto e desconsiderando as correções necessárias para o caso de eleições de 2 candidatos.
Bolsonaro como sempre não entendeu nada e se limita a repetir as conclusões erradas de um modelo delirante seguido de erros de processamento.
É um erro duplo. O modelo está errado e mesmo que estivesse certo os dados não demontram o que o autor afirma.

Não há prova científica ou matemática de fraude nas eleições de 2014.

Qualquer afirmação diferente dessa não passa de um chute.


Comentários