Ciência de dados aplicada à análise de dados eleitorais brasileiros
Autor: Vitor de Souza Cruzeiro
Orientador: Prof. Assoc. João Pedro Albino
Com a popularização da internet, uma quantidade crescente de dados passou a ser produzida e disseminada de forma rápida e acessível. Enquanto este crescimento é benéfico para o acúmulo de dados, pode ser um obstáculo a verificação da acurácia destes. Ainda assim, existem fontes confiáveis que disponibilizam dados verificados com um certo nível de garantia de exatidão. Para diminuir a burocracia e facilitar o espalhamento dos dados, o Governo do Brasil vem utilizando, há alguns anos, a Internet como meio de divulgação de informações que têm sua disseminação obrigatória por lei. Por provirem diretamente do Estado, estes dados são tidos como confiáveis. A maioria dos órgãos das esferas governamentais está sujeita a esta lei, e não é diferente com o Tribunal Superior Eleitoral (TSE), que serve de administrador dos processos eleitorais no país. São objetos deste estudo os dados disponibilizados pelo TSE, que trazem informações sobre pleitos, resultados de eleições e dados demográficos dos eleitores. Assim, este projeto buscou desenvolver um conjunto de funções simples em linguagem R que permitisse a criação de mapas temáticos. O trabalho realizado gerou duas funções que criam mapas distintos oferecendo uma organização e visualização dos dados. Em função das limitações da base de dados do TSE, não foi possível utilizar uma maior gama de dados no projeto. Acredita-se que o trabalho cumpriu o objetivo inicial proposto de oferecer um panorama para demonstrar a evolução entre votações semelhantes ocorridas em períodos distintos.