INESC TEC vence Prémio Arquivo.pt com portal que recupera 50 anos de dados autárquicos

Imagine que conseguia aceder, de forma estruturada e intuitiva, a dados eleitorais autárquicos portugueses desde 1976 até à atualidade. Esta foi a ideia dos investigadores do INESC TEC Rúben Almeida, Sérgio Nunes e Ricardo Campos ao criar a plataforma “A Minha Região – O teu portal autárquico” que conquistou o primeiro lugar no Prémio Arquivo.pt 2025.
A iniciativa distingue, anualmente, projetos que valorizam e reutilizam o património da web preservado em Portugal. Mais do que um portal de consulta, “A Minha Região” é uma ferramenta de cidadania digital. A plataforma cobre as 2882 freguesias, 278 concelhos e 18 distritos de Portugal continental, tornando acessíveis percentagens de votos obtidas por cada partido, abstenção, dados dos presidentes de juntas de freguesia e câmaras municipais eleitos, e notícias locais relacionadas com o processo eleitoral autárquico (desde informação sobre os candidatos até às suas promessas de campanha).
“Este projeto tem um forte pendor cívico e nasce da convicção de que a regionalização pode ser um motor para alavancar o desenvolvimento do país e sanar as assimetrias internas existentes em Portugal. As eleições autárquicas (e o poder local) são, do ponto de vista digital, o parente pobre do processo eleitoral português. Temos assistido vários esforços por parte de várias entidades para promover a participação dos cidadãos no processo eleitoral, contudo, focam-se sobretudo nas eleições legislativas ou europeias onde existe um programa eleitoral definido”, adianta Rúben Almeida.
Recuperar e estruturar a informação do Arquivo.pt foi um desafio técnico significativo. Grande parte dos dados eleitorais autárquicos, dispersos pelo website da Comissão Nacional de Eleições (que não disponibiliza uma API), pelo portal das eleições legislativas (eleicoes.mai.gov.pt), pelos vários websites autárquicos e pelo portal freguesias.pt, encontrava-se desorganizada, em formatos heterogéneos e de difícil acesso, sobretudo nos anos anteriores a 2001. “A web arquivada é, por natureza, desestruturada. De 1976 até 2001 há sete momentos eleitorais onde os dados estavam simplesmente inacessíveis e só através do trabalho de indexação do Arquivo.pt foi possível recuperá-los. Foi necessário aplicar técnicas de processamento de linguagem natural para extrair sentido do caos - analisar e dados, compreender o que era relevante em cada página – e criar uma base de dados utilizável e credível”, explica Rúben Almeida.
Ciência aberta com impacto social
O portal disponibiliza também uma API (da sigla anglo saxónica Application Programming Interface) pública, que permite a qualquer investigador aceder de forma gratuita aos dados recolhidos. Os investigadores esperam que esta aposta na ciência aberta motive novos projetos em áreas como ciência política, jornalismo ou participação cívica.
Apesar de hoje trabalhar na indústria, Rúben Almeida sublinha que o desenvolvimento deste projeto só foi possível graças à sua investigação no domínio da inteligência artificial no INESC TEC. O prémio monetário atribuído será investido no desenvolvimento futuro da plataforma. Está já prevista a inclusão de dados de eleições legislativas, europeias e presidenciais, a criação de uma interface de conversação por chatbot e o reforço da curadoria de notícias locais. “A Minha Região está longe de estar concluída. É um projeto vivo, que queremos que evolua com contributos da comunidade. O código será aberto, e espero que mais pessoas que partilhem esta preocupação com o território e com a participação democrática se juntem ao esforço”, conclui o investigador.
"A Minha Região" insere-se numa linha de investigação do grupo que procura potenciar o acesso dos cidadãos a dados de interesse público, com o objetivo de reforçar a literacia cívica e a participação democrática. “Esta linha de trabalho tem sido aprofundada no âmbito do projeto CitiLink, que aplica algoritmos de inteligência artificial e técnicas de processamento de linguagem natural (NLP) para interpretar e sintetizar atas de reuniões camarárias”, explica Ricardo Campos.
Esta não é a primeira vez que o INESC TEC vence este prémio. Já em 2018 conquistou o galardão com o projeto “Conta-me histórias” e em 2019 com a aplicação “meuparlamento.pt”, em 2022 ficou em terceiro lugar e recebeu uma menção honrosa do Jornal Público e em 2024 foi distinguido com a menção honrosa do DNS.PT.
O prémio, que beneficia do Alto Patrocínio da Presidência da República, foi entregue durante a cerimónia de encerramento do evento Ciência 2025, que se realizou entre os dias 9 e 11 de julho, na Nova SBE, em Lisboa. Os investigadores receberam o prémio pelas mãos do Ministro da Educação, Ciência e Inovação, Fernando Alexandre e da Presidente do Conselho Diretivo da Fundação para a Ciência e Tecnologia (FCT), Madalena Alves.
Os investigadores mencionados na notícia têm vínculo à UBI e à UP-FEUP.