
Milhares de documentos em papel na República Democrática dos Arquivos Meteorológicos do Congo estão agora sendo digitalizados.Crédito: Derrick Muheki/Inera DRC
Como os países podem descobrir como as mudanças climáticas os afetarão em escala regional? A inteligência artificial (IA) pode ajudar a prever furacões e outros eventos climáticos extremos? E o mundo já passou pelo alvo mais ambicioso do acordo climático de Paris-para limitar o aquecimento global a 1,5 ° C acima dos níveis pré-industriais?
A necessidade de abordar essas e outras questões está estimulando os pesquisadores a explorar repositórios vastos e não utilizados de registros meteorológicos manuscritos que abrangem mais de dois séculos. Agora, esses dados valiosos-mas, em alguns casos, os dados ilegíveis-estão se tornando mais fáceis de acessar com novas ferramentas de aprendizado de máquina mais sofisticadas.
“Todos os serviços meteorológicos em todo o mundo têm algum porão, onde armazenam dados do século XIX que não foram digitalizados”, diz Marlies van der Schee, cientista climático do Instituto Meteorológico da Royal Holanda em De Bilt. “Para muitos institutos, eles nem sabem o que está em seus arquivos”.
Procurando dados
Na busca de reunir dados climáticos ausentes, o cientista climático Derrick Muheki viajou mais longe do que a maioria. To access the meteorological archives of the Democratic Republic of the Congo (DRC) — which contain records from when the DRC became independent in 1960 collected from 37 weather stations across the country — Muheki had to fly from Kinshasa to Kisangani in the country’s north, travel along the Congo River by boat and then take an unpaved road on a motorcycle to reach the Yangambi branch of the DRC’s National Institute for Agronomic Research (Inera). Lá, ele passou dois meses no início deste ano, examinando milhares de páginas de toras climáticas.
Muheki teve que trazer baterias suficientes para alimentar sua câmera digital durante a viagem, pois o ramo remoto de Inera não está conectado à rede nacional da RDC. Ele aprendeu parte da língua Bantu Lingala para que ele pudesse se comunicar com outros membros da equipe da Inera. Ele diz que ajudou que muitas das palavras eram semelhantes ao idioma que ele cresceu falando em seu país natal, Uganda.

Relatórios meteorológicos dos troncos dos antigos navios – como este documento do século XVIII do navio britânico HMS Golfinho – contém dados que podem ser alimentados em modelos climáticos. Crédito: a coleção de histórico via Alamy
Depois de retornar ao seu grupo de pesquisa no Vrije Universiteit em Bruxelas, Muheki começou a extrair dados de mais de 9.000 imagens digitalizadas usando uma ferramenta de aprendizado de máquina que ele projetou para ler os troncos, chamados meteosaver1.
Nos testes iniciais, o Meteosver só pôde transcrever os dados com precisão de 75%, mas refinamentos adicionais e treinamento de sua rede neural-com base em um pacote de código aberto para o reconhecimento de texto manuscrito chamado TESSERACT-elevou isso a 90%, diz ele.
Os dados resultantes fornecerão informações cruciais sobre como as condições mudaram ao longo do tempo na segunda maior floresta tropical do mundo. O cientista climático Wim Thiery, consultor de Muheki no Vrije Universiteit, diz que, devido à falta de informação sobre temperaturas passadas, o coração florestal do continente africano teve uma grande lacuna de dados no relatório de 2021 do painel intergovernamental sobre as mudanças, que avaliaram a severidade e a velocidade do aquecimento global em várias partes. Ele espera que esforços como os Muheki ajudem a corrigir isso.
Figuras esquecidas
Os obstáculos logísticos de Muheki eram incomuns, mas a RDC não é o único país que ainda está para digitalizar totalmente seus registros meteorológicos.
“Ainda existem registros de papel em arquivos em todo o mundo”, diz Ed Hawkins, cientista climático da Universidade de Reading, Reino Unido. Isso inclui milhões de observações de chuvas não utilizadas no arquivo meteorológico nacional do Reino Unido.
É tarde demais para manter o aquecimento global abaixo de 1,5 ° C? O desafio em 7 gráficos
Hawkins gerenciou vários projetos que se basearam em cientistas cidadãos para transcrever manualmente os registros climáticos. Dez anos atrás, mais ou menos, as ferramentas de aprendizado de máquina não estavam à altura da tarefa, diz ele. A parte mais difícil das ferramentas de IA não é ler o texto manuscrito, mas reconhecer a estrutura tabular nos documentos. “Quando eu e os colegas começamos a tentar (ai) ferramentas, eles simplesmente não funcionavam em números tabulados”, diz Hawkins. “Não estava no treinamento deles.” Grande parte do trabalho de Muheki consistia no desenvolvimento de algoritmos personalizados para fazer exatamente isso. Agora, as ferramentas estão finalmente se tornando boas o suficiente para combinar com o desempenho humano, diz Hawkins, que é co-autor do trabalho de pesquisa que descreve o meteoseosver.
Esforços semelhantes de outras equipes estão mostrando que o aprendizado de máquina pode acelerar drasticamente a taxa de recuperação de registros históricos. “É realmente uma revolução em nossa capacidade de resgatar dados”, diz Thiery.