Luzes brilhantes, grandes cidades: um estagiário assume o mundo do sensoriamento remoto

Quando Dorothee Grant se candidatou a faculdades há alguns anos, o aprendizado de máquina nem fazia parte de seu vocabulário. Em sua pequena escola rural do interior de Nova York, as oportunidades acadêmicas eram limitadas. Mas o primeiro estágio de Grant no verão passado, trabalhando no CIESIN com a programadora de sistemas de informação geográfica (SIG) Kytt MacManus, acelerou sua compreensão do uso do aprendizado de máquina para trabalhar com dados detectados remotamente.

Kytt MacManus, parado à esquerda, e Dorothee Grant, sentado à direita, olham para um monitor de computador enquanto estudam imagens dos dados das luzes noturnas.

O analista de sistemas sênior do CIESIN / desenvolvedor de GIS Kytt MacManus e o estagiário Dorothee Grant exploram os dados de luzes noturnas dos satélites. Palisades, Nova York, agosto de 2019.

Atualmente graduado em ciência da computação na Escola de Estudos Gerais da Columbia University, Grant ajudou a curar uma novo conjunto de dados isso ajudará a mapear áreas urbanas em grandes escalas espaciais. O conjunto de dados foi desenvolvido aplicando o últimas técnicas de aprendizado de máquina para luzes diurnas e noturnas, dados de satélite da NASA e NOAA. O conjunto de dados está sendo produzido no programa principal do CIESIN, o Centro de Dados e Aplicativos Socioeconômicos da NASA (SEDAC)

Grant também trabalhou em um projeto em andamento, explorando a viabilidade de usar dados diários de um satélite noturno para estimar a mobilidade da população em tempo quase real – o primeiro. O projeto foi financiado pelo Grupo de Observações da Terra (GEO) e conta com dados do instrumento VIIRS, também conhecido como Mármore preto da NASA. As inúmeras imagens das luzes brilhantes do planeta Terra, capturadas por sensores em satélites que orbitam no espaço centenas de quilômetros acima de nós, podem produzir informações que apóiam o desenvolvimento sustentável, permitindo um monitoramento mais freqüente do progresso em direção à Terra. metas estabelecido pelas Nações Unidas. Os dados aprimorados das luzes noturnas também podem ser usados ​​como proxy da atividade econômica e do crescimento urbano, ajudando-nos a entender como uma cidade mudou ao longo do tempo. E os dados das luzes podem ajudar em desastres antes e depois – por exemplo, como parte da recuperação pós-desastre após o furacão Maria, quando as luzes noturnas estavam acesas. usado para rastrear esforços para restaurar a rede elétrica.

O caminho do estagiário Dorothee Grant para a arena do sensoriamento remoto era indireto, embora sementes de interesse pela ciência tenham sido plantadas cedo. Grant sempre foi uma estudante entusiasmada, que estava escolhendo os móveis do dormitório quando estava na oitava série, diz ela. A caçula de uma família com duas irmãs mais velhas de alto desempenho, ela seguiu o exemplo, concentrando-se em matemática e assumiu que estudaria biologia, assim como uma irmã, uma eventual médica. Em vez disso, uma bifurcação na estrada acenou: no meio da redação de seu ensaio para o Common App, uma ligação veio como modelo para uma agência na cidade de Nova York. Grant disse que sim.

Após dois anos de sessões de moda em todo o mundo, Grant sentiu-se pronto para embarcar na vida acadêmica. Morando em Londres agora, sua colega de quarto era formada em ciência da computação. Intrigada, ela fez algumas aulas on-line de ciência da computação e percebeu que essa nova direção, independente dos caminhos da vida de suas irmãs mais velhas, lhe convinha. Ela credita essa experiência de "ano sabático mais" por ter sido aceita na Columbia. "Eu não teria entrado se me candidatasse ao último ano", diz ela, observando que sua pequena escola não poderia tê-la preparado suficientemente.

O trabalho de Grant no CIESIN faz parte de um objetivo maior e contínuo de melhorar a precisão espacial na determinação de como a população do mundo é distribuída. Uma coleta de dados anterior desenvolvida sob o SEDAC, o Projeto Global de Mapeamento Rural-Urbano (GRUMP), estimativas refinadas da população com base no censo usando dados de luzes noturnas do satélite DMSP-OLS da NOAA, mas as imagens eram muito "barulhentas" – apresentando muitos problemas para serem aproveitados como dados diários – limitando assim como o GRUMP poderia ser aplicado. O novo projeto da SEDAC com o GEO aborda muitos desses problemas, usando uma frequência diária de dados de luzes noturnas da Black Marble.

A análise realizada por Grant foi exploratória, avaliando a literatura e trabalhando com os dados com o objetivo de desenvolver um algoritmo para identificar a localização das populações. Primeiro, ela analisou imagens de satélite que já foram processadas até um certo ponto pela equipe do Centro de Vôos Espaciais Goddard da NASA (GSFC) e foi massiva: "Algo como 300 milhões de pontos de dados para o mundo inteiro", diz ela, "em oposição até quando eu estava trabalhando com o México, quando havia apenas cinco blocos – menos de nove milhões de pontos de dados. “Os dados foram empacotados em blocos, unidades menores que são mais práticas para troca pela Internet. Uma de suas tarefas era "costurar" esses ladrilhos novamente em um mosaico, para fornecer uma imagem contínua para análise.

Grant começou sua análise com Las Vegas, porque é uma cidade pequena, com menos pontos de dados que o México. “O objetivo geral era ter uma idéia da relação entre densidade populacional e luminosidade”, explica ela, “para que, se pudermos prever luzes, possamos prever a população. E, ao medir melhor a luminosidade passada, poderemos prever a luminosidade futura e desbloquear uma chave para uma melhor compreensão de como a população é distribuída e como ela se move. ”

Ela descobriu que a execução de um PMF (previsão persistente de modelo, um tipo de algoritmo de dados de séries temporais) mostrava os melhores resultados. "Levará cinco dias de cada vez, tente adivinhar o sexto dia e depois veja o quão perto estava – em essência," aprenda "com seu erro. Em seguida, aplica a lição que aprendeu nos próximos cinco dias e assim por diante. Faz isso várias vezes até que o algoritmo faça uma previsão mais precisa. ”Assim, a máquina aprende.

Grant também analisou a identificação de tendências em luminosidade ao longo do tempo. O supervisor MacManus sugeriu tentar identificar a diferença entre luzes de fim de semana e dias úteis e procurar diferenças impressionantes e consistentes nos valores da luz, como a súbita explosão de luzes que ocorre durante o feriado de Natal, por exemplo, ou o surgimento incongruente de iluminação no meio de o deserto no evento anual "Burning Man". "Comecei tudo em Las Vegas primeiro", explica ela. “Então eu separei todos os fins de semana e dias da semana, um ano de cada vez, e os comparei para ver se havia uma diferença estatística ou não.” Decepcionantemente, ela não encontrou nenhuma diferença. De volta à prancheta, ela fez o mesmo teste no México e viu as distinções que procurava.

Mapa mostrando as extensões urbanas de VIIRS e MODIS usando métodos de aprendizado de máquina - Rede Neural, 2015: EUA Continental. Com base em dados de luzes noturnas

O mapa mostra a extensão das áreas urbanas nos Estados Unidos continentais, com base nas luzes noturnas e nos dados de satélite de vegetação diurna desenvolvidos com técnicas de aprendizado de máquina. Imagem: Centro de aplicativos e dados socioeconômicos da NASA (SEDAC)

O uso dos dados do Black Marble é inovador não apenas pelo aumento na frequência com que os dados utilizáveis ​​são coletados, mas também pelas novas técnicas de processamento que a NASA GSFC usa para reduzir leituras falsas e superestimações no fluxo de dados. Graças a essas descobertas, há otimismo na comunidade de dados de que informações diárias, semanais ou mensais das luzes noturnas podem ser usadas para o monitoramento quase em tempo real da população, com novas possibilidades de análise e aplicação crítica. Este trabalho e a contribuição de Grant representam uma primeira verificação desse potencial.

Grant também é otimista, mas também pelas novas avenidas que o estágio abriu. Agora, iniciando seu segundo ano, ela continuará sua pesquisa no CIESIN como parte de um estudo direcionado, para crédito. Ela é vendida pelo caráter peculiar da matemática. “É certo ou errado”, diz ela, “mas há muitas maneiras de chegar lá.” Ela descobriu que gosta especialmente de codificar – “É como um quebra-cabeça” -, mas gosta ainda mais da ideia de trabalhar para o “bem maior. ”Ela explicou:“ Todo mundo aqui no CIESIN tem a ideia de tentar ajudar melhor o mundo, e eu acho isso admirável. ”Ela também aprendeu que preferiria um ambiente de trabalho onde pudesse sair de trás do monitor de vez em quando, e descobriu uma apreciação pela NASA e NOAA, observando: "Acho que minha experiência vai me levar a essas agências".

Como a experiência de Grant no CIESIN, trabalhando com GIS e aprendizado de máquina, abordou algumas questões essenciais da vida, ela também levantou novas. Seu entusiasmo em abraçar desafios complexos, combinados com seu senso de aventura, certamente a ajudarão a continuar encontrando respostas proveitosas.


O estágio de verão de Dorothee Grant no programa principal do CIESIN, o Centro de Aplicações e Dados Socioeconômicos da NASA (SEDAC), foi parcialmente financiado pelo programa de estágio do Instituto da Terra. Ela recebeu recentemente um Instituto da Terra Bolsa de Viagem para financiar uma apresentação de seu estudo direcionado na AGU de 2019. Kytt MacManus é analista de sistemas sênior / desenvolvedor de GIS do CIESIN e investigador principal do projeto, Avaliando o SUOMI-Nighttime Product Suite da NASA para melhorar o monitoramento de medições e a realização de ODS urbanos e metas e indicadores associados. O instrumento VIIRS-NPP faz parte do satélite da Parceria Nacional de órbita polar (NPP) de Suomi, operado em conjunto pela NASA e pela Administração Nacional Oceânica e Atmosférica (NOAA).


Esta matéria foi traduzida e republicada. Clique aqui para acessar o site original.