Redes contraditórias, cosmologia colaborativa

Título: “Super-resolving Dark Matter Halos using Generative Deep Learning

Autores: David Schaurecker, Yin Li, Jeremy Tinker, Shirley Ho, and Alexandre Refregier

Instituição do primeiro autor: Institute for Particle Physics and Astrophysics, ETH Zurich, Zurich

Status: preprint no arXiv

Dados grandes, simulações caras

Não é segredo que, cosmologicamente falando, estamos vivendo em uma era de big data. Graças a incríveis levantamentos de galáxias como DESI, EUCLID, DES, and Rubin, astrônomos estão mapeando amostras cada vez maiores do nosso Universo usando galáxias cada vez mais distantes. A fim de que nossa compreensão teórica possa manter o ritmo das observações, precisamos ser capazes de comparar estes mapas com catálogos simulados dessas galáxias distantes—ou seja, precisamos de simulações maiores, com resolução mais alta. Além disso, precisamos muitas destas simulações para explorar diferentes parâmetros cosmológicos e realizar análises estatísticas. Isso é muito custoso computacionalmente!

Neste artigo, os autores apresentam uma maneira menos custosa de avançar. As questões que eles buscam respondem incluem:
1. Podemos produzir uma simulação de baixa resolução, preenchendo as lacunas com aprendizado de máquina no final?
2. Quão semelhante pode ser este procedimento comparado a produzir diretamente uma simulação de alta resolução?

Leia adiante para saber mais!

Preenchendo as lacunas com aprendizado de máquina

Os autores utilizam algo chamado generative adversarial network (GAN): um algoritmo de aprendizado de máquina onde duas redes neurais artificiais—chamadas de geradora e discriminadora—atuam como adversárias competindo em um jogo de soma zero. Um gráfico ilustrando como a GAN trabalha é mostrado na figura 1. A tarefa do gerador é aprender a produzir uma amostra que parece a mesma do conjunto de treino que o algoritmo recebe, enquanto a tarefa do discriminador é dizer o quanto estes dados produzidos do gerador difere da amostra real. O jogo é pesado: só termina quando o discriminador perde, ou seja, quando o gerador produz uma amostra sintética tão boa que o discriminador consistentemente relata uma probabilidade de 50%/50% da amostra ser real ou falsa. Ao passo que isso é uma notícia ruim para o discriminador, é uma notícia excelente para o usuário—significa que podemos produzir amostras falsas de maneira realista!

Figura 1: Ilustração de como uma GAN funciona. O gerador G é treinado com um certo ruído aleatório z a produzir uma amostra falsa que é indistinguível de uma amostra real contida no conjunto de treino Xtrain. Ambas as amostras são apresentadas ao discriminador D, que calcula a probabilidade dos dados falsos serem reais ou não. O treinamento da GAN termina quando ela é capaz de produzir amostras falsas indistinguíveis das reais segundo o discriminador, i.e., quando ele aponta 50%/50% de probabilidade da amostra ser real ou falsa. Figura 1 neste artigo

Comparando galáxias reais e simuladas

No caso do artigo de hoje, os autores comparam duas simulações contendo apenas matéria escura da suíte Illustris: A simulação Illustris-2-Dark, de alta resolução, e a Illustris-3-Dark, que apresenta resolução menor. Eles consideram apenas uma “fotografia” atual das simulações e dividem os seus volumes em 8 partições: 6 como conjunto de treino e 2 para validação e teste. A GAN é então treinada com uma das 6 partições da simulação de baixa resolução, a fim de criar uma versão correspondente daquela de alta resolução. Uma vez que o treino é completado, a GAN é testada com uma das 2 partições de teste/validação que o gerador não viu ainda. Os resultados encontram-se na figura 2.

Figura 2: O painel esquerdo mostra as simulações de baixa resolução, enquanto o painel central e direito mostram, respectivamente, os dados produzidos pela GAN e da simulação de alta resolução. Note que, em grandes escalas, as três simulações são indistinguíveis uma da outra. Já em escalas menores, mostradas nos destaques, o painel central e direito revelam um número maior de partículas menos brilhantes – correspondentes a halos de matéria escura de menor massa. Figura 3 no artigo.

Em geral, a GAN faz um excelente trabalho—o painel central e da direita da Figura 2 são praticamente indistinguíveis a olho nu! A maior diferença entre os dados de resolução mais alta e mais baixa consiste na presença de pequenos aglomerados de matéria escura, que a GAN tem sucesso em recuperar. Contudo, note que os dados produzidos pela máquina não conferem exatamente com os da simulação de alta resolução—e nem esperamos isso! Afinal, a rede neural não pode recuperar informação perdida na simulação Illustris-3 de baixa resolução; mas pode tentar descobrir como uma simulação de alta resolução pode parecer, estatisticamente falando. Então, não esperamos que uma simulação produzida pela GAN revele a localização exata e verdadeira de uma bolha de matéria escura, porém esperamos que medidas estatísticas realizadas sobre um pedaço da simulação sejam realistas. E é isso que acontece: estas medidas estatísticas são consistentes com os dados! Por exemplo, podemos usar o espectro de potência da matéria escura ou função de massa de halo, como ilustrado na Figura 3 abaixo.

Figura 3: Os autores calcularam a função de massa de halo—ou seja, o número de halos de uma certa massa como função do valor da massa— para a simulação de baixa resolução (rosa), dados produzidos pela GAN (azul) e a simulação de alta resolução (verde). Notem que a função de massa de halo da GAN e da simulação de alta resolução parecem quase idênticas uma a outra, estendendo a análise a massas significantemente mais baixas do que aquela da simulação de baixa resolução.

Conclusão

Mesmo que aprendizado de máquina não possa recuperar dados perdidos, uma rede neural treinadamente devidamente pode nos fornecer maior poder de resolução nas estatísticas de uma simulação. Além disso, uma vez treinada, é muito mais rápido utilizar uma GAN para extrapolar a resoluções mais altas do que produzir uma simulação de alta resolução em si. O objetivo principal seria treinar uma GAN tão bem a ponto de poder trabalhar com qualquer simulação de matéria escura. Na verdade, os autores utilizaram sua rede neural na suíte mais recente de simulações do Illustris—chamada Illustris-TNG—e encontraram que o algoritmo ainda é capaz de prever novos halos de matéria escura com sucesso! Este é um início promissor para sermos capaz de criar catálogos simulados realistas a apenas uma fração do custo computacional de uma simulação de alta resolução.

Adaptado da postagem original do astrobites “Adversarial Networks, Collaborative Cosmology“, de Luna Zagorac.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s