É uma Supernova? Classificando objetos transientes em tempo real usando aprendizado de máquina

Título: RAPID: Early Classification of Explosive Transients using Deep Learning

Autores: Daniel Muthukrishna, Gautham Narayan, Kaisey S. Mandel, Rahul Biswas, Reneé Hlozek

Instituição do primeiro autor: Institute of Astronomy, University of Cambridge, Reino Unido

Status: Aceito pelo PASP Special Issue on Methods for Time-Domain Astrophysics

A humanidade está inundada de dados. Estima-se que 2.5 quintilhões de bytes (ou 2.5 milhões de terabytes) de dados são criados hoje em dia. Astrônomos acompanharam este ritmo ao construir novos observatórios e instalações que virão a produzir quantidades incríveis de dados. Um exemplo excelente disso é o Large Synoptic Survey Telescope (LSST), previsto para ver sua primeira luz em 2020. O observatório sozinho é projetado para produzir mais de 15 terabytes de dados a cada noite!

Simplesmente não há pessoas suficientes para processar e analisar a produção de dados a este nível. Portanto, cientistas e engenheiros devem apresentar formas criativas de lidar com esse dilúvio de informação. É aí que o aprendizado de máquina entra. Ao desenvolver algoritmos que permitem que computadores “aprendam” a analisar essas informações, poderemos escalar essa montanha de dados e utilizá-la para fornecer diretrizes para iniciativas governamentais, decisões de negócios, ou estudos científicos. Um dos algoritmos mais promissores para exercer esse trabalho são as redes neurais. Veja esta postagem do astrobites (em inglês) para uma explicação sobre redes neurais e um exemplo de aplicação de aprendizado de máquina para o estudo do meio interestelar.

O artigo de hoje utiliza rede neurais para classificar transientes astronômicos, fenômenos que são apenas visíveis por um curto período de tempo. Alguns exemplos de transientes são supernovas e eventos de ruptura por forças de maré (link em inglês), que ocorrem quando uma estrela é despedaçada conforme cai em um buraco negro. Os autores deste trabalho desenvolveram uma ferramenta chamada RAPID (Real-time Automated Photometric IDentification)¸ que tenta classificar transientes enquanto ainda são observados! Para surveys como o LSST, que obterá imagens de grande parte do céu visível a partir do Chile em poucas noites, classificação em tempo real forneceria uma grande vantagem aos astrônomos: a habilidade de obter o máximo de informação possível sobre um transiente enquanto o evento transiente estiver ocorrendo.

Bacana! Como eles criaram a rede neural?

Uma rede neural não sabe automaticamente como distinguir dois tipos de transientes; ela deve ser treinada com dados já existentes a fim de compreender quais parâmetros são os mais importantes para a classificação. Contudo, não existe ainda uma amostra grande de todos esses tipos de transientes. Por exemplo, um tipo de transiente é a kilonova, uma fusão de duas estrelas de nêutrons que foi observada pela primeira vez no ano passado. Essa foi a única detecção visível até o momento, implicando que o tamanho da amostra para essa classe de transiente é 1. Não podemos treinar uma rede neural com apenas um objeto. A solução é utilizar simulações.

As simulações utilizadas neste trabalho foram criadas usando um software desenvolvido por PLAsTiCC (Photometric LSST Astronomical Time-series Classification Challenge). Originalmente, PLAsTiCC simulou curvas de luz para transientes observados com o LSST. Esses dados hoje são públicos para quem quiser baixá-los e explorá-los por si mesmo! Os autores então adaptarem o software para simular curvas de luz que são representativas de um survey em andamento no Zwicky Transient Facility (ZTF). Essa amostra consiste de mais de 48,000 curvas de luz simuladas para 12 classes diferentes de transientes: 8 tipos de supernovas e 4 outros transientes exóticos, incluindo a kilonova. Os autores usaram a amostra completa, treinando o RAPID com 60% dela e testando com os outros 40%. Figura 1 mostra um exemplo de curva de luz, classificada corretamente pelo RAPID como uma Supernova do tipo Ia. Uma animação deste gráfico pode ser encontrada aqui.

Figura 1: O gráfico de baixo mostra a probabilidade da curva de luz (gráfico de cima) pertencer a uma determinada classe de transiente como função do tempo.‘Trigger’ indica quando um aviso seria enviado sobre um evento potencialmente interessante acontecendo, o qual é identificado por um aumento do brilho acima de um certo limiar. A linha vertical cinza tracejada mostra onde o RAPID acredita que a explosão começou, e o valor de t0 diz o quão antes do alerta de trigger isto ocorreu. Pre-explosion indica que o RAPID acredita que o transiente ainda não explodiu, então esta classe tem uma alta probabilidade de ser identificada como tal ainda no começo da curva de luz. Uma vez que a curva de luz aumenta de brilho, a probabilidade de o objeto ser uma Supernova Ia usual aumenta rapidamente com observações adicionais. Finalmente, RAPID tem quase certeza que esta é a correta classificação em torno de 20 dias após a explosão. Figura 5 do artigo.

Qual foi o desempenho geral do RAPID?

Foi muito bom! Apenas dois dias após o alerta de trigger (um aviso enviado pelo survey), assim que o brilho de uma região excede um certo limiar acima do ruído de fundo do evento transiente, RAPID foi capaz de classificar 4 tipos de transientes com acurácia maior ou igual a 75%. Se esperarmos até 40 dias após o trigger, RAPID pode classificar 8 dos 12 transientes com acurácia acima de 75%, como mostrado na figura 2. Com esse nível de acurácia, os autores encontraram que RAPID pode não ter a palavra final sobre a classificação de um transiente em particular, mas pode ainda informar confiavelmente aos astrônomos, em tempo real, se o transiente em questão é ou não da classe que lhes interessa. Isso pode permitir que os astrônomos agendem observações adicionais enquanto o evento transiente ainda estiver ocorrendo. A maioria dos tipos de transientes demoram em torno de 50 dias ou menos para atingir o pico de brilho rapidamente, então mesmo classificações expedidas por poucos dias podem significar a diferença entre ser capaz de capturar a física com que você se importa ou não.

Figura 2: Acurácia da classificação para cada um das 12 classes de transiente em comparação com o tempo. 8 classes apresentam acurácia de classificação acima de 75% após 40 dias. SNII e SNIbc, entretanto, possuem baixa acurácia de classificação em todos os tempos. Os autores acreditam que isto se deve às similaridades entre as curvas de luz destes objetos com CARTs (CAlcium-Rich Transients), uma classe de transientes recentemente descoberta cujo mecanismo de produção ainda não é bem compreendido. Figura 6 do artigo.

Como o RAPID se compara com outros algoritmos?

A fim de testar como RAPID se compara com outros algoritmos de aprendizado de máquina, os autores criaram um classificador de floresta randômica (random forest, em inglês) que imita os algoritmos de ferramentas tradicionais de classificação de transientes através de aprendizado de máquina. Esse modelo foi então testado em todos os dados simulados antes de 2 dias após o alerta de trigger a fim de comparar com a performance do RAPID nesse intervalo de tempo. O classificador de floresta randômica foi apenas capaz de classificar 2 tipos de transientes com acurácia igual ou acima de 75% antes de 2 dias (RAPID pôde fazer isso para 4 tipos), e as acurácias gerais da classificação foram mais baixas do que o RAPID. Em outras palavras, os autores dizem que o RAPID entrega maior acurácia do que os métodos tradicionais de aprendizado de máquina em períodos iniciais, ao mesmo tempo que permite classificação de tempo real ao processar milhares de curvas de luz em poucos segundos.

Como o aumento exponencial de volume de dados nas décadas a vir não será igualado por um aumento exponencial de astrônomos, eles vão precisar de uma mão amiga dos computadores. Classificação em tempo real de objetos, em breve, deve tornar-se o padrão para lidar com todos esses dados. RAPID mostra que acurácia razoável pode ser obtida para classificação em tempo real já no presente momento, e que esses modelos só tendem a melhorar assim que computadores começarem a aprender sobre objetos incontáveis que estão lá para serem descobertos.


Adaptado de Is That a Supernova? Classifying Transients in Real-Time with Machine Learning, por Michael Foley

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s