Autores: Fergal Mullally, Susan E. Thompson, Jefferey L. Coughlin, Christopher J. Burke & Jason F. Rowe
Instituição do primeiro autor: SETI Institute, Mountain View, CA
Status: publicado em The Astronomical Journal, acesso aberto
Muitas descobertas recentes de exoplanetas com o telescópio espacial Kepler confiaram em métodos estatísticos. Em vez de utilizar técnicas que consomem mais tempo, como imageamento ou espectroscopia, esses estudos realizam diversos testes estatísticos com o objetivo de eliminar detecções errôneas, os chamados falsos-positivos. Esses sinais podem ser de natureza astrofísica (como uma binária eclipsante em segundo-plano) ou devido a fontes de ruído no instrumento. O artigo de hoje questiona o nível de confiança desses métodos quando aplicados a candidatos com períodos longos e baixa razão sinal-ruído (SNR) e especificamente contesta a confiança de 99.97% na detecção de Kepler-452b.
Antes da discussão dos resultados, é útil definir alguns termos. Primeiro, a completeza de um método de exclusão é a fração de planetas reais identificados corretamente. De maneira similar, a eficácia do método se refere à fração de falsos positivos identificados corretamente. Finalmente, o número que será discutido é a confiabilidade do método, ou a fração de detecções que são de fato reais (e não falsos positivos).
Os autores do artigo seguem duas linhas de raciocínio para argumentar que a validação puramente estatística para planetas com períodos longos (200-500 dias) e SNR baixo (<10) é muito menos precisa que previamente sugerido. Primeiro, eles argumentam que o número de falsos positivos nesse regime supera drasticamente o número de sinais reais de planetas. Especificamente, há um grande número de falsos positivos com períodos em torno de 370 dias, causados por ruído variando com o mesmo período do satélite Kepler (que é de 372.6 dias). Isso implica que qualquer método para validar esses candidatos deve ser extremamente eficaz em identificar falsos positivos. O segundo argumento dos autores é que é muito difícil identificar falsos positivos efetivamente sem diminuir a completeza.
Para testar a eficácia de um método, primeiro se cria um conjunto de dados que não apenas não contenha trânsitos reais, mas também ruído com as mesmas propriedades dos dados a serem analisados. Uma maneira simples de fazer isso é inverter curvas de luz reais. Isso torna os trânsitos reais, que são diminuições no brilho da estrela, em aumentos de brilho. O software de análise busca então por trânsitos, que agora se sabe serem causados apenas por ruído, já que os trânsitos reais foram transformados em aumentos de brilho. Trabalhos anteriores encontraram que o Robovetter (um dos principais softwares utilizados para verificar trânsitos) tinha uma eficácia de 98.3% (ou seja, quase todos os falsos positivos são identificados corretamente, com apenas 1.7% identificados erroneamente como trânsitos reais). A Figura 1 mostra um exemplo do quão difícil pode ser essa identificação. Você consegue identificar quais conjuntos de dados referem-se a Kepler-452b e quais são curvas de luz invertidas, com trânsitos falsos causados por ruído? A resposta está no fim desta publicação!

Para quantizar seus argumentos, os autores examinaram quão bem o Robovetter se saía analisando uma amostra de trânsitos reais com período longo e SNR baixo. O software foi utilizado para examinar uma amostra de 3341 trânsitos e identificou 67 como planetários. Utilizando a eficácia de 98.3% mencionada acima, isso implicaria 56 falsos positivos sendo identificados erroneamente como sinais reais. Assim sendo, apenas 11 dos candidatos identificados seriam reais, implicando em uma confiabilidade baixíssima de 11/67 = 16%. Em suma, devido ao grande número de falsos positivos nesse regime, uma eficácia de 98.3% não é boa o suficiente. Utilizando um limiar maior do que o Robovetter usualmente considera para selecionar candidatos a planeta melhora a confiabilidade apenas até 92%, ainda mais baixa que os 99% usualmente exigidos para alegar uma confirmação estatística.
Para resumir, a confirmação estatística de candidatos a planetas com período longo e razão sinal-ruído baixa deve ser interpretada com cautela. Essas confirmações ainda são úteis em estudos de larga-escala, desde que a baixa confiabilidade dos candidatos nesse regime seja levada em conta. A confiabilidade desses métodos é, contudo, muito baixa para confirmar detecções individuais sem observações subsequentes, e o nível de confiança de 99% na validação de Kepler-452b é provavelmente mais próximo de 90%.
Resposta sobre a Figura 1: a linha superior é Kepler-452b, e a inferior é uma curva de luz invertida.
Original em inglês: Statistically Confirming an Earth-Like Planet? Not So Fast!, por Samuel Factor
1 comentário