Jornacitec Botucatu, XII JORNACITEC - Jornada Científica e Tecnológica

Tamanho da fonte: 
COMPARAÇÃO DO DESEMPENHO DA ANÁLISE DE COMPONENTES PRINCIPAIS EM TRÊS SITUAÇÕES DE IMPUTAÇÃO DE DADOS
Victor Crespo de Oliveira, Murilo Medeiros de Araújo, Francisco José Noris, Leonardo França da Silva, Valeria Cristina Rodrigues Sarnighausen, Sergio Augusto Rodrigues

Última alteração: 2023-10-04

Resumo


A ausência ou a perda de dados é um problema frequente em diversas áreas da pesquisa científica. Essas perdas são chamadas de dados ausentes, dados faltantes ou missings. Para o tratamento destes missings, muitas técnicas estatísticas são usadas, podendo ser técnicas tradicionais ou interativas. O objetivo desta pesquisa é comparar o desempenho do método de imputação por componentes principais (PCA) em três configurações de entrada dos dados. Este estudo analisou uma base de dados de Temperatura média e Umidade relativa do ar, para as cidades de Tete e Beira, obtida junto ao Instituto Nacional de Meteorologia em Moçambique, constituída por 1827 medidas diárias no período de 2016 a 2020. O método de imputação utilizado foi o EM-PCA e os dados tiveram três diferentes configurações de entrada. Uma com os dados originais de cada estação e outras duas com o agrupamento das variáveis, o que culminou na criação de três bases de dados distintas. Observou-se que a Base 1 não apresentou um resultado satisfatório; a Base 2 teve um resultado satisfatório; e a Base 3 também teve um resultado satisfatório, porém, os resultados da Base 2 corresponderam melhor ao comportamento dos dados observados.


Texto completo: PDF