Análise da qualidade dos dados do Sistema Nacional de Informações da Educação Profissional e Tecnológica do Instituto Federal de Brasília
Data da publicação
Data da defesa
Permissão de acesso
Orientador(a)
Lattes do Orientador
Diretor
Roteirista
Produtor executivo
Título da Revista
ISSN da Revista
Título de Volume
Título do periódico
Volume do periódico
Número da edição do periódico
Página inicial
Página final
Título do Evento
Número da edição do Evento
Nome da instituição
Editora
Local de edição
Campus
Departamento
DOI
ISBN
ISSN
ISMN
Outros identificadores
Resumo
O Conjunto de dados maior e mais complexo (Big Data) está presente em diversos setores públicos e privados, onde grandes volumes de dados são armazenados e usados para apoiar a tomada de decisões. Manter a qualidade e a integridade desses dados é um desafio, pois eles precisam seguir regras de negócio específicas para garantir que as informações sejam confiáveis. Segundo o grupo Total Data Quality Management do MIT, liderado pelo professor Richard Y. Wang, a qualidade dos dados é definida como “adequação para o uso”, considerando dimensões como exatidão, completude, integridade, unicidade, consistência, entre outras. No Brasil, o Sistema Nacional de Informações da Educação Profissional e Tecnológica (Sistec) coleta e armazena dados sobre cursos técnicos e tecnológicos. Este trabalho teve como objetivo validar os dados de matrículas do Sistec referentes ao Instituto Federal de Brasília (IFB), verificando se estão em conformidade com as regras de negócio e analisando a qualidade dos dados por meio de métricas específicas. Para isso, foram desenvolvidos scripts em Python que aplicaram as validações e mensuraram as dimensões da qualidade dos dados. Os resultados mostraram que, embora algumas dimensões apresentem boa qualidade, a consistência dos dados precisa ser melhorada, pois concentra a maioria das inconsistências. Após a análise, são sugeridas correções para reduzir as irregularidades nos dados, o que pode aumentar a qualidade das informações extraídas e evitar perdas causadas pela má qualidade.

