Análise da qualidade dos dados do Sistema Nacional de Informações da Educação Profissional e Tecnológica do Instituto Federal de Brasília

Data da publicação

Data da defesa

2025

Permissão de acesso

Diretor

Roteirista

Produtor executivo

Título da Revista

ISSN da Revista

Título de Volume

Título do periódico

Volume do periódico

Número da edição do periódico

Página inicial

Página final

Título do Evento

Número da edição do Evento

Nome da instituição

Instituto Federal de Brasília

Editora

Local de edição

Departamento

DOI

ISBN

ISSN

ISMN

Outros identificadores

Resumo

O Conjunto de dados maior e mais complexo (Big Data) está presente em diversos setores públicos e privados, onde grandes volumes de dados são armazenados e usados para apoiar a tomada de decisões. Manter a qualidade e a integridade desses dados é um desafio, pois eles precisam seguir regras de negócio específicas para garantir que as informações sejam confiáveis. Segundo o grupo Total Data Quality Management do MIT, liderado pelo professor Richard Y. Wang, a qualidade dos dados é definida como “adequação para o uso”, considerando dimensões como exatidão, completude, integridade, unicidade, consistência, entre outras. No Brasil, o Sistema Nacional de Informações da Educação Profissional e Tecnológica (Sistec) coleta e armazena dados sobre cursos técnicos e tecnológicos. Este trabalho teve como objetivo validar os dados de matrículas do Sistec referentes ao Instituto Federal de Brasília (IFB), verificando se estão em conformidade com as regras de negócio e analisando a qualidade dos dados por meio de métricas específicas. Para isso, foram desenvolvidos scripts em Python que aplicaram as validações e mensuraram as dimensões da qualidade dos dados. Os resultados mostraram que, embora algumas dimensões apresentem boa qualidade, a consistência dos dados precisa ser melhorada, pois concentra a maioria das inconsistências. Após a análise, são sugeridas correções para reduzir as irregularidades nos dados, o que pode aumentar a qualidade das informações extraídas e evitar perdas causadas pela má qualidade.

Descrição

Áreas do conhecimento (CNPq)

CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO

Referência

Silva, Nínive Helen Horário da. Análise da qualidade dos dados do Sistema Nacional de Informações da Educação Profissional e Tecnológica do Instituto Federal de Brasília. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Campus Taguatinga, Instituto Federal de Brasília. 2025.

Agência de fomento

Link externo

Link multimídia

Coleções