Análise de temas de trabalho de conclusão de curso na rede federal: uma abordagem baseada em web scraping e visualização de dados

dc.contributor.advisorDeus, Gustavo Henrique Dornelas de
dc.contributor.advisorLatteshttp://lattes.cnpq.br/9041058533460556
dc.contributor.authorCaixeta, Ana Luísa
dc.date.accessioned2026-03-19T14:32:11Z
dc.date.available2026-03-19T14:32:11Z
dc.date.defense2025
dc.description.abstractEsta monografia aborda a lacuna na sistematização dos temas de TCCs desenvolvidos nos diversos cursos de ensino superior das instituições da Rede Federal de Educação Profissional, Científica e Tecnológica. O objetivo geral é analisar as respectivas temáticas por meio de técnicas de web scraping para coleta de dados e desenvolver um dashboard interativo para visualização e análise de dados acadêmicos. A metodologia envolveu a implementação de um sistema de web scraping assíncrono, que coletou 206.399 metadados de TCCs dos repositórios digitais de 30 instituições. Esses dados foram submetidos a um pipeline de Extração, Transformação e Carga (ETL), que resultou em 81.666 registros validados e estruturados em um modelo Star Schema. Subsequentemente, técnicas de Processamento de Linguagem Natural (PLN) e mineração de texto foram aplicadas, onde o algoritmo Latent Dirichlet Allocation (LDA) categorizou os trabalhos em 10 tópicos temáticos distintos. A análise dos resultados identificou tendências de crescimento, com destaque para o Tópico 0 "Aprendizagem, Matemática e Revisão"(coeficiente angular de 42,34), e a emergência de termos como "aplicativo"(crescimento de 554,3%). O projeto culminou no desenvolvimento de um dashboard interativo em Streamlit, que permite a exploração dinâmica dos dados. A pesquisa é classificada como aplicada, descritiva, exploratória, predominantemente quantitativa e técnica. Conclui-se que o artefato desenvolvido é funcional, atende aos requisitos propostos e demonstra que a arquitetura do pipeline é eficaz para transformar dados acadêmicos dispersos em insights estratégicos para gestores, pesquisadores e alunos.
dc.identifier.citationCAIXETA, Ana Luísa. Análise de temas de trabalho de conclusão de curso na rede federal: uma abordagem baseada em web scraping e visualização de dados. 2025. Orientador: Gustavo Henrique Dornelas de Deus. Trabalho de Conclusão de Curso (Tecnologia em Sistemas para Internet) — Instituto Federal de Brasília, Brasília, 2025.
dc.identifier.urihttps://repositorio.ifb.edu.br/handle/1/2263
dc.language.isoPortuguês (Brasil)
dc.publisherInstituto Federal de Brasília
dc.publisher.campusCampus Brasília
dc.publisher.countryBrasil
dc.publisher.initialsIFB
dc.publisher.programTecnologia em Sistemas para Internet
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectProcessamento de linguagem natural (Computação)
dc.subjectInstitutos federais de educação ciência e tecnologia
dc.subjectDashboards (Sistemas de informação gerencial)
dc.subjectMineração de dados (Computação)
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.titleAnálise de temas de trabalho de conclusão de curso na rede federal: uma abordagem baseada em web scraping e visualização de dados
dc.typebachelor thesis
dc.type.brTrabalho de Conclusão de Curso

Arquivo(s)

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Ana_Luísa_Caixeta_CBRA.pdf
Tamanho:
3.39 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.62 KB
Formato:
Item-specific license agreed to upon submission
Descrição:

Coleções