Análise de temas de trabalho de conclusão de curso na rede federal: uma abordagem baseada em web scraping e visualização de dados
| dc.contributor.advisor | Deus, Gustavo Henrique Dornelas de | |
| dc.contributor.advisorLattes | http://lattes.cnpq.br/9041058533460556 | |
| dc.contributor.author | Caixeta, Ana Luísa | |
| dc.date.accessioned | 2026-03-19T14:32:11Z | |
| dc.date.available | 2026-03-19T14:32:11Z | |
| dc.date.defense | 2025 | |
| dc.description.abstract | Esta monografia aborda a lacuna na sistematização dos temas de TCCs desenvolvidos nos diversos cursos de ensino superior das instituições da Rede Federal de Educação Profissional, Científica e Tecnológica. O objetivo geral é analisar as respectivas temáticas por meio de técnicas de web scraping para coleta de dados e desenvolver um dashboard interativo para visualização e análise de dados acadêmicos. A metodologia envolveu a implementação de um sistema de web scraping assíncrono, que coletou 206.399 metadados de TCCs dos repositórios digitais de 30 instituições. Esses dados foram submetidos a um pipeline de Extração, Transformação e Carga (ETL), que resultou em 81.666 registros validados e estruturados em um modelo Star Schema. Subsequentemente, técnicas de Processamento de Linguagem Natural (PLN) e mineração de texto foram aplicadas, onde o algoritmo Latent Dirichlet Allocation (LDA) categorizou os trabalhos em 10 tópicos temáticos distintos. A análise dos resultados identificou tendências de crescimento, com destaque para o Tópico 0 "Aprendizagem, Matemática e Revisão"(coeficiente angular de 42,34), e a emergência de termos como "aplicativo"(crescimento de 554,3%). O projeto culminou no desenvolvimento de um dashboard interativo em Streamlit, que permite a exploração dinâmica dos dados. A pesquisa é classificada como aplicada, descritiva, exploratória, predominantemente quantitativa e técnica. Conclui-se que o artefato desenvolvido é funcional, atende aos requisitos propostos e demonstra que a arquitetura do pipeline é eficaz para transformar dados acadêmicos dispersos em insights estratégicos para gestores, pesquisadores e alunos. | |
| dc.identifier.citation | CAIXETA, Ana Luísa. Análise de temas de trabalho de conclusão de curso na rede federal: uma abordagem baseada em web scraping e visualização de dados. 2025. Orientador: Gustavo Henrique Dornelas de Deus. Trabalho de Conclusão de Curso (Tecnologia em Sistemas para Internet) — Instituto Federal de Brasília, Brasília, 2025. | |
| dc.identifier.uri | https://repositorio.ifb.edu.br/handle/1/2263 | |
| dc.language.iso | Português (Brasil) | |
| dc.publisher | Instituto Federal de Brasília | |
| dc.publisher.campus | Campus Brasília | |
| dc.publisher.country | Brasil | |
| dc.publisher.initials | IFB | |
| dc.publisher.program | Tecnologia em Sistemas para Internet | |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | |
| dc.subject | Processamento de linguagem natural (Computação) | |
| dc.subject | Institutos federais de educação ciência e tecnologia | |
| dc.subject | Dashboards (Sistemas de informação gerencial) | |
| dc.subject | Mineração de dados (Computação) | |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | |
| dc.title | Análise de temas de trabalho de conclusão de curso na rede federal: uma abordagem baseada em web scraping e visualização de dados | |
| dc.type | bachelor thesis | |
| dc.type.br | Trabalho de Conclusão de Curso |

