Use este identificador para citar ou linkar para este item:
http://repositorio.unesc.net/handle/1/11896
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | Oliveira, Marlon de Matos de | - |
dc.contributor.author | Possamai, Thiago Serafina | - |
dc.coverage.spatial | Universidade do Extremo Sul Catarinense | pt_BR |
dc.date.accessioned | 2025-07-18T00:12:52Z | - |
dc.date.available | 2025-07-18T00:12:52Z | - |
dc.date.created | 2025-07 | - |
dc.identifier.uri | http://repositorio.unesc.net/handle/1/11896 | - |
dc.description | Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC. | pt_BR |
dc.description.abstract | Este trabalho apresenta o desenvolvimento e a avaliação de um sistema automatizado para organização de documentos digitais no formato PDF utilizando técnicas de Machine Learning. O objetivo central é comparar diferentes abordagens de Inteligência Artificial, como Processamento de Linguagem Natural (PLN), Regressão Logística e o modelo BERT, aplicadas à classificação de documentos. Para isso, foram utilizadas duas bases de dados públicas, totalizando 4.901 documentos, divididos em até cinco categorias distintas, submetidas a etapas de pré-processamento, extração de texto e codificação de categorias. Embora existam estudos prévios aplicando IA à organização documental, muitos se concentram em domínios restritos ou em dados estruturados de forma simplificada. Os modelos foram treinados e avaliados com métricas de acurácia, precisão, recall e F1-score, além de terem sido integrados a uma API REST desenvolvida em Django. Este trabalho se diferencia ao propor uma comparação entre abordagens consolidadas de PLN aplicadas à classificação automatizada de arquivos PDF em larga escala, com aplicação prática em um sistema funcional. Os resultados demonstraram que, em cenários de maior complexidade textual, o modelo BERT atingiu acurácia de até 97% e F1-score acima de 0,95, enquanto a Regressão Logística obteve acurácia média de 92%, com quedas pontuais em algumas classes. Esses resultados destacam a robustez do BERT na classificação de documentos heterogêneos e sugerem que a utilização de técnicas avançadas de IA pode aprimorar significativamente a organização e a gestão de documentos digitais, proporcionando maior eficiência e confiabilidade aos processos. | pt_BR |
dc.language.iso | pt_BR | pt_BR |
dc.subject | Aprendizado de máquina | pt_BR |
dc.subject | Inteligência artificial | pt_BR |
dc.subject | Classificação de documentos | pt_BR |
dc.subject | Processamento de linguagem natural | pt_BR |
dc.subject | Regressão logística | pt_BR |
dc.title | Utilização de técnicas de machine learning para a organização de documentos digitais no formato PDF | pt_BR |
dc.type | Trabalho de Conclusão de Curso - TCC | pt_BR |
Aparece nas coleções: | Trabalho de Conclusão de Curso (COM) |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Thiago Serafina Possamai.pdf | TCC | 488,65 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.