Use este identificador para citar ou linkar para este item: http://repositorio.unesc.net/handle/1/8183
Título: Modelo de predição utilizando comitê de classificadores para identificação de perfis de interação no ambiente virtual de aprendizagem
Autor(es): Dimer, Laíne
Orientador(es): Garcia, Merisandra Côrtes de Mattos
Palavras-chave: Educational data mining
Descoberta do conhecimento
Bases de dados
Comitê de classificadores
Educação à distância
Algoritmo Random Subspace
Descrição: Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.
Resumo: A procura por padrões de comportamento, hábitos e escolhas ocorre desde o início da vida humana. Atualmente, a sociedade se abastece de informações, as quais são encontradas em sua forma bruta, em dados, sendo necessário compreendê-los. A descoberta de conhecimento em base de dados, do inglês knowledge discovery in database, é um processo constituído por etapas para encontrar padrões e modelos válidos. A etapa de data mining, é responsável por explorar grandes quantidades de dados para encontrar os modelos, com o aumento da procura por padrões e perfis de estudantes em ambientes virtuais de aprendizagem, surgiu a mineração de dados educacionais, do inglês educational data mining, a qual adapta tarefas originalmente de data mining para explorar dados educacionais. A classificação é uma de suas tarefas e para obterem-se resultados precisos ao invés de utilizar apenas um único classificador pode-se utilizar a técnica de comitê de classificadores, a qual combina diversos classificadores básicos que ao final geram saídas diferentes, sendo necessário combiná-las de alguma forma. Em comitê de classificadores existem diversas técnicas que variam na forma da construção dos algoritmos e a combinação das saídas, pode-se citar o método de boosting, e o algoritmo de variação adaboost.M1, o qual tem foco em instâncias difíceis de classificar, atribuindo pesos ponderados. Outro algoritmo é o random subspace, que por sua vez utiliza um subconjunto aleatório de características dos dados para melhorar a relação entre a instância e a característica. O objetivo dessa pesquisa é aplicar educational data mining em uma base de dados do Moodle da Universidade do Extremo Sul Catarinense de modalidade a distância, a fim de definir perfis de interação dos alunos, baseando-se nas três interações de Moore, como: aluno-ambiente, aluno-professor e aluno-aluno, a ponto de predizer quais alunos tem mais chances de aprovação e reprovação por meio dos modelos obtidos pelos algoritmos de comitê de classificação adaboost.M1 e random subspace. A fim de identificar o modelo que obteve melhor desempenho, os resultados são comparados por meio de medidas de qualidade em classificação, para isso foram realizados 6 experimentos para verificar quais técnicas de pré-processamento interferem nos resultados das medidas utilizadas, tais como acurácia, coeficiente Kappa, TP-Rate e F-Measure. Pode-se observar que melhores resultados foram encontrados ao utilizar técnica de balanceamento de classes, podendo destacar os algoritmos adaboost.M1 e random subspace utilizando o classificador random forest como base, que chegaram a percentuais de acurácia como 93,51% e 93,77%, respectivamente. O modelo final encontrado, após analises, foi do algoritmo random subspace utilizando random forest, que alcançou em TP-Rate, 0,975 para classe “A” e 0,904 para “R”, mostrando resultados adequados para o objetivo proposto.
Idioma: Português (Brasil)
Tipo: Trabalho de Conclusão de Curso - TCC
Data da publicação: Jul-2019
URI: http://repositorio.unesc.net/handle/1/8183
Aparece nas coleções:Trabalho de Conclusão de Curso (COM)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
LAÍNE DIMER.pdfTCC2,5 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.