Use este identificador para citar ou linkar para este item:
http://repositorio.unesc.net/handle/1/8150
Título: | Os métodos bayesianos de aprendizado de máquina pelos algoritmos naïve bayes e redes de crença na predição de período chuvoso na cidade de Blumenau |
Autor(es): | Dias, Bruna Baldini |
Orientador(es): | Garcia, Merisandra Côrtes de Mattos |
Palavras-chave: | Aprendizado de máquina Data mining Algoritmos bayesianos Naïve Bayes Rede de crenças bayesiana |
Descrição: | Trabalho de Conclusão de Curso, apresentado para obtenção do grau de bacharel no curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC. |
Resumo: | Com a crescente quantidade de dados, surgiu a demanda de novos métodos para a análise destes. Para resolver este problema, originou-se o data mining, que consiste em várias tarefas e técnicas para analisar grandes quantidades de dados e descobrir novas informações e conhecimento ocultados nestes. Uma das tarefas de data mining é a classificação, uma forma supervisionada de aprendizado de máquina que atribui um objeto à uma classe pré-definida dentro de um conjunto. A tarefa de classificação consiste em duas etapas: a fase de treinamento, onde um modelo é construído a partir de um conjunto de dados reservados para esta etapa; e a fase de teste, onde ocorre a validação do modelo obtido na etapa anterior em um conjunto de dados desconhecido. Há vários algoritmos disponíveis para a realização da classificação. Esta pesquisa consiste na identificação de um modelo de predição de período chuvoso na cidade de Blumenau por meio da tarefa de classificação bayesiana. Os algoritmos empregados são o Naive Bayes e o de Redes de Crença. O algoritmo Naïve Bayes determina a probabilidade condicional das classes assumindo que os atributos sejam condicionalmente independentes uns dos outros. O algoritmo de rede de crenças apresenta os resultados de forma gráfica, por meio de um grafo acíclico direcionado. A ferramenta de data mining escolhida para a realização desta pesquisa foi o Weka 3.8, por possuir licença gratuita e apresentar os algoritmos necessários. Os dados empregados foram disponibilizados pela Agência Nacional das Águas na ferramenta Hidroweb. O conjunto é constituído de dados pluviométricos coletados na estação do bairro Itoupava Central na cidade de Blumenau. O modelo gerado pelo algoritmo Naïve Bayes obteve uma acurácia de 85,36% na fase de teste, enquanto o algoritmo de rede de crenças obteve uma acurácia de 89,57%. Após a aplicação das medidas de qualidade para classificadores em data mining e a comparação dos mesmos, conclui-se que o modelo gerado pelo algoritmo de rede de crenças possui melhor acurácia e resultados superiores nas demais medidas de qualidade para classificadores empregadas, como a taxa de erro, Area Under Curve, estatística kappa, proporção de falsos positivos, proporção de falsos negativos, sensibilidade, especificidade, precisão e F-score. |
Idioma: | Português (Brasil) |
Tipo: | Trabalho de Conclusão de Curso - TCC |
Data da publicação: | Dez-2018 |
URI: | http://repositorio.unesc.net/handle/1/8150 |
Aparece nas coleções: | Trabalho de Conclusão de Curso (COM) |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
BRUNA BALDINI DIAS.pdf | TCC | 1,74 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.