Abordagem dos algoritmos de agrupamento K-means e Fuzzy c-means na identificação de zonas pluviométricas em santa catarina utilizando o modelo de processo crisp-dm

Pacheco, Daniel Nunes

Use este identificador para citar ou linkar para este item: http://repositorio.unesc.net/handle/1/8152

Título:	Abordagem dos algoritmos de agrupamento K-means e Fuzzy c-means na identificação de zonas pluviométricas em santa catarina utilizando o modelo de processo crisp-dm
Autor(es):	Pacheco, Daniel Nunes
Orientador(es):	Garcia, Merisandra Côrtes de Mattos
Palavras-chave:	Big data Data mining Algoritmo K-means Algoritmo Fuzzy C-means
Descrição:	Trabalho de Conclusão de Curso, apresentado para obtenção do grau de bacharel no curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.
Resumo:	A precipitação pluviométrica influencia diretamente na economia do Estado de Santa Catarina, devido ao destaque na agricultura catarinense. Visto que a Organização Meteorológica Mundial recomenda a utilização de trinta anos de dados históricos para encontrar padrões que não tenham interferências com eventos adversos que ocorreram na região se faz necessária a utilização de técnicas computacionais. Existem alguns métodos disponíveis que visam auxiliar na análise desses dados, um deles é conhecido como CRoss-Industry Standart Process for Data Mining, possuindo seis etapas em seu processo. Dentre essas etapas, se encontra a de data mining, caracterizada pela extração de informações implícitas e potencialmente úteis contidas em um conjunto de dados. O agrupamento, uma das tarefas de data mining, tem como objetivo identificar objetos semelhantes entre si por meio da aplicação de técnicas para descrever os dados. A fim de avaliar o agrupamento gerado, são adotadas medidas de qualidade, que consistem em índices estatísticos, responsáveis por verificar os resultados obtidos. Esta pesquisa tem como objetivo comparar por meio de medidas de qualidade os algoritmos de agrupamento K-means e Fuzzy C-means na identificação de zonas pluviométricas homogêneas no estado de Santa Catarina. Compreendendo as etapas de entendimento e preparação dos dados, data mining, avaliação e discussão dos resultados obtidos. Para definir a quantidade de clusters foram avaliados os índices de qualidade Xie and Beni, Coeficiente de Participação e Coeficiente de Entropia para os resultados do Fuzzy C-means, e no algoritmo K-means foram utilizados os índices Sum of Squared Errors e Prior Probability. Ambos os algoritmos apresentaram melhores resultados ao se utilizar três clusters, no entanto o Fuzzy C-means se demonstrou melhor na espacialização dos objetos dentro dos clusters e nas médias pluviométricas (1.448,18mm, 1.364,10mm, 1.665,05mm), apresentando resultados mais homogêneos, enquanto o K-means dividiu as estações de forma mais abrupta apresentando uma média de precipitação crescente (1.040,71mm, 1.553,85mm, 1.837,37mm), identificando clusters heterogêneos. Mediante este estudo, conclui-se que o algoritmo Fuzzy C-means apresenta melhores resultados na identificação de zona pluviometricamente homogêneas no Estado de Santa Catarina.
Idioma:	Português (Brasil)
Tipo:	Trabalho de Conclusão de Curso - TCC
Data da publicação:	Dez-2018
URI:	http://repositorio.unesc.net/handle/1/8152
Aparece nas coleções:	Trabalho de Conclusão de Curso (COM)

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
DANIEL NUNES PACHECO.pdf	TCC	4,13 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas