Use este identificador para citar ou linkar para este item: http://repositorio.unesc.net/handle/1/9138
Título: Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql
Autor(es): Souza, Ânderson Luís de
Orientador(es): Martins, Paulo João
Palavras-chave: Mineração de dados
Descoberta de conhecimento
Base de dados
Dados pessoais
Twitter (Rede social on-line)
Descrição: Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.
Resumo: O crescimento acelerado dos sites de redes sociais nos últimos anos criou uma enorme base de dados. Dentre o grande volume de informações compartilhadas diariamente, encontram-se dados que comprometem a segurança dos usuários. Atentos a esses dados, existem pessoas mal-intencionadas e à espera de qualquer tipo de informação que possa lhes trazer vantagens sobre determinado usuário. Utilizando de técnicas de engenharia social, alguns poucos dados são suficientes para planejar ataques diretos. O propósito desse trabalho foi realizar uma análise na rede social Twitter, utilizando técnicas de Descoberta de conhecimento em base de dados para localizar dados que possam ser possíveis alvos da engenharia social. Para execução das etapas de descoberta de conhecimento foram implementados algoritmos na linguagem de programação Python e os dados foram armazenados no banco de dados relacional MySQL. Para realizar extração dos dados da rede social, foi utilizado a biblioteca tweepy e para classificação dos dados, a biblioteca sklearn. Utilizando a biblioteca sklearn, dois modelos foram testados: Máquinas de Vetores de Suporte e Multinomial Naive Bayes. O modelo de Máquinas de Vetores de Suporte se mostrou superior e foi selecionado para realizar a classificação da base principal. Os resultados mostraram que mais de 99% dos usuários possuem algum tipo de exposição, porém, a falta da validação de um dos campos, diminuiu a credibilidade dos resultados. Ao final, o resultado foi satisfatório, identificando-se que uma pequena parcela dos usuários compartilha dados pessoais suscetíveis a ataques de engenharia social.
Idioma: Português (Brasil)
Tipo: Trabalho de Conclusão de Curso - TCC
Data da publicação: Dez-2021
URI: http://repositorio.unesc.net/handle/1/9138
Aparece nas coleções:Trabalho de Conclusão de Curso (COM)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Anderson de Souza.pdfTCC363,46 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.