Ciência de dados e IA Trabalho Projeto Integrado Pós-Graduação E2A
Item 1 . Para realizarmos um projeto de mineração de dados, o primeiro é selecionar a base de dados e explorar dos dados desta base, no intuito de obtermos um entendimento inicial sobre o problema. Diante disto, utilize a biblioteca Pandas do Python para criar um Data Frame a partir da base de dados da dengue disponibilizada e exiba os 5 primeiros elementos deste conjunto usando o comando head().
Item 2. o segundo do passo de um projeto de mineração de dados é o da transformação dos dados para posterior utilização no modelo de aprendizagem. Para o problema de diagnóstico da dengue será utilizado o modelo KNeighborsClassifier. Para usar este modelo, transforme os registros que possuem os valores ‘sim’ e ‘nao’ da base de dados da dengue em binários 1 e 0, respectivamente. Exiba os registros atualizados utilizando o comando head() da biblioteca Pandas.
Item 3 . Logo após a transformação, tem-se, finalmente, o passo de mineração de dados. Para esta etapa, divida a base de dados da dengue em treinamento e teste. Logo após, selecione o algoritmo KNeighborsClassifier(), utilize o comando fit para treinar o modelo e o comando predict para aplicar o método de predição. Apresente a matriz de confusão e a acurácia do modelo.
Os arquivos estão separados em 3 etapas, para mostrar a evolução de cada item.
Desenvolvido em 24/08/2024 ppor Hugo Rosa