Aluno: THIAGO ALBERTO TURRA
Data/Hora: 18/12/2014 as 08:00
Local: Auditório do C3
Título: Árvores de Decisão na Previsão do Comportamento da Safra do Camarão-Rosa no Estuário da Lagoa dos Patos
Resumo:
O presente trabalho tem por objetivo analisar o comportamento da safra do camarão-rosa – Farfantepenaeus paulensis e Farfantepenaeus brasiliensis - no Estuário da Lagoa dos Patos (ELP), por meio do uso de técnicas de aprendizado de máquina. Neste contexto, o trabalho propõem inserir conhecimento especializado em um algoritmo de classificação utilizado para a determinação de modelos preditivos que descrevem o comportamento da safra. Para isso, foi escolhido como base de estudo o algoritmo de classificação de árvores de decisão principalmente devido a alta interpretabilidade dos modelos gerados, o que é muito importante em trabalhos interdisciplinares, e aos bons resultados na classificação obtidos por esse algoritmo. Os dados sobre a safra do camarão foram coletados ao longo de 16 anos e consistem em: atributos preditivos, que são compostos por valores de salinidade, transparência da água, tamanho do camarão, mês a mês e o atributo-alvo, a safra do camarão discretizada em 3 classes. Como a
safra é esperada em somente 4 meses do ano e o inicio do ciclo de vida do camarão inicia cerca de 4 meses antes da safra, os dados foram organizados de forma a reunir atributos preditivos de 4 meses para a previsão da safra no 5o mês. Assim, para cada ano que se tem informações de safra, apenas 4 instâncias foram descritas, o que corresponde aos meses de safra. Após um estudo aprofundado sobre o algoritmo de árvore de decisão C4.5 observou-se que este não considera a questão temporal dos dados que estão sendo avaliados, o que é um fator muito importante na classificação da safra do camarão-rosa. Dessa forma, propõem-se um algoritmo de árvore de decisão, baseado no C4.5 implementado no J48 do software WEKA, que considera a temporalidade dos dados na indução da árvore. O algoritmo proposto foi implementado por meio de uma modificação no algoritmo J48 onde incluiu-se uma avaliação da série temporal de forma Regressiva (somente atributos do ultimo mês no nodo raiz e indo regressivamente olhando os atributos nos meses anteriores nos nodos internos) e outra Progressiva (nodo raiz com atributo do primeiro mês e progressivamente vai analisando os atributos dos meses subsequentes). Considerando o mesma base de dados, aplicou-se o algoritmo J48 original e a acurácia obtida foi de 53.33%. Com o algoritmo J48 modificado foi obtida uma acurácia de 83.33% para o algoritmo progressivo e 80% para o regressivo. Os resultados obtidos mostram que o algoritmo proposto foi capaz de induzir melhores modelos que o J48 original e destacar os atributos mais influentes no processo de recrutamento do camarão-rosa.
Banca:
Profa. Msc. Paulo Lilles Jorge Drews Junior (orientador)
Profa. Dra. Karina dos Santos Machado (co-orientadora)
Prof. Dr. Cleo Zanella Billa
Prof. Dr. Eduardo Nunes Borges