ALGORITMOS DE APRENDIZAGEM DE MÁQUINA NA MODELAGEM DA DISTRIBUIÇÃO POTENCIAL DE HABITATS DE ESPÉCIES ARBÓREAS
DOI:
10.31413/nativa.v7i5.7214Resumo
O estudo teve como objetivo avaliar três métodos de aprendizagem de máquina (árvore de decisão-J48, random forest e redes neurais artificias), na modelagem da distribuição de dez espécies arbóreas mais abundantes em uma sub-bacia do rio São Francisco (MG). Utilizaram-se dados provenientes do Inventário Florestal de Minas, com total de 77 fragmentos amostrados e 2.234 parcelas, nas quais foram computadas a presença/ausência de cada espécie. Empregaram-se 12 variáveis ambientais categóricas procedentes do Zoneamento Ecológico Econômico de Minas Gerais (ZEE/MG), além de variáveis relacionadas ao balanço hídrico do solo (evapotranspiração atual e potencial, aridez e índice alpha). A parametrização dos três algoritmos para as dez espécies selecionadas foi feita com o auxílio do algoritmo cv parameter do software WEKA. Os resultados mostram que os algoritmos testados apresentaram desempenhos estatisticamente iguais em 60% das espécies arbóreas. Os algoritmos random forest e multilayer perceptron foram estatisticamente iguais para a espécie Eugenia dysenterica, sendo superiores ao algoritmo J48. Contudo, o algoritmo random forest foi superior aos demais para as três espécies do gênero Qualea. Conclui-se que o algoritmo random forest apresentou-se como o mais robusto para a modelagem da distribuição potencial de habitat de espécies arbóreas.
Palavras-chave: inteligência artificial; árvore de decisão; random forest; redes neurais artificiais.
MACHINE LEARNING ALGORITHMS FOR MODELING THE POTENTIAL DISTRIBUTION HABITAT OF TREE SPECIES
ABSTRACT:
The aim of the present study was to evaluate three methods of machine learning (decision tree-J48, random forest and artificial neural networks) to model the potential habitat distribution of the ten most abundant tree species of the São Francisco river watershed. The presence/absence tree species data were from 77 fragments sampled with 2,234 plots. We used 12 categorical environmental variables from the Economic Ecological Zoning of Minas Gerais (ZEE/MG), as well as variables related to soil water balance (current and potential evapotranspiration, aridity and alpha index). The parameterization of the three algorithms was done with cv parameter algorithm of the WEKA software. The results showed the applied algorithms were statistically similar for 60% of the tree species. The random forest and multilayer perceptron algorithms were statistically similar considering the Eugenia dysenterica and superior to J48 algorithm. However, the random forest algorithm was superior to the other for the three species of Qualea genera. The conclusion is the random forest was the most robust model for the potential distribution habitat of tree species.
Keywords: artificial intelligence; decision trees; random forest; artificial neural networks.
Referências
AMISSAH, L.; MOHREN, G. M.; BONGERS, F.; HAWTHORNE, W. D.; POORTER, L. Rainfall and temperature affect tree species distribution in Ghana. Journal of Tropical Ecology, Cambridge, v. 30, n. 5, p. 435-446, 2014. DOI: http://dx.doi.org/10.1017/S026646741400025X
BHERING, S. B.; CHAGAS, C. S.; JUNIOR, W. C.; PEREIRA.; FILHO, B. C.; PINHEIRO, H. S. K. Mapeamento digital de areia, argila e carbono orgânico por modelos Random Forest sob diferentes resoluções espaciais. Pesquisa Agropecuária Brasileira, Brasília, v. 51, n. 9, p. 1359-1370, 2016. DOI: http://dx.doi.org/10.1590/S0100-204X2016000900035
BREIMAN, L. Random forests. Machine Learning, Boston, v.45, n.1, p.5-32, 2001.
CALLEGARO, R. N.; ARAUJO, M. M.; LONGHI, S. J.; ANDRZEJEWSKI, C. Influência de fatores ambientais sobre espécies vegetais em florestas estacionais para uso potencial em restauração. Nativa, Sinop, v. 6, n. 1, p. 91-99, 2018. DOI: http://dx.doi.org/10.31413/nativa.v6i1.4728
CANESSA, R.; SALDAÑA, A.; RÍOS, R. S.; GIANOLI, E. Functional trait variation predicts distribution of alien plant species across the light gradient in a temperate rainforest. Perspectives in Plant Ecology, Evolution and Systematics, Jena, v. 32, p. 49-55, 2018. DOI: https://dx.doi.org/10.1016/j.ppees.2018.04.002
CARVALHO, M. C.; GOMIDE, L. R.; SANTOS, R. M.; SCOLFORO, J. S.; CARVALHO, L. M. T.; MELLO, J. M. Modeling ecological niche of tree species in brazilian tropical area. Cerne, Lavras, v. 23, n. 2, p.229-240, jun. 2017. DOI: http://dx.doi.org/10.1590/01047760201723022308
CHAKRABORTY, A.; JOSHI, P. K.; SACHDEVA, K. Predicting distribution of major forest tree species to potential impacts of climate change in the central Himalayan region. Ecological Engineering, Oxford, v. 97, p. 593-609, 2016. DOI: http://dx.doi.org/10.1016/j.ecoleng.2016.10.006
COSTA, D. P.; COUTO, G. P.; SIQUEIRA, M. F.; CHURCHILL, S. P. Bryofloristic affinities betwwen Itatiaia National Park and tropical Andrean countries. Phytotaxa, Nova Zelândia, v. 346, n. 3, p. 203-220, 2018. DOI: https://doi.org/10.11646/phytotaxa.346.3.1
EHRLÉN, J.; MORRIS, W. F. Predicting changes in the distribution and abundance of species under environmental change. Ecology Letters, Oxford, v. 18, n. 3, p. 303-314, 2015. DOI: https://dx.doi.org/10.1111/ele.12410
ELITH, J.; GRAHAM, C. H.; ANDERSON, R. P.; DUDÍK, M.; FERRIER, S.; GUISAN, A.; HIJMANS, R.; HUETTMANN, F.; LEATHWICK, J.R.; LEHMANN, A.; LI, J.; LOHMANN, L. G.; LOISELLE, B. A.; MANION, G.; MORITZ, C.; NAKAMURA, M.; NAKAZAWA, Y.; OVERTON, J. McC.; PETERSON, T.; PHILLIPS, S. J.; RICHARDSON, K.; SCACHETTI-PEREIRA, R.; SCHAPIRE, R.; SOBERÓN, J.; WILLIAMNS, S.; WISZ, M. S.; ZIMMERMANN, N. E. Novel methods to improve prediction of species distributions from occurrence data. Ecography, Copenhagen, v. 29, n. 2, p. 129-151, 2006. DOI: https://dx.doi.org/10.1111/j.2006.0906-7590.04596.x
GARCÍA-CALLEJAS, D.; ARAÚJO, M. B. The effects of model and data complexity on predictions from species distributions models. Ecological modelling, Amsterdam, v. 326, p. 4-12, 2016. DOI: https://dx.doi.org/10.1016/j.ecolmodel.2015.06.002
GARNER, S. R. Weka: the Waikato environment for knowledge analysis. In: Proc. of the New Zealand Computer Science Research Students Conference, p. 57-64, 1995. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.54.3371>.
GARZÓN, M. B.; BLAZEK, R.; NETELER, M.; DIOS, R.S.; OLLERO, H.S.; FURLANELLO, C. Predicting habitat suitability with machine learning models: The potential area of Pinussylvestris L. um the Iberian Peninsula. Ecological Modelling, Amsterdam, v. 197, n. 3-4, p. 383-393, 2006. DOI: https://dx.doi.org/10.1016/j.ecolmodel.2006.03.015
GIANNINI, T. C.; SIQUEIRA, M. F.; ACOSTA, A. L.; BARRETO, F. C. C.; SARAIVA, A. M.; ALVES-DOS-SANTOS, I. Desafios atuais na modelagem preditiva de distribuição de espécies. Rodriguésia, Rio de Janeiro, v. 63, n. 3, p. 733-749, 2012. DOI: http://dx.doi.org/10.1590/S2175-78602012000300017
HENDERSON, E. B.; OHMANN, J. L.; GREGORY, M. J.; ROBERTS, H. M.; ZALD, H. Species distribution modelling for plant communities: stacked single species or multivariate modelling approaches?. Applied vegetation science, v. 17, n. 3, p. 516-527, 2014. DOI: https://dx.doi.org/10.1111/avsc.12085
HIJMANS, R. J.; CAMERON, S. E.; PARRA, J. L.; JONES, P. G.; JARVIS, A. Very high resolution interpolated climate surfaces for global land areas. International Journal of Climatology, Chichester, v. 25, n. 15, p. 1965-1978, 2005. DOI: https://dx.doi.org/10.1002/joc.1276
INZA, I.; CALVO, B.; ARMANANZAS, R.; BENGOETXEA, E.; LARRANAGA, P.; LOZANO, J. A. Machine Learnign: An Indispensable Tool in Bioinformatics. Bioinformatics Methods in Clinical Research, p. 25-48, 2009. DOI: https://dx.doi.org/10.1007/978-1-60327-194-3_2
JIMÉNEZ-VALVERDE, A. Insights into the area under the receiver operating characteristic curve (AUC) as a discrimination measure in species distribution modelling. Global Ecology and Biogeography, v. 21, n.4, p. 498 – 507, 2011. DOI: https://doi.org/10.1111/j.1466-8238.2011.00683.x
LORENA, A. C.; JACINTHO, L. F. O.; SIQUEIRA, M. F.; GIOVANNI, R.; LOHMANN, L. G.; CARVALHO, A. P. L. F.; YAMAMOTO, M. Comparing machine learning classifiers in potential distribution modelling. Expert Systems with Applications, New York, v. 38, n. 5, p. 5268-5275, 2011. DOI: https://dx.doi.org/10.1016/j.eswa.2010.10.031
MATEO, R. G.; GASTÓN, A.; AROCA-FERNANDEZ, M.J.; SAURA, S.; GARCÍA-VIÑAS, J. I. Optimization of forest sampling strategies for woody plant species distribution modelling at the landscape scale. Forest Ecology and Management, Amsterdam, v. 410, p. 104-113, 2018. DOI: https://dx.doi.org/10.1016/j.foreco.2017.12.046
MEROW, C.; SMITH, M. J.; EDWARDS, T. C.; GUISAN, A. McMAHON, S. M.; NORMAND, S.; THUILLER, W.; WUEST, R. O.; ZIMMERMANN, N. E.; ELITH, J. What do we gain from simplicity versus complexity in species distribution models? Ecography, Copenhagen, v. 37, n. 12, p. 1267-1281, 2014. DOI: https://dx.doi.org/10.1111/ecog.00845
MORENO-FERNÁNDEZ, D.; Space–time modeling of changes in the abundance and distribution of tree species. Forest Ecology and Management, Amsterdam, v. 372, p. 206-216, 2016. DOI: https://dx.doi.org/10.1016/j.foreco.2016.04.024
PAGLIA, A. P.; REZENDE, D. T.; KOCH, I.; KORTZ, A. R.; DONATTI, C. Modelos de distribuição de espécies em estratégias para a conservação da biodiversidade e para adaptação baseada em ecossistemas frente a mudanças climáticas. Natureza & Conservação, Curitiba, v. 10, n. 2, p. 231-234, 2012. DOI: http://dx.doi.org/10.4322/natcon.2012.031
QIN, A.; LIU, B.; GUO, Q.; BUSSMANN, R. W.; MA, F.; JIAN, Z.; XU, G.; PEI, S. Maxent modeling for predicting impacts of climate change on the potential distribution of Thuja sutchuenens is Franch., an extremely endangered conifer from southwestern China. Global Ecology and Conservation, v. 10, p. 139-146, 2017.DOI: https://dx.doi.org/10.1016/j.gecco.2017.02.004
QUINLAN, J. R. C4.5: programs for Machine Learning. Elsevier: 1993. 302 p.
ROBERTSON, M. P.; PETER, C. I.; VILLET, M.; RIPLEY, B.S. Comparing models for predicting species’ potential distributions: a case study using correlative and mechanism predictive modelling techniques. Ecological Modelling, Amsterdam, v. 164, n. 2-3, p. 153-167, 2003. DOI: https://dx.doi.org/10.1016/S0304-3800(03)00028-0
SCOLFORO, J. R. S. Biometria florestal: modelos de crescimento e produção florestal. Lavras: FAEPE–UFLA, 2006. 393 p.
SCOLFORO, J. R. S.; CARVALHO, L. M. T.; OLIVEIRA, A. D. Zoneamento ecológico-econômico do Estado de Minas Gerais: componentes geofísico e biótico. Lavras: Editora UFLA, 2008. 161 p.
SEGURADO, P.; ARAÚJO, M. B. An evaluation method for modelling species distributions. Journal of Biogeography, Oxford, v. 31, n. 10, p. 1555-1568, 2004.DOI: https://dx.doi.org/10.1111/j.1365-2699.2004.01076.x
SOUZA, R. A.; MARCO J. R. P. The use of species distribution models to predict the spatial distribution of deforestation in the western Brazilian Amazon. Ecological Modelling, Amsterdam, v. 291, p. 250-259, 2014. DOI: https://dx.doi.org/10.1016/j.ecolmodel.2014.07.007
TRABUCCO, A.; ZOMER, R. J. Global Soil Water Balance Geospatial Database. CGIAR Consortium for Spatial Information, 2010.
WAN, J. Z.; WANG, C. J.; YU, F. H. Modeling impacts of human footprint and soil variability on the potential distribution of invasive plant species in different biomes. Acta Oecologica, Paris, v. 85, 141-149, 2017. DOI: https://dx.doi.org/10.1016/j.actao.2017.10.008
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Direitos Autorais para artigos publicados nesta revista são do autor, com direitos de primeira publicação para a revista. Em virtude de a aparecerem nesta revista de acesso público, os artigos são de uso gratuito, com atribuições próprias, em aplicações educacionais e não-comerciais.
A artigos publicados nessa revista, podem ser reproduzidos parcialmente ou utilizados como referência por outros autores, desde que seja cita a fonte, ou seja, a Revista Nativa.
Copyright for articles published in this journal are the authors, with first publication rights granted to the journal. The journal shows open access, and articles are free to use, with proper attribution, in educational and non-commercial.
The articles published in this journal may be reproduced in part or used as a reference by other authors, provided that the source is quoted.