ALGORITMOS DE APRENDIZAGEM DE MÁQUINA NA MODELAGEM DA DISTRIBUIÇÃO POTENCIAL DE HABITATS DE ESPÉCIES ARBÓREAS

Autores

  • Mônica Canaan Carvalho monicacanaan@gmail.com.br
    Professora, Instituto Federal do Sudeste de Minas Gerais (IFSULDESTEMG), Barbacena, MG
  • Luciano Cavalcante de Jesus França lucianodejesus@florestal.eng.br
    Doutorando em Engenharia Florestal, Universidade Federal de Lavras (UFLA) http://orcid.org/0000-0002-8885-972X
  • Isaira Leite e Lopes isairaleite2010@gmail.com
    Doutoranda em Engenharia Florestal, Universidade Federal de Lavras (UFLA)
  • Laís Almeida Araújo la_sal@hotmail.com
    Mestranda em Engenharia Florestal, Universidade Federal de Lavras (UFLA)
  • José Márcio de Mello josemarcio@dcf.ufla.br
    Professor Drº, Universidade Federal de Lavras (UFLA)
  • Lucas Rezende Gomide lucasgomide@dcf.ufla.br
    Professor Drº, Universidade Federal de Lavras (UFLA) http://orcid.org/0000-0002-4781-0428

DOI:

10.31413/nativa.v7i5.7214

Resumo

O estudo teve como objetivo avaliar três métodos de aprendizagem de máquina (árvore de decisão-J48, random forest e redes neurais artificias), na modelagem da distribuição de dez espécies arbóreas mais abundantes em uma sub-bacia do rio São Francisco (MG). Utilizaram-se dados provenientes do Inventário Florestal de Minas, com total de 77 fragmentos amostrados e 2.234 parcelas, nas quais foram computadas a presença/ausência de cada espécie. Empregaram-se 12 variáveis ambientais categóricas procedentes do Zoneamento Ecológico Econômico de Minas Gerais (ZEE/MG), além de variáveis relacionadas ao balanço hídrico do solo (evapotranspiração atual e potencial, aridez e índice alpha). A parametrização dos três algoritmos para as dez espécies selecionadas foi feita com o auxílio do algoritmo cv parameter do software WEKA. Os resultados mostram que os algoritmos testados apresentaram desempenhos estatisticamente iguais em 60% das espécies arbóreas. Os algoritmos random forest e multilayer perceptron foram estatisticamente iguais para a espécie Eugenia dysenterica, sendo superiores ao algoritmo J48. Contudo, o algoritmo random forest foi superior aos demais para as três espécies do gênero Qualea. Conclui-se que o algoritmo random forest apresentou-se como o mais robusto para a modelagem da distribuição potencial de habitat de espécies arbóreas.

Palavras-chave: inteligência artificial; árvore de decisão; random forest; redes neurais artificiais.

 

MACHINE LEARNING ALGORITHMS FOR MODELING THE POTENTIAL DISTRIBUTION HABITAT OF TREE SPECIES

 

ABSTRACT:

The aim of the present study was to evaluate three methods of machine learning (decision tree-J48, random forest and artificial neural networks) to model the potential habitat distribution of the ten most abundant tree species of the São Francisco river watershed. The presence/absence tree species data were from 77 fragments sampled with 2,234 plots. We used 12 categorical environmental variables from the Economic Ecological Zoning of Minas Gerais (ZEE/MG), as well as variables related to soil water balance (current and potential evapotranspiration, aridity and alpha index). The parameterization of the three algorithms was done with cv parameter algorithm of the WEKA software. The results showed the applied algorithms were statistically similar for 60% of the tree species. The random forest and multilayer perceptron algorithms were statistically similar considering the Eugenia dysenterica and superior to J48 algorithm. However, the random forest algorithm was superior to the other for the three species of Qualea genera. The conclusion is the random forest was the most robust model for the potential distribution habitat of tree species.

Keywords: artificial intelligence; decision trees; random forest; artificial neural networks.

Referências

AMISSAH, L.; MOHREN, G. M.; BONGERS, F.; HAWTHORNE, W. D.; POORTER, L. Rainfall and temperature affect tree species distribution in Ghana. Journal of Tropical Ecology, Cambridge, v. 30, n. 5, p. 435-446, 2014. DOI: http://dx.doi.org/10.1017/S026646741400025X

BHERING, S. B.; CHAGAS, C. S.; JUNIOR, W. C.; PEREIRA.; FILHO, B. C.; PINHEIRO, H. S. K. Mapeamento digital de areia, argila e carbono orgânico por modelos Random Forest sob diferentes resoluções espaciais. Pesquisa Agropecuária Brasileira, Brasília, v. 51, n. 9, p. 1359-1370, 2016. DOI: http://dx.doi.org/10.1590/S0100-204X2016000900035

BREIMAN, L. Random forests. Machine Learning, Boston, v.45, n.1, p.5-32, 2001.

CALLEGARO, R. N.; ARAUJO, M. M.; LONGHI, S. J.; ANDRZEJEWSKI, C. Influência de fatores ambientais sobre espécies vegetais em florestas estacionais para uso potencial em restauração. Nativa, Sinop, v. 6, n. 1, p. 91-99, 2018. DOI: http://dx.doi.org/10.31413/nativa.v6i1.4728

CANESSA, R.; SALDAÑA, A.; RÍOS, R. S.; GIANOLI, E. Functional trait variation predicts distribution of alien plant species across the light gradient in a temperate rainforest. Perspectives in Plant Ecology, Evolution and Systematics, Jena, v. 32, p. 49-55, 2018. DOI: https://dx.doi.org/10.1016/j.ppees.2018.04.002

CARVALHO, M. C.; GOMIDE, L. R.; SANTOS, R. M.; SCOLFORO, J. S.; CARVALHO, L. M. T.; MELLO, J. M. Modeling ecological niche of tree species in brazilian tropical area. Cerne, Lavras, v. 23, n. 2, p.229-240, jun. 2017. DOI: http://dx.doi.org/10.1590/01047760201723022308

CHAKRABORTY, A.; JOSHI, P. K.; SACHDEVA, K. Predicting distribution of major forest tree species to potential impacts of climate change in the central Himalayan region. Ecological Engineering, Oxford, v. 97, p. 593-609, 2016. DOI: http://dx.doi.org/10.1016/j.ecoleng.2016.10.006

COSTA, D. P.; COUTO, G. P.; SIQUEIRA, M. F.; CHURCHILL, S. P. Bryofloristic affinities betwwen Itatiaia National Park and tropical Andrean countries. Phytotaxa, Nova Zelândia, v. 346, n. 3, p. 203-220, 2018. DOI: https://doi.org/10.11646/phytotaxa.346.3.1

EHRLÉN, J.; MORRIS, W. F. Predicting changes in the distribution and abundance of species under environmental change. Ecology Letters, Oxford, v. 18, n. 3, p. 303-314, 2015. DOI: https://dx.doi.org/10.1111/ele.12410

ELITH, J.; GRAHAM, C. H.; ANDERSON, R. P.; DUDÍK, M.; FERRIER, S.; GUISAN, A.; HIJMANS, R.; HUETTMANN, F.; LEATHWICK, J.R.; LEHMANN, A.; LI, J.; LOHMANN, L. G.; LOISELLE, B. A.; MANION, G.; MORITZ, C.; NAKAMURA, M.; NAKAZAWA, Y.; OVERTON, J. McC.; PETERSON, T.; PHILLIPS, S. J.; RICHARDSON, K.; SCACHETTI-PEREIRA, R.; SCHAPIRE, R.; SOBERÓN, J.; WILLIAMNS, S.; WISZ, M. S.; ZIMMERMANN, N. E. Novel methods to improve prediction of species distributions from occurrence data. Ecography, Copenhagen, v. 29, n. 2, p. 129-151, 2006. DOI: https://dx.doi.org/10.1111/j.2006.0906-7590.04596.x

GARCÍA-CALLEJAS, D.; ARAÚJO, M. B. The effects of model and data complexity on predictions from species distributions models. Ecological modelling, Amsterdam, v. 326, p. 4-12, 2016. DOI: https://dx.doi.org/10.1016/j.ecolmodel.2015.06.002

GARNER, S. R. Weka: the Waikato environment for knowledge analysis. In: Proc. of the New Zealand Computer Science Research Students Conference, p. 57-64, 1995. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.54.3371>.

GARZÓN, M. B.; BLAZEK, R.; NETELER, M.; DIOS, R.S.; OLLERO, H.S.; FURLANELLO, C. Predicting habitat suitability with machine learning models: The potential area of Pinussylvestris L. um the Iberian Peninsula. Ecological Modelling, Amsterdam, v. 197, n. 3-4, p. 383-393, 2006. DOI: https://dx.doi.org/10.1016/j.ecolmodel.2006.03.015

GIANNINI, T. C.; SIQUEIRA, M. F.; ACOSTA, A. L.; BARRETO, F. C. C.; SARAIVA, A. M.; ALVES-DOS-SANTOS, I. Desafios atuais na modelagem preditiva de distribuição de espécies. Rodriguésia, Rio de Janeiro, v. 63, n. 3, p. 733-749, 2012. DOI: http://dx.doi.org/10.1590/S2175-78602012000300017

HENDERSON, E. B.; OHMANN, J. L.; GREGORY, M. J.; ROBERTS, H. M.; ZALD, H. Species distribution modelling for plant communities: stacked single species or multivariate modelling approaches?. Applied vegetation science, v. 17, n. 3, p. 516-527, 2014. DOI: https://dx.doi.org/10.1111/avsc.12085

HIJMANS, R. J.; CAMERON, S. E.; PARRA, J. L.; JONES, P. G.; JARVIS, A. Very high resolution interpolated climate surfaces for global land areas. International Journal of Climatology, Chichester, v. 25, n. 15, p. 1965-1978, 2005. DOI: https://dx.doi.org/10.1002/joc.1276

INZA, I.; CALVO, B.; ARMANANZAS, R.; BENGOETXEA, E.; LARRANAGA, P.; LOZANO, J. A. Machine Learnign: An Indispensable Tool in Bioinformatics. Bioinformatics Methods in Clinical Research, p. 25-48, 2009. DOI: https://dx.doi.org/10.1007/978-1-60327-194-3_2

JIMÉNEZ-VALVERDE, A. Insights into the area under the receiver operating characteristic curve (AUC) as a discrimination measure in species distribution modelling. Global Ecology and Biogeography, v. 21, n.4, p. 498 – 507, 2011. DOI: https://doi.org/10.1111/j.1466-8238.2011.00683.x

LORENA, A. C.; JACINTHO, L. F. O.; SIQUEIRA, M. F.; GIOVANNI, R.; LOHMANN, L. G.; CARVALHO, A. P. L. F.; YAMAMOTO, M. Comparing machine learning classifiers in potential distribution modelling. Expert Systems with Applications, New York, v. 38, n. 5, p. 5268-5275, 2011. DOI: https://dx.doi.org/10.1016/j.eswa.2010.10.031

MATEO, R. G.; GASTÓN, A.; AROCA-FERNANDEZ, M.J.; SAURA, S.; GARCÍA-VIÑAS, J. I. Optimization of forest sampling strategies for woody plant species distribution modelling at the landscape scale. Forest Ecology and Management, Amsterdam, v. 410, p. 104-113, 2018. DOI: https://dx.doi.org/10.1016/j.foreco.2017.12.046

MEROW, C.; SMITH, M. J.; EDWARDS, T. C.; GUISAN, A. McMAHON, S. M.; NORMAND, S.; THUILLER, W.; WUEST, R. O.; ZIMMERMANN, N. E.; ELITH, J. What do we gain from simplicity versus complexity in species distribution models? Ecography, Copenhagen, v. 37, n. 12, p. 1267-1281, 2014. DOI: https://dx.doi.org/10.1111/ecog.00845

MORENO-FERNÁNDEZ, D.; Space–time modeling of changes in the abundance and distribution of tree species. Forest Ecology and Management, Amsterdam, v. 372, p. 206-216, 2016. DOI: https://dx.doi.org/10.1016/j.foreco.2016.04.024

PAGLIA, A. P.; REZENDE, D. T.; KOCH, I.; KORTZ, A. R.; DONATTI, C. Modelos de distribuição de espécies em estratégias para a conservação da biodiversidade e para adaptação baseada em ecossistemas frente a mudanças climáticas. Natureza & Conservação, Curitiba, v. 10, n. 2, p. 231-234, 2012. DOI: http://dx.doi.org/10.4322/natcon.2012.031

QIN, A.; LIU, B.; GUO, Q.; BUSSMANN, R. W.; MA, F.; JIAN, Z.; XU, G.; PEI, S. Maxent modeling for predicting impacts of climate change on the potential distribution of Thuja sutchuenens is Franch., an extremely endangered conifer from southwestern China. Global Ecology and Conservation, v. 10, p. 139-146, 2017.DOI: https://dx.doi.org/10.1016/j.gecco.2017.02.004

QUINLAN, J. R. C4.5: programs for Machine Learning. Elsevier: 1993. 302 p.

ROBERTSON, M. P.; PETER, C. I.; VILLET, M.; RIPLEY, B.S. Comparing models for predicting species’ potential distributions: a case study using correlative and mechanism predictive modelling techniques. Ecological Modelling, Amsterdam, v. 164, n. 2-3, p. 153-167, 2003. DOI: https://dx.doi.org/10.1016/S0304-3800(03)00028-0

SCOLFORO, J. R. S. Biometria florestal: modelos de crescimento e produção florestal. Lavras: FAEPE–UFLA, 2006. 393 p.

SCOLFORO, J. R. S.; CARVALHO, L. M. T.; OLIVEIRA, A. D. Zoneamento ecológico-econômico do Estado de Minas Gerais: componentes geofísico e biótico. Lavras: Editora UFLA, 2008. 161 p.

SEGURADO, P.; ARAÚJO, M. B. An evaluation method for modelling species distributions. Journal of Biogeography, Oxford, v. 31, n. 10, p. 1555-1568, 2004.DOI: https://dx.doi.org/10.1111/j.1365-2699.2004.01076.x

SOUZA, R. A.; MARCO J. R. P. The use of species distribution models to predict the spatial distribution of deforestation in the western Brazilian Amazon. Ecological Modelling, Amsterdam, v. 291, p. 250-259, 2014. DOI: https://dx.doi.org/10.1016/j.ecolmodel.2014.07.007

TRABUCCO, A.; ZOMER, R. J. Global Soil Water Balance Geospatial Database. CGIAR Consortium for Spatial Information, 2010.

WAN, J. Z.; WANG, C. J.; YU, F. H. Modeling impacts of human footprint and soil variability on the potential distribution of invasive plant species in different biomes. Acta Oecologica, Paris, v. 85, 141-149, 2017. DOI: https://dx.doi.org/10.1016/j.actao.2017.10.008

Downloads

Publicado

2019-09-12

Como Citar

Carvalho, M. C., França, L. C. de J., Leite e Lopes, I., Araújo, L. A., Mello, J. M. de, & Gomide, L. R. (2019). ALGORITMOS DE APRENDIZAGEM DE MÁQUINA NA MODELAGEM DA DISTRIBUIÇÃO POTENCIAL DE HABITATS DE ESPÉCIES ARBÓREAS. Nativa, 7(5), 600–606. https://doi.org/10.31413/nativa.v7i5.7214

Edição

Seção

Engenharia Florestal / Forest Engineering

Artigos mais lidos pelo mesmo(s) autor(es)

1 2 > >>