Regressão linear múltipla e modelo Random Forest para estimar a densidade do solo em áreas montanhosas

Waldir Carvalho Junior, Braz Calderano Filho, Cesar da Silva Chagas, Silvio Barge Bhering, Nilson Rendeiro Pereira, Helena Saraiva Koenow Pinheiro

Resumo


O objetivo deste trabalho foi o desenvolvimento de modelos com diferentes conjuntos de dados, para estimar a densidade de solos de regiões tropicais montanhosas, a partir de atributos de solos comumente encontrados nas análises de perfis de solos descritos nos levantamentos regionais. O conjunto total de dados compõe-se de 163 amostras e foi dividido em seis grupamentos, dos quais três com 73 amostras, com o máximo de 32 covariáveis, e três com 163 amostras, com o máximo de 18 covariáveis. Testaram-se modelos
de regressão linear múltipla (RLM) e randomForest (RF). A menor incerteza entre os modelos foi alcançada pelo RLM2, com R2 de 0,56, 13 covariáveis e 73 amostras. Nos grupamentos com 163 amostras, os melhores modelos foram os RF, com R2 médio de 0,48. A raiz quadrada da média do erro ao quadrado variou entre 0,09 e 0,14. As covariáveis mais importantes no modelo RF foram: carbono orgânico, hidrogênio, areia fina e grossa, saturação por bases e capacidade de troca catiônica. Pelo método "stepwise regression", as variáveis mais importantes foram: a relação silte/argila; areia grossa e fina; carbono orgânico; saturação por bases; e potássio.

Palavras-chave


estoque de carbono, funções de pedotransferência, modelos dirigidos pelos dados, stepwise.

Texto completo:

PDF


Embrapa Sede
Parque Estação Biológica - PqEB - Av. W3 Norte (final) Caixa Postal 040315 - Brasília, DF - Brasil - 70770-901
Fone: +55 (61) 3448-2461