Desempenho de vários algoritmos de aprendizado de máquina e regressão logística para prever Fasciola hepatica em bovinos
Resumo
O objetivo deste trabalho foi comparar os desempenhos da regressão logística e de algoritmos de aprendizado de máquina para prever infecção por Fasciola hepatica em bovinos. Um conjunto de dados de 30.151 bovinos do Uruguai foi usado no estudo. Foram comparados a regressão logística (RL) e os algoritmos k-nearest neighbor (KNN), árvores de decisão (CART) e random forest (RF). O intervalo interquartil (IQR) e o escore-z foram usados para melhorar a classificação e comparados entre si. Sexo, idade, escore de conformação de carcaça, escore de gordura, propósito produtivo e peso da carcaça foram usados como variáveis independentes para todos os algoritmos. A infecção por F. hepatica foi usada como variável dependente binária. Os níveis de precisão de RL, KNN, CART e RF foram 0.61, 0.57, 0.57 e 0.58, respectivamente. A variável importância do modelo de RL mostrou que bovinos adultos tenderam à infecção por F. hepatica. Todos os modelos apresentaram baixa precisão, mas a RL distinguiu com sucesso as variáveis relacionadas a F. hepatica. Tanto o IQR quanto o escore-z mostram resultados semelhantes quanto à melhoria da métrica de classificação para o conjunto de dados utilizadoo. No conjunto de dados, dados relacionados ao clima ou a fatores como peso corporal, podem melhorar a confiabilidade do modelo em estudos futuros.
Palavras-chave
Fasciola hepatica; classificação; verme trematódeo; aprendizado de máquina; mineração de dados
Texto completo:
PDF (English)Embrapa Sede, Gerência-Geral de Governança Corporativa e Informação,
Parque Estação Biológica - PqEB - Av. W3 Norte (final) Caixa Postal 040315 - Brasília, DF - Brasil - 70770-901
Fone: +55 (61) 3448-2461