23/11/2021 - 09:00 - 10:10 COC 01 - NOVOS MÉTODOS DE EXPLORAÇÃO DE DADOS COM BASE EM INOVAÇÕES TECNOLÓGICAS |
33831 - AGLOMERADOS DE MORTALIDADE POR CÂNCER ACIMA DA ESPERADA NO BRASIL COM MACHINE LEARNING BRUNO CASAES TEIXEIRA - LABDAPS, FSP-USP, ALEXANDRE DIAS PORTO CHAVEGATTO FILHO - LABDAPS, FSP-USP
Objetivo: identificar aglomerados espaciais acima do esperado de mortalidade por câncer nos municípios do Brasil, independentemente de fatores sócio demográficos, utilizando algoritmos preditivos de inteligência artificial (machine learning).
Métodos: Os dados de mortalidade entre 2008-2016 foram extraídos do Sistema de Informações de Mortalidade e ajustados por idade. Dados sóciodemográficos e de cobertura de saúde foram obtidos do Censo 2010 e Cadastro Nacional de Estabelecimentos de Saúde, respectivamente. Os algoritmos random forests, gradient boosting trees, support vector machines e regressão de lasso foram treinados com 70% dos dados para predizer mortalidade por câncer e suas performances foram testadas nos restantes 30%. À partir dos resíduos, foram identificados os municípios com a mortalidade acima da esperada. Os aglomerados espaciais foram criados com a estatística de Kulldorff.
Resultados: Todos os algoritmos apontaram a existência de aglomerado espacial acima do esperado na região entre Bagé e Rio Grande (resíduo=30.8 mortes/100.000, p=0.001). Três algoritmos também identificaram um aglomerado espacial na cidade de Barueri (resíduo=45,3 mortes/100.000, p=0.001 ) e de Porto Velho (resíduo=25.8 mortes/100.000, p=0.001). Em geral, o algoritmo com maior R2 foi o gradient boosting trees (R2=0,66). A variável com maior impacto na predição foi o percentual de casas com computador, de forma positiva e não linear. Nas sub-análises, o aglomerado espacial mais frequente foi referente a câncer de estômago, na região de Macapá (resíduo=7.2 mortes/100.000, p=0.008).
Conclusão: Algumas regiões geográficas brasileiras mostram taxas significativamente acima do esperado para mortalidade por câncer, independentemente de variáveis sóciodemográficas. Análises adicionais poderão explorar a causalidade dessas diferenças geográficas.
|