
Universidade Federal de Santa catarina (UFSC)
Programa de Pós-graduação em Engenharia, Gestão e Mídia do Conhecimento (PPGEGC)
Detalhes do Documento Analisado
Centro: Tecnológico
Programa de Pós-Graduação: Programa de Pós-Graduação em Engenharia Elétrica
Dimensão Institucional: Pós-Graduação
Dimensão ODS: Social
Tipo do Documento: Tese
Título: AVALIAÇÃO DE MÉTODOS DE DATA MINING E REGRESSÃO LOGÍSTICA APLICADOS NA ANÁLISE DE TRAUMATISMO CRANIOENCEFÁLICO GRAVE
Ano: 2015
Orientador
- FERNANDO MENDES DE AZEVEDO
Aluno
- MERISANDRA CORTES DE MATTOS
Conteúdo
O traumatismo cranioencefálico é um problema de saúde pública constituindo-se em uma das principais causas de morbidade e mortalidade no brasil e no mundo. a análise das relações entre as suas consequências tem despertado interesse em pesquisas na área, a fim de se identificar os indicadores que auxiliam no seu prognóstico, buscandose evitar o óbito. estes modelos são tradicionalmente gerados por meio da regressão logística que tem se constituído em uma técnica padrão para análise dos dados em saúde. no entanto, os modelos prognósticos em traumatismo cranioencefálico, como o grave que é o foco desta pesquisa, não conseguem acurácia elevada para a predição do óbito por meio da regressão logística. sabendo-se disso, avanços em termos da acuracidade da predição podem auxiliar no prognóstico e conduta das pessoas acometidas por traumatismo cranioencefálico do tipo grave. a descoberta de conhecimento em bases de dados por meio da etapa de data mining e da integração de técnicas de diferentes áreas como inteligência computacional, reconhecimento de padrões, aprendizado de máquina, estatística e banco de dados, constitui-se em uma alternativa para identificar as relações nestes conjuntos de dados. considerando-se isto, esta pesquisa consiste na avaliação comparativa de diferentes métodos de data mining, a fim de se analisar os modelos gerados e compará-los com o de regressão logística, em uma mesma população de estudo. nesta pesquisa, se objetiva identificar padrões válidos, avaliando se os métodos de data mining empregados se mostram como uma alternativa à regressão logística, baseando-se em critérios de avaliação como acurácia e robustez, os quais se constituem em medidas de qualidade dos padrões descobertos. os métodos de data mining empregados referem-se a indução de árvores de decisão por meio dos algoritmos c4.5 e classification and regression trees; o aprendizado baseado em instâncias pelo algoritmo k-vizinhos mais próximos; as redes neurais artificiais por funções de base radial; os classificadores bayesianos pelos algoritmos naive bayes e redes de crença bayesiana e o metaclassificador pelo algoritmo adaptive boosting. no desenvolvimento foram gerados modelos de prognóstico do óbito em traumatismo cranioencefálico grave por meio dos algoritmos supracitados, como também pela regressão logística binária. os modelos gerados na etapa de data mining foram comparados aplicando-se as medidas de avaliação de desempenho (verdadeiros positivos, verdadeiros negativos, acurácia, sensibilidade e especificidade) e de confiabilidade (coeficiente de concordância kappa e área sob a receiveroperating characteristic curve). na comparação entre os modelos de data mining elencados com maior poder de discriminação em relação a regressão logística, utilizaram-se as medidas de confiabilidade citadas anteriormente, considerando-se intervalos de confiança de 95%. dentre as análises realizadas, nos modelos gerados para predição do óbito em traumatismo cranioencefálico grave, os classificadores bayesianos destacaram-se apresentando medidas de desempenho significativamente mais representativas. o modelo gerado pelo algoritmo naive bayes destacou-se em relação aos demais métodos de data mining empregados, bem como quando comparado com o modelo de regressão logística binária, classificando corretamente o óbito em 58,2% (ic95%: 55,6- 61,8), a acurácia geral do modelo foi de 80,2% (ic95%: 76,9-85,7), sensibilidade de 72,7% (ic95%: 69,8-75,4), especificidade de 84,2% (ic95%: 81,6-87,5), área sob a receiver-operating characteristic curve de 0,851 (ic95%: 0,832-0,870) e coeficiente de concordância kappa 0,530 (ic95%: 0,519-0,541). comparando-se os resultados, o algoritmo naive bayes mostrou-se, no conjunto de dados estudado, significativamente mais representativo que o modelo de regressão logística binária e os outros modelos de data mining.
Pós-processamento: Índice de Shannon: 3.88081
ODS 1 | ODS 2 | ODS 3 | ODS 4 | ODS 5 | ODS 6 | ODS 7 | ODS 8 | ODS 9 | ODS 10 | ODS 11 | ODS 12 | ODS 13 | ODS 14 | ODS 15 | ODS 16 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4,53% | 3,95% | 15,30% | 7,06% | 5,23% | 4,28% | 4,37% | 6,61% | 9,23% | 3,97% | 8,12% | 5,27% | 4,47% | 4,37% | 6,71% | 6,54% |
ODS Predominates


4,53%

3,95%

15,30%

7,06%

5,23%

4,28%

4,37%

6,61%

9,23%

3,97%

8,12%

5,27%

4,47%

4,37%

6,71%

6,54%