Bonsoir à tous,
dans mon travail je cherche un modèle qui permet de mieux séparer entre personnes malades et non malades, en effet j'ai un ensemble de 40000 individus 20000 malades et 20000 malades et un ensemble de 60 variables pour ces individus
et j'ai appliqué 3 modèles
analyse linéaire discriminante avec stepwise qui m'a donné un taux de bon classement de 97% et qui a sélectionné une seule variable parmi les 60
la régression logistique qui a donné un taux de 99,1% en utilisant ttes les variables
machine à vecteurs supports a donné un aux de 99,8% avec ttes les variables
j'ai du mal à choisir le modèle qui convient est ce que je choisi celui de l'ALD stepwise car il garde une seule variable et donne comme même un bon taux de classement
ou je choisi l'SVM car il est le plus haut ?
merci infiniment d'avance pour toute réponse
Partager