Bonjour à tous,
Je suis actuellement en stage et je travaille sous SAS. Je rencontre des difficultés pendant le mois d'absence de mon tuteur :
Je voudrais déterminer les variables explicatives d'une variable binaire Y en utilisant une stratégie de sélection ascendante (selection=forward). Cependant, parmi ma liste de variables de départ, il y a des variables qualitatives ET quantitatives. Donc j'ai listé les variables qualitatives dans l'option "class", puis dans "model" toutes les variables quantitatives et qualitatives. Le code est le suivant :
Cependant SAS me dit que le résultat est très volumineux (après l'avoir fait tourné toute le nuit), j'ai donc plusieurs questions :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5 proc logistic data=sasuser.donnees; class variable_quali1 variable_quali2 variable_quali3 variable_quali4 variable_quali5 variable_quali6 variable_quali7 variable_quali8 variable_quali9 variable_quali10; model Y = var_quanti1 var_quanti2 var_quanti3 var_quanti4 var_quanti5 variable_quali1 variable_quali2 variable_quali3 variable_quali4 variable_quali5 variable_quali6 variable_quali7 variable_quali8 variable_quali9 variable_quali10 / selection=forward; output out=table_sortie predicted=pred; run;
1) Est ce que je dois utiliser la proc logistique ou bien la proc genmod avec une option lien=logit ?
2) Comment gérer le problème d'avoir des variables qualitatives et quantitatives (sous R, ça ne pose pas de problème avec la fonction "glm", mais j'ai l'impression que la proc logistic de SAS ne veut que des variables d'un seul type) ?
3) En plus, ma table d'environ 150 000 lignes a énormément de "cases vides". Est ce que je dois les "remplir" en créant une modalité "donnée manquante" par exemple pour ces données, ou est ce que SAS gère seul ce problème ?
4) Et pour finir, y a-t-il une commande pour récupérer la liste des variables explicatives finale (comme dans R)?
Merci d'avance à ceux qui auront eu le courage de lire jusque là !
Partager