Bonjour,
Je souhaite implémenter sous SAS un modèle joint discret-continu de motorisation (nombre de véhicules) et d'usage des véhicules (jusqu'à trois véhicules différents sont pris en compte), en analysant les corrélations potentielles entre les différents termes d'erreur du modèle. Par définition, l'usage du 1er véhicule n'est défini que pour les ménages disposant d'au moins 1 véhicule (nbvoi>=1), celui du 2nd véhicule pour les ménages disposant d'au moins deux véhicules, etc. Donc les sélections se recouvrent partiellement.
J'ai d'abord pensé à estimer ce modèle avec la PROC QLIM, comme ceci:

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
proc qlim data=parcauto.menage9410m ;
endogenous nbvoi~discrete(order=formatted dist=normal);
endogenous kmv1~select(nbvoi>=1) ;
endogenous kmv2~select(nbvoi>=2) ;
endogenous kmv3~select(nbvoi>=3) ;
model nbvoi= revmil ; 
model kmv1 = log_rev ; 
model kmv2 = log_rev ; 
model kmv3 = log_rev ;
run;
Toutefois, j'obtiens le message d'erreur suivant:

ERROR: Endogenous variable kmv2 does not appear in the data. No parameter related to
kmv2 can be estimated.
ERROR: Endogenous variable kmv3 does not appear in the data. No parameter related to
kmv3 can be estimated.


En y regardant de plus près, celui-ci semble provenir du fait que l'instruction PROC QLIM ne traite que des sélections séparées. Par exemple, si on commence par la sélection nbvoi>=1, seules les observations en dehors de la 1ère sélection seront considérées dans la 2ème instruction de sélection, ce qui correspond ici à un ensemble vide.

Voyez-vous une alternative à PROC QLIM ou une autre formulation qui permettrait de traiter le cas de sélections avec recouvrement partiel ?

Vous remerciant d'avance pour vos éclaircissements et conseils