IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

Mesure de l'influence des observations dans la modélisation logistique


Sujet :

SAS STAT

  1. #1
    thomahh
    Invité(e)
    Par défaut Mesure de l'influence des observations dans la modélisation logistique
    Bonjour,

    J'effectue une régression logistique, et j'aimerai supprimer les observations qui sont mal modélisées ou qui rendent moins robuste la régression.

    Avec l'option influence et iplot dans le code SAS de la proc logistique , j'arrive à obtenir des indicateurs pour savoir ce que je veux. Le problème, c'est que je ne sais pas comment utiliser ces indicateurs (Quels sont les seuils, les règles d'utilisation,etc...).


    Voici les indicateurs : Résidus de pearson,Résidus de l'écart(Resdev), La diagonale de la matrice chapeau (Hatdiag), intercept Dfbeta, dfbetas, Ecarts CL C, Ecarts CL CBAR , Ecart delta (difdev), et khi-deux Delta (Difchisq).

    Merci.

  2. #2
    Expert éminent sénior


    Profil pro
    Inscrit en
    Septembre 2006
    Messages
    3 176
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2006
    Messages : 3 176
    Points : 16 294
    Points
    16 294
    Par défaut
    Pour les résidus et de mémoire en régression classique, je crois que c'est ceux supérieurs à deux : cad quantile 95% de la loi normale !
    Si tu as des graphiques, n'as-tu pas des indicateurs visuels dessus ?

  3. #3
    thomahh
    Invité(e)
    Par défaut
    Si il y a des graphiques, mais c'est très bizarre.
    Sas sort 7 graphiques de courbes de dfbetas ("7 panels"). C'est impossible de savoir à l'oeil nu quel sont les individus qui sortent du lot. Je ne sais pas si juste le fait de sortir du lot est mauvais. Comme tu dis pour les résidus (lesquels ?) il y a un seuil de 2.
    Pourquoi il y a 7 panels ?
    Il y a aussi les courbes d'influence en 2 panels avec les ecart CL CBAR , les difdev et difchisq.
    Images attachées Images attachées   

  4. #4
    thomahh
    Invité(e)
    Par défaut
    up

  5. #5
    Expert éminent sénior


    Profil pro
    Inscrit en
    Septembre 2006
    Messages
    3 176
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2006
    Messages : 3 176
    Points : 16 294
    Points
    16 294
    Par défaut
    Que te dit la documentation SAS à propos des indicateurs ou graphiques ?

Discussions similaires

  1. [MySQL] Influence de l'ordre des conditions dans la clause WHERE
    Par morgan47 dans le forum PHP & Base de données
    Réponses: 5
    Dernier message: 09/02/2012, 23h46
  2. Récuperer des observation aléatoire dans une table
    Par sniper75 dans le forum SAS Base
    Réponses: 9
    Dernier message: 19/01/2012, 12h59
  3. [GRAPH] BOXPLOT : relier les moyennes de observée dans des groupes / BOXCONNECT
    Par Malex_SAS dans le forum ODS et reporting
    Réponses: 1
    Dernier message: 04/11/2011, 10h04
  4. Observer des points dans l'espace kernel (gaussien)
    Par acx01b dans le forum Téléchargez
    Réponses: 0
    Dernier message: 29/04/2010, 02h44
  5. Réponses: 0
    Dernier message: 12/03/2009, 01h53

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo