IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

ACM : Traitement des données manquantes


Sujet :

SAS STAT

  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 20
    Par défaut ACM : Traitement des données manquantes
    Bonjour à tous,

    je cherche à réaliser des typologies d'individus sur la base d'une enquête avec SAS; la plupart des réponses sont qualitatives. Je réalise donc une ACM (proc corresp) suivi d'une CAH (proc cluster et proc tree).
    Mon problème est qu'il existe de nombreuses réponses manquantes. J'ai décidé de mettre en variable supplémentaire les modalités correspondantes aux questions manquantes :
    par ex si pour la question 1 il y a trois modalités possibles je conserve dans l'analyse la modalité a, la b et la modalité NR sera mise en supplémentary => ceci aboutit à ce que certains individus n'est pas de réponses à une questions donnée mais j'arrive tout de même à les faire figurer sur les axes factoriels.
    Est ce que cela a un sens ? Comment traitez vous les réponses manquantes ?

    Merci de votre aide.

  2. #2
    Membre Expert
    Avatar de MEGAMIND2
    Homme Profil pro
    Paris
    Inscrit en
    Janvier 2011
    Messages
    1 029
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Paris

    Informations forums :
    Inscription : Janvier 2011
    Messages : 1 029
    Par défaut
    Bonjour,
    Il serait intéressant de les inclure dans la constitution de tes axes factoriels et de regarder si tu conserves la même interprétation que précédemment.

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 20
    Par défaut
    Si je laisse ces modalités NR, du fait de leur faible effectif, cela tire les deux premiers axes; (la contributions aux deux premiers axes est expliqué que par ces Non réponses) : ce qui fausse l'analyse.

  4. #4
    Membre Expert
    Avatar de MEGAMIND2
    Homme Profil pro
    Paris
    Inscrit en
    Janvier 2011
    Messages
    1 029
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Paris

    Informations forums :
    Inscription : Janvier 2011
    Messages : 1 029
    Par défaut
    je serais du même avis que toi à les mettre en individus supplémentaires, vu que ça fausse les interprétations.

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 20
    Par défaut
    Merci de ton soutien,

    pour aller un peu plus loin dans la réflexion, il existe biensur d'autres possibilités comme regrouper les NR avec une autre modalité ou encore imputer les NR avant de faire l'analyse.... mais cela me semble périlleux.

    Je peux aussi supprimer les individus avec NR ! mais après tout la présence de NR est le reflet d'un comportement particulier et donc doit être pris en compte !!!!

    et le fait de supprimer ces individus créé un nouveau problème : cela me fait du coup 50% d'individus en plus à reclasser avec les risques d'erreurs que cela comporte.

    Eric.

  6. #6
    Membre Expert
    Avatar de MEGAMIND2
    Homme Profil pro
    Paris
    Inscrit en
    Janvier 2011
    Messages
    1 029
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Paris

    Informations forums :
    Inscription : Janvier 2011
    Messages : 1 029
    Par défaut
    Tu peux remplacer les NR par la moyenne de la variable concernée mais à conditions que tes variables soient continues bien sûr.

    L'imputation des valeurs manquantes pur et dur implique que ton analyse sera propre à tes données (n'incluant pas des valeurs manquantes) alors que c'est pas la réalité. Il y a bien des personnes qui ne répondent pas aux enquêtes comme moi et ne facilite pas le travail des gens comme toi!!

    Bon courage!

  7. #7
    Membre averti

    Profil pro
    Inscrit en
    Décembre 2009
    Messages
    27
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2009
    Messages : 27
    Par défaut
    Citation Envoyé par emart Voir le message
    Merci de ton soutien,

    pour aller un peu plus loin dans la réflexion, il existe biensur d'autres possibilités comme regrouper les NR avec une autre modalité ou encore imputer les NR avant de faire l'analyse.... mais cela me semble périlleux.

    Je peux aussi supprimer les individus avec NR ! mais après tout la présence de NR est le reflet d'un comportement particulier et donc doit être pris en compte !!!!

    et le fait de supprimer ces individus créé un nouveau problème : cela me fait du coup 50% d'individus en plus à reclasser avec les risques d'erreurs que cela comporte.

    Eric.
    Bonjour,

    je ne sais pas si la question est toujours d'actualité, mais si tu réalises une typologie et que tu imputes les données manquantes, tu risques de fausser considérablement les résultats (en fait de créer artificiellement les classes) compte tenu des méthodes d'imputation!! Même chose avec la moyenne des valeurs (d'autant plus que la moyenne d'une variable qualitative a un sens plus que douteux).

    A mon sens,il faut tenir compte de plusieurs paramètres:
    1. Est-ce que les modalités manquantes sont présentes en proportions importantes par rapport aux autres modalités de la variable? Si oui, ouille. Si non, tu peux ventiler ces données manquantes (mais tu risques aussi de ventiler les modalités de faible effectif, qui après tout tireront aussi les axes simplement du fait de leur effectif!)
    2. Est-ce que tu ne peux pas supprimer des individus ayant beaucoup de non-réponse? S'il y en a peu par rapport à ton echantillon total, c'est envisageable (mais tu perds tout de même de l'info : les profils de non-répondants peuvent être particulier, cf tes variables illustratives)

    Il me semble que l'ACM sur données incomplètes peut résoudre ce problème, mais tes axes seront tirés artificiellement par les modalités rares (à moins que tu n'en ai pas d'autres?)

    A bientôt,

    T.

  8. #8
    Membre averti
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 20
    Par défaut
    merci de ta réponse.

    J'ai finalement opté par mettre les données manquantes dans des var spécifiques puis je mets ces nouvelles var en illustratives.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 5
    Dernier message: 20/04/2015, 16h51
  2. Programme de traitement des données manquantes
    Par stig_66 dans le forum Algorithmes et structures de données
    Réponses: 0
    Dernier message: 17/04/2013, 16h29
  3. [Formulaires] Traitement des données dans une autre page...
    Par sekiryou dans le forum Général JavaScript
    Réponses: 3
    Dernier message: 04/03/2006, 10h08
  4. [PHP-JS] Traitement des données dans une autre page...
    Par sekiryou dans le forum Langage
    Réponses: 5
    Dernier message: 04/03/2006, 10h06
  5. traitement des données avant envoie dans MySQL
    Par italiasky dans le forum SQL Procédural
    Réponses: 13
    Dernier message: 07/02/2006, 23h50

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo