IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

ACP ou AFC sur variables binaires


Sujet :

SAS STAT

  1. #1
    Membre du Club
    Femme Profil pro
    etudiante stagiaire en recherche clinique
    Inscrit en
    Avril 2011
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : etudiante stagiaire en recherche clinique
    Secteur : Santé

    Informations forums :
    Inscription : Avril 2011
    Messages : 114
    Points : 64
    Points
    64
    Par défaut ACP ou AFC sur variables binaires
    Bonjour à tous

    Je souhaite réaliser une analyse factorielle sur 30 variables binaires (0/1)
    Théoriquement on utilise une ACP sur des données quantitatives et une AFC pour des données qualitatives?
    Lorsqu'il s'agit de données binaires l'ACP donne-t-elle des résultats comparables à l'AFC? Quelle type d'analyse est la mieux adaptée?

    De la même façon peut-on réaliser une ACP sur une variable codé 0 (=pas d'ccord), 1 (=incertain) et 2 (=d'accord)? On peut ici parler de variable ordinale je pense.


    Merci

  2. #2
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    Bonjour Mathis.
    Pour les variables qualitatives, quel que soit leur codage, il faut faire une AFC (pour un couple de variables) ou une ACM (pour un ensemble de variables d'une manière générale, 2 ou plus).
    L'ACP sur des variables binaires n'est absolument pas équivalente à une ACM, en premier lieu parce que les calculs de distance (corrélation de Pearson dans l'ACP, qui suppose une normalité approximative des variables... difficile à justifier sur des données binaires ; chi-2 dans l'ACM) ne sont pas raccord ! Comme les calculs de distances sous-tendent tout le reste (valeurs propres, axes factoriels, coordonnées), l'ACP sur variables binaires me semble bien foireuse.
    Idem pour les variables ordinales : ACM aussi. Ca sera l'occasion de visualiser de beaux effets Guttman (l'équivalent d'un effet taille de l'ACP).
    Bon courage.
    Olivier

  3. #3
    Membre du Club
    Femme Profil pro
    etudiante stagiaire en recherche clinique
    Inscrit en
    Avril 2011
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : etudiante stagiaire en recherche clinique
    Secteur : Santé

    Informations forums :
    Inscription : Avril 2011
    Messages : 114
    Points : 64
    Points
    64
    Par défaut
    Merci pour tes réponses Olivier.

    La procédure sous sas pour une ACM c'est proc corresp il me semble, mais que faut-il choisir entre var et tables, quelle est la différence sachant que j'au un tableau du type

    patients M(J0)1 M(J0)2 M(J0)3 M(J0)4 M(J0)5 M(J0)6 M(J0)7 M(J0)8
    1 0 0 0 0 0 1 1 0
    2 1 0 1 1 0 1 0 1
    3 0 0 0 0 0 1 1 0
    4 0 0 0 0 0 1 1 0
    5 1 0 0 1 0 1 0 0
    6 1 0 0 0 1 0 0 1
    7 1 0 0 1 1 0 0 1
    8 1 0 0 0 0 1 1 0
    9 0 1 0 0 0 1 1 0
    10 1 0 0 1 0 1 1 1
    11 1 0 0 0 0 1 0 1
    12 1 0 0 0 0 1 0 0
    13 1 0 0 0 1 0 1 1
    14 1 0 0 1 1 1 0 0
    15 0 1 0 1 0 1 0 0
    16 0 0 0 1 0 1 1 0
    17 0 1 1 1 1 1 1 0
    18 1 0 0 1 0 1 0 0
    19 1 0 0 1 0 0 0 1
    20 1 0 0 0 1 1 1 0
    21 0 0 0 0 0 1 0 1
    22 0 0 0 0 0 1 0 1
    Aussi peut-on faire une rotation varimax avec une ACM?
    Merci

  4. #4
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    Ce sera VAR car tu as déjà un tableau disjonctif complet.
    De plus VAR te permet de produire des résultats dans l'espace des individus et dans celui des variables, tandis que TABLES (SAS "disjoncte" automatiquement les variables en indicatrices) ne donne accès qu'à l'espace des variables.

    Je ne crois pas qu'il y ait d'option de rotation dans la proc CORRESP. Par contre, peut-être en enchaînant avec une proc FACTOR sur les axes produits par l'ACM ? Je n'ai jamais essayé.

  5. #5
    Membre du Club
    Femme Profil pro
    etudiante stagiaire en recherche clinique
    Inscrit en
    Avril 2011
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : etudiante stagiaire en recherche clinique
    Secteur : Santé

    Informations forums :
    Inscription : Avril 2011
    Messages : 114
    Points : 64
    Points
    64
    Par défaut
    Merci olivier pour tes explications.
    La question suivante peut paraître absurde pour certains mais j'ai besoin de certitude. Voilà j'évalue une échelle d'auto-évaluation composée de 30 questions. La réponse aux questions est certes binaire (OUI/NON), mais ces questions sont ensuite côtés de la manière suivante : en cas de réponse positive est cotée 1 et cotés 0 si elle est négative. la somme donnant le score totale de l'échelle.
    Pour vérifier la validité de l'échelle il faut étudier la structure factorielle de l'échelle...dans ce cas faut-il pas plutôt faire une ACP sur mes variables numériques? (c'est ce que font les auteurs de divers articles scientifiques).

    Merci pour votre aide

  6. #6
    Membre du Club
    Femme Profil pro
    etudiante stagiaire en recherche clinique
    Inscrit en
    Avril 2011
    Messages
    114
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : etudiante stagiaire en recherche clinique
    Secteur : Santé

    Informations forums :
    Inscription : Avril 2011
    Messages : 114
    Points : 64
    Points
    64
    Par défaut
    pas de réponse

  7. #7
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    Bonjour.
    Jusqu'à présent j'ai été le seul à réagir sur cette discussion, et j'ignore si ceux qui n'interviennent pas n'ont pas d'idée sur la question ou sont d'accord avec mes arguments.
    Maintenant si dans les publications qui te servent de référence, on fait d'une certaine manière, avec une ACP, pourquoi pas ? Ça ne me fait pas démordre de mes arguments précédents (les corrélations entre variables binaires mesurent quoi ? je lis ici que c'est le chi-2 à un facteur près : page 52, relation 12).
    Il me semble plus "propre" (peut-être qu'au final c'est équivalent empiriquement) de faire une ACM. Je mettrais l'échelle globale en variable illustrative. On pourrait donc mesure la proximité de ses valeurs avec les différentes indicatrices. Si on la met en variable active, ça ne servira pas à grand chose parce que l'ACM (ou l'ACP) se rendra vite compte de la relation linéaire entre l'échelle et ses composantes, et fera comme si l'échelle était redondante avec le reste.
    Fais selon ta conscience. Ou selon les conseils de quelque bon samaritain qui viendrait par ici nous éclairer.
    Bon courage.
    Olivier

  8. #8
    Membre régulier
    Inscrit en
    Décembre 2009
    Messages
    95
    Détails du profil
    Informations forums :
    Inscription : Décembre 2009
    Messages : 95
    Points : 77
    Points
    77
    Par défaut
    Bonjour,

    Je sais que je répond un peu tard à ce sujet mais je m'interesse depuis peu à l'analyse factorielle sur données de grandes dimensions. Ainsi, n représente les lignes de ma matrice (les individus) et p les colonnes (les questions), alors j'ai p >> n.

    Ma matrice est de type binaire (présence/absence) : elle croise des individus et des variables. Pour faire court, il s'agit du résultat d'une enquête massive où l'on a posé énormément de questions à chaque individu, celui-ci ne pouvant répondre que oui ou non. Je me suis longuement interrogé sur le fait de faire une ACP ou une ACM, cette dernière fonctionnant avec des tableaux disjonctifs complet. Ce qui me dérange dans l'ACM est que l'on donne un rôle symétrique aux lignes et aux colonnes de ma matrice alors que ma matrice confronte des individus et des variables : on ne peut pas considérer que individus et variables jouent un rôle analogue.

    Je me suis donc interessé au deux et l'explication fait sens. D'après la 4ème édition du livre "Statistique Exploratoire Multidimensionnelle" de Ludovic Lebart et al, concernant le cas d'une ACM où toutes les questions ont deux modalités, "l'analyse des correspondances multiples se ramène à l'analyse en composante principales des variables caractérisées par une seule de leur modalités ...".
    Il est même ajouté "on obtient ainsi directement la matrice à diagonaliser qui n'est autre que la matrice des corrélations entre variables (Nakhlé, 1976)" et toute une démonstration mathématique que j'ai encore du mal à comprendre.

Discussions similaires

  1. ACP sur variables qualitatives ordinales
    Par niaboc dans le forum SAS STAT
    Réponses: 0
    Dernier message: 12/12/2012, 17h04
  2. retour à la ligne sur variable DOS
    Par Goldorak2 dans le forum Scripts/Batch
    Réponses: 2
    Dernier message: 29/03/2007, 18h32
  3. Comment déclarer une variable binaire?
    Par Pragmateek dans le forum C++
    Réponses: 12
    Dernier message: 22/03/2006, 18h35
  4. Réponses: 8
    Dernier message: 20/02/2006, 16h28
  5. Comparaison sur variable de type Binary (32)
    Par krapno dans le forum MS SQL Server
    Réponses: 1
    Dernier message: 26/10/2005, 13h48

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo