IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

ACP sous SAS


Sujet :

SAS STAT

  1. #1
    Candidat au Club
    Profil pro
    Inscrit en
    Décembre 2009
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2009
    Messages : 8
    Points : 3
    Points
    3
    Par défaut ACP sous SAS
    Bonjour,

    J'ai une Analyse en composantes principales à effectuer sous SAS mais je ne comprend pas ce que l'on me demande.
    J'ai un jeu de données contenant 4 variables numériques x1 x2 x3 et x4 et une variable discrète indiquant si l'entreprise à fait faillite ou non.

    J'ai centré et réduit via la proc standard.

    Pouvez-vous m'aider a réaliser la suite?
    Merci.

    Représenter les données sur les différents axes de l’analyse en composantes principales.
    Donner la pourcentage de variance expliqué par les différents axes de l’ACP
    Observe-t-on une séparation des entreprises ?
    Faire une représentation biplot des données et interpréter le graphique.

  2. #2
    Membre chevronné
    Homme Profil pro
    Biostatisticien
    Inscrit en
    Juin 2009
    Messages
    1 206
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Irlande

    Informations professionnelles :
    Activité : Biostatisticien
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Juin 2009
    Messages : 1 206
    Points : 1 868
    Points
    1 868
    Par défaut
    Bonjour Americ,

    Sans offense aucune, as tu compris la méthodologie statistique de l'ACP? Qu'as tu centré réduit? Je peux t'aider sur la traduction sous SAS de cette méthodologie, mais il faut que tu aies saisi la théorie statistique en question et son interprétation....

    Bon courage et n'hésites pas,

    Manoutz

  3. #3
    Candidat au Club
    Profil pro
    Inscrit en
    Décembre 2009
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2009
    Messages : 8
    Points : 3
    Points
    3
    Par défaut
    Bonjour Manoutz,

    Merci de prendre un peu de temps pour me répondre.
    En fait cela fait environ 3 ans que j'ai eu des cours d'acp, donc j'ai regardé un peu sur le net les différentes étapes et interprétations pour me rappeler.
    Par contre je n'en ai jamais fais sous SAS, j'ai bien vu qu'il y avait la proc princomp, mais après il est vrai que je ne sais pas comment répondre précisément aux questions.

    J'ai centré et réduit les données de base des 4 variables numériques avec la proc standard.

    J'ai vu que sur la proc princomp, on peut utiliser soit les corrélations, soit les covariance, mais là je ne sais pas trop quelle méthode utiliser et pourquoi.

    Merci pour l'aide que tu pourras m'apporter.
    Bonne soirée.

  4. #4
    Candidat au Club
    Profil pro
    Inscrit en
    Décembre 2009
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2009
    Messages : 8
    Points : 3
    Points
    3
    Par défaut
    Bonjour,

    Personne pour m'aider?
    Merci d'avance.

    Bonne journée.

  5. #5
    Membre chevronné
    Homme Profil pro
    Biostatisticien
    Inscrit en
    Juin 2009
    Messages
    1 206
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Irlande

    Informations professionnelles :
    Activité : Biostatisticien
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Juin 2009
    Messages : 1 206
    Points : 1 868
    Points
    1 868
    Par défaut
    Bonjour Americ,

    Je dois avouer que pour moi aussi l'utilisation de cette méthode remonte un peu...

    L'aide en ligne SAS saura te fournir de précieuses informations.. Un peu de théorie (mais c'est pas son but) et surtout comment mettre en pratique sous SAS..

    En ce qui concerne le choix de la matrice de corrélation/ covariance, il semble préférable d'utiliser la matrice de corrélation par défaut:
    COV
    computes the principal components from the covariance matrix. If you omit the COV option, the correlation matrix is analyzed. Use of the COV option causes variables with large variances to be more strongly associated with components with large eigenvalues and causes variables with small variances to be more strongly associated with components with small eigenvalues. You should not specify the COV option unless the units in which the variables are measured are comparable or the variables are standardized in some way.
    par curiosité, est ce que tu pourrais m'expliquer pourquoi tu as centré réduit des variables indépendantes? Je ne suis à priori pas convaincu de l'intérêt de la chose..

  6. #6
    Candidat au Club
    Profil pro
    Inscrit en
    Décembre 2009
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2009
    Messages : 8
    Points : 3
    Points
    3
    Par défaut
    Merci tout de même, j'ai un peu regardé sur le net certains exemples et je comprend un peu mieux le principe.

    Concernant le centrage-reduction, il s'agit tout simplement de la première consigne du projet qui demande de centrer réduire et de n'utiliser que ces données là pour la suite.

    Par contre je me pose une question : faut-il centrer réduire par rapport au total de toutes les variables, ou bien par sous-groupe de population?
    Car comme tu m'as fait douté, j'ai réalisé 3 ACP pour voir : une avec les données d'origine, une avec les données centrées réduites par rapport au total de chaque variable et une avec les données centrées réduites par rapport à la moyenne et écart type de chaque sous-groupe de population.

    Il s'avère que les ACP avec les données d'origine et centrées réduites par rapport au total sont quasiment identique, au centième près, et que cela donne des résultats totalement différents en centrant et réduisant par rapport aux sous groupes.

    Merci et bonne soirée.

  7. #7
    Membre chevronné
    Homme Profil pro
    Biostatisticien
    Inscrit en
    Juin 2009
    Messages
    1 206
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Irlande

    Informations professionnelles :
    Activité : Biostatisticien
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Juin 2009
    Messages : 1 206
    Points : 1 868
    Points
    1 868
    Par défaut
    Merci tout de même
    Eh bien derien, je fais la démarche personnelle de répondre dans le simple but d'aider et de partager, mais il faut que tu saisisses que je ne peux pas répondre toujours dans la seconde.... Surtout que tout ce que la majorité des questions sont solutionnées dans l'aide en ligne SAS et qu'apparemment ces questions s'inscrivent dans le cadre d'un projet. Je ne vais pas le faire à ta place!

    Maintenant en ce qui concerne ta dernière question sur le centrage réduction, je ne sais pourquoi la consigne est telle et le mieux est de voir ca avec ton prof. Ceci étant, en attendant, c'est une consigne, donc tu peux prendre temporairement comme acquis.. Si ton prof te dis pourquoi il faut centrer réduire, je suis preneur..

    Manoutz

  8. #8
    Responsable SAS


    Inscrit en
    Septembre 2006
    Messages
    3 176
    Détails du profil
    Informations forums :
    Inscription : Septembre 2006
    Messages : 3 176
    Points : 16 157
    Points
    16 157
    Par défaut
    Bonjour Manoutz,
    Pour schématiser, en général tu centre et tu réduis tes variables pour éviter un effet de poids de tes variables. En effet sans cette manipulation les variables ayant une forte variance joueront un rôle plus important par rapport aux autres.
    Les balises code
    FAQ SAS
    Rubrique SAS

    Si vous souhaitez contribuer à la rubrique SAS, contactez-moi ou tout autre membre de l'équipe BI par MP.

  9. #9
    Membre chevronné
    Homme Profil pro
    Biostatisticien
    Inscrit en
    Juin 2009
    Messages
    1 206
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Irlande

    Informations professionnelles :
    Activité : Biostatisticien
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Juin 2009
    Messages : 1 206
    Points : 1 868
    Points
    1 868
    Par défaut
    OK

    merci pour la précision. Donc si mon interprétation est bonne on rejoint l'idée de la corrélation (par opposition à la covariance)

    Manoutz

Discussions similaires

  1. création physique d'un répertoire sous sas
    Par mioke dans le forum Macro
    Réponses: 32
    Dernier message: 01/07/2008, 17h00
  2. [IML] Intégrale sous SAS
    Par helenei dans le forum SAS IML
    Réponses: 4
    Dernier message: 13/05/2008, 11h56
  3. Zones hachurées sous SAS/GRAPH
    Par enicnath dans le forum ODS et reporting
    Réponses: 2
    Dernier message: 07/05/2008, 21h26
  4. Cartographie sous SAS
    Par CélineM dans le forum ODS et reporting
    Réponses: 10
    Dernier message: 17/04/2008, 11h25
  5. comment manipuler les OLAP sous SAS
    Par Bessa_bd dans le forum Outils BI
    Réponses: 5
    Dernier message: 28/01/2008, 17h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo