IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS Base Discussion :

Liste des modalités d'une variable : grosse table


Sujet :

SAS Base

  1. #1
    Membre du Club
    Femme Profil pro
    Responsable marketing opérationnel
    Inscrit en
    Avril 2011
    Messages
    58
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Responsable marketing opérationnel
    Secteur : Biens de consommation

    Informations forums :
    Inscription : Avril 2011
    Messages : 58
    Points : 59
    Points
    59
    Par défaut Liste des modalités d'une variable : grosse table
    Bonjour,

    je souhaite récupérer la liste des modalités d'une variable de ma table SAS. Comment faire pour que ce traitement soit court sachant que la table sur laquelle je travaille est énorme?

    Merci de votre aide.

    Olive.

  2. #2
    Membre expérimenté
    Avatar de MEGAMIND2
    Homme Profil pro
    Paris
    Inscrit en
    Janvier 2011
    Messages
    1 029
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Paris

    Informations forums :
    Inscription : Janvier 2011
    Messages : 1 029
    Points : 1 489
    Points
    1 489
    Par défaut
    Bonjour,

    Tu peux être plus explicite ?

  3. #3
    Membre du Club
    Femme Profil pro
    Responsable marketing opérationnel
    Inscrit en
    Avril 2011
    Messages
    58
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Responsable marketing opérationnel
    Secteur : Biens de consommation

    Informations forums :
    Inscription : Avril 2011
    Messages : 58
    Points : 59
    Points
    59
    Par défaut
    Bien entendu!

    Ma table est énorme (20 Go) et contient le fruit de l'observation de la variable TOTO sur l'ensemble d'une population. Le fournisseur de cette table ne m'a pas donné la liste des modalités de la variable TOTO, à moi d'en faire une liste.

    Ce que j'aimerais, c'est récupérer une table du style:
    modalité1
    modalité2
    modalité3....
    Je n'ai pas besoin de comptage, juste des noms des modalités.

    Quelle est la méthode la moins gourmande en temps?

    Merci!

  4. #4
    Membre habitué

    Homme Profil pro
    Consultant Support Client SAS
    Inscrit en
    Mai 2011
    Messages
    94
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Seine et Marne (Île de France)

    Informations professionnelles :
    Activité : Consultant Support Client SAS
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2011
    Messages : 94
    Points : 180
    Points
    180
    Par défaut
    Bonjour,

    Une méthode me vient à l'esprit mais je ne pense pas que ce soit la moins gourmande:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    Proc sort data=entree;
    by toto;
    run;
     
    data final;
    set entree;
    by toto;
    if first.toto;
    run;
    Voilà un exemple devant fonctionner mais le tri pourrait prendre du temps.

    Cordialement,
    Frajen

  5. #5
    Membre expérimenté
    Avatar de MEGAMIND2
    Homme Profil pro
    Paris
    Inscrit en
    Janvier 2011
    Messages
    1 029
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Paris

    Informations forums :
    Inscription : Janvier 2011
    Messages : 1 029
    Points : 1 489
    Points
    1 489
    Par défaut
    Moi je dirais qu'une proc freq est adaptée pour ça,
    Un exemple:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    proc freq data=sashelp.Air;
    tables DATE/out=sortie;
    run;

  6. #6
    Membre expérimenté
    Homme Profil pro
    Attaché statisticien
    Inscrit en
    Mai 2011
    Messages
    687
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Attaché statisticien
    Secteur : Administration - Collectivité locale

    Informations forums :
    Inscription : Mai 2011
    Messages : 687
    Points : 1 581
    Points
    1 581
    Par défaut
    Si tu as vraiment beaucoup de modalités (par exemple il m'arrive de devoir faire des listes de modalités sur de grosses tables et pour laquelle j'ai énormément de modalités, c'est à dire plusieurs millions voir dizaines de millions de modalités)

    alors je te recommande la proc summary

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
     
    data cpte_mod; set sashepl.air;keep date w;w=1;run;
     
    PROC SUMMARY DATA=cpte_mod;
    CLASS DATE;
    VAR w;
    TYPES CLASS;
    OUTPUT OUT=sortie sum=;
    run;
    Chez moi la freq bloque passé un certain nombre de modalités, sinon la freq fait généralement bien son travail à condition de ne pas omettre l'option noprint de la freq si tu as vraiment beaucoup de modalités.

  7. #7
    Membre émérite

    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Mars 2005
    Messages
    1 364
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Conseil

    Informations forums :
    Inscription : Mars 2005
    Messages : 1 364
    Points : 2 329
    Points
    2 329
    Par défaut
    Citation Envoyé par frajen Voir le message
    Bonjour,

    Une méthode me vient à l'esprit mais je ne pense pas que ce soit la moins gourmande:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    Proc sort data=entree;
    by toto;
    run;
     
    data final;
    set entree;
    by toto;
    if first.toto;
    run;
    Voilà un exemple devant fonctionner mais le tri pourrait prendre du temps.

    Cordialement,
    Frajen
    Tu peux faire encore plus court
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    proc sort data=entree out=entree_(keep=toto) nodupkey; 
    by toto;
    run;

  8. #8
    Membre du Club
    Femme Profil pro
    Responsable marketing opérationnel
    Inscrit en
    Avril 2011
    Messages
    58
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Responsable marketing opérationnel
    Secteur : Biens de consommation

    Informations forums :
    Inscription : Avril 2011
    Messages : 58
    Points : 59
    Points
    59
    Par défaut
    Merci à tous!

    j'étais effectivement partie sur une PROC FREQ, mais je pensais que peut-être il pouvait y avoir une meilleure méthode. Je vais comparer avec la PROC SUMMARY pour voir ce qui est le mieux. Par contre, je ne pense pas me lancer dans la PROC SORT...

    Olive.

  9. #9
    Membre émérite

    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Mars 2005
    Messages
    1 364
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Conseil

    Informations forums :
    Inscription : Mars 2005
    Messages : 1 364
    Points : 2 329
    Points
    2 329
    Par défaut
    Tu peux utiliser la proc SQL; tu nous diras la plus performante

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
    proc sql;
    create table res as
    select distinct toto as mod
    from ma_table (keep=toto);
    quit;

  10. #10
    Membre expérimenté
    Homme Profil pro
    Attaché statisticien
    Inscrit en
    Mai 2011
    Messages
    687
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Attaché statisticien
    Secteur : Administration - Collectivité locale

    Informations forums :
    Inscription : Mai 2011
    Messages : 687
    Points : 1 581
    Points
    1 581
    Par défaut
    Citation Envoyé par bahraoui Voir le message
    Tu peux faire encore plus court
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    proc sort data=entree out=entree_(keep=toto) nodupkey; 
    by toto;
    run;
    Je pense que c'est encore la solution la plus courte et peut-être la plus performante, surtout si tu n'as pas besoin de compter le nombre d'occurence de chaque modalité.

    Moi c'est souvent le cas c'est pourquoi j'utilise la freq , la summary ou une étape data après un sort si la summary "calle" (ça m'est arrivé ).

    Sinon tu as encore la piste de la SQL

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [WRS] Ordre d'affichage des modalités d'une variable dans un tableau croisé
    Par Dr Byby'San dans le forum Outils BI
    Réponses: 6
    Dernier message: 27/04/2012, 07h39
  2. Réponses: 3
    Dernier message: 28/06/2011, 16h07
  3. Réponses: 1
    Dernier message: 09/04/2010, 17h40
  4. Réponses: 2
    Dernier message: 07/04/2010, 03h35
  5. format ordre des modalités d'une variable
    Par eamoros dans le forum SAS Base
    Réponses: 2
    Dernier message: 10/02/2009, 18h25

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo