IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

Classification automatique via PROC FASTCLUS


Sujet :

SAS STAT

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 17
    Points : 13
    Points
    13
    Par défaut Classification automatique via PROC FASTCLUS
    Bonjour,

    J'ai une question concernant la classification automatique (j'ai utilisé PROC FASTCLUS).

    Donc, voici mon problème :
    J'ai des individus qui sont amenés à visiter plusieurs communes en France (dont je connais les coordonnées géographiques, à savoir leur latitude et leur longitude). Un individu peut visiter jusqu'à 40 communes. Je souhaite observer, pour chaque panéliste, si ces communes sont dispersées ou concentrées et, notamment, s'il existe des pôles (la distance séparant les communes au sein d'un même pôle ne devant pas dépasser 100 kilomètres).

    On me recommande de faire, pour chaque individu, une classification automatique à partir des seules coordonnées géographiques ; les clusters obtenus seraient ainsi mes pôles.

    Mon souci est que je ne parviens pas à contrôler la distance. Même si je sais que la distance utilisée dans la classification n'est pas une distance kilométrique..., je pensais qu'en trouvant une valeur du RADIUS "correcte", je pourrais identifier des pôles plutôt homogènes (en étant pas trop exigeant sur le "plutôt"). Mais, le résultat n'est pas du tout convaincant. Certains clusters englobent des communes beaucoup trop éloignées.

    Je précise que je débute avec PROC FASTCLUS, donc je suis peut-être passée à côté d'options ; à moins que je n'aie pas compris l'usage du RADIUS. Si quelqu'un pouvait m'aider (si mon problème est clair, bien sûr!)?
    En vous remerciant,
    Claudine

  2. #2
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 17
    Points : 13
    Points
    13
    Par défaut Solution trouvée (Classification automatique)
    ... j'ai trouvé finalement la réponse. Elle n'était pas si compliquée!

    Au cas où, si ça intéresserait quelqu'un, voici ce que j'ai fait :
    - Construction d'une matrice où j'ai calculé par individu les distances entre les différentes communes 2 à 2 (avec la formule utilisée en orthodromie)
    - Puis réalisation d'une CAH (avec la PROC CLUSTER) où les distances calculées constituent mes variables
    - Enfin obtention de clusters plutôt cohérents.

    Bonne après-midi,
    Claudine

  3. #3
    Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2014
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Janvier 2014
    Messages : 2
    Points : 3
    Points
    3
    Par défaut Proc fastclus
    Bonjour,

    Je me permets de vous contacter car je veux utiliser la proc fastclus pour regrouper les secteurs d'activité. En effet, j'ai 13 secteurs d'activités et les taux de defaut annuels de chaque secteur sur 15 ans. Je veux en fait regrouper ces 13 secteurs en un nombre reduit.
    1) Quel type de données dois-je utiliser? Brutes ou standardisées? Et pourquoi?
    2) Pouvez-vous me dire comment vous avez construit votre matrice? J'ai essayé en fait de calculer les distances secteur 2 par 2 mais ca fait super long car je le fais sous excel!
    3) Et enfin pouvez vous m'envoyer vos codes?

    Merci d'avance

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Classification automatique de documents
    Par camboui dans le forum Intelligence artificielle
    Réponses: 10
    Dernier message: 23/11/2011, 00h24
  2. Classification aléatoire avec la proc fastclus
    Par stefsas dans le forum SAS STAT
    Réponses: 2
    Dernier message: 15/09/2008, 11h44
  3. login automatique via url
    Par Groovygirl dans le forum ASP
    Réponses: 3
    Dernier message: 23/06/2006, 12h59
  4. Lien Oracle-C++ Builder via ProC/C++
    Par JeFF Boss dans le forum Oracle
    Réponses: 1
    Dernier message: 05/06/2006, 19h07
  5. Réponses: 7
    Dernier message: 30/05/2006, 15h08

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo