Bonjour,
J'ai une question concernant la classification automatique (j'ai utilisé PROC FASTCLUS).
Donc, voici mon problème :
J'ai des individus qui sont amenés à visiter plusieurs communes en France (dont je connais les coordonnées géographiques, à savoir leur latitude et leur longitude). Un individu peut visiter jusqu'à 40 communes. Je souhaite observer, pour chaque panéliste, si ces communes sont dispersées ou concentrées et, notamment, s'il existe des pôles (la distance séparant les communes au sein d'un même pôle ne devant pas dépasser 100 kilomètres).
On me recommande de faire, pour chaque individu, une classification automatique à partir des seules coordonnées géographiques ; les clusters obtenus seraient ainsi mes pôles.
Mon souci est que je ne parviens pas à contrôler la distance. Même si je sais que la distance utilisée dans la classification n'est pas une distance kilométrique..., je pensais qu'en trouvant une valeur du RADIUS "correcte", je pourrais identifier des pôles plutôt homogènes (en étant pas trop exigeant sur le "plutôt"). Mais, le résultat n'est pas du tout convaincant. Certains clusters englobent des communes beaucoup trop éloignées.
Je précise que je débute avec PROC FASTCLUS, donc je suis peut-être passée à côté d'options ; à moins que je n'aie pas compris l'usage du RADIUS. Si quelqu'un pouvait m'aider (si mon problème est clair, bien sûr!)?
En vous remerciant,
Claudine
Partager