Bonjour à tous,
Je voudrais savoir s'il y a une méthode pour détecter les individus hors norme ou extrême, et comment les supprimer d'une table.
Merci pour votre aide
Bonjour à tous,
Je voudrais savoir s'il y a une méthode pour détecter les individus hors norme ou extrême, et comment les supprimer d'une table.
Merci pour votre aide
regarde dans la proc UNIVARIATE comment gérer les déciles.
Rebonjour Demido,
en quoi ce post est-il différent de celui déjà en cours? J'y ai posté un réponse ce matin qui pourra peut-être t'aider. Evite de multiplier les sujets en tout cas (enfin je veux dire, un sujet, une question...).
@ datametric: si je comprends bien tu considères les individus compris dans les deux déciles les plus extrèmes comme outlier, un supérieur, un inférieur. Si c'est le cas celà revient à dire que nécéssairement un individu sur cinq est extrème. En mon sens, il n'y a pas nécéssairement d'indivdus extrèmes dans un nuage de point, et en tout cas dans peu de cas on arrivera au retrait d'un cinquième des individus...
Je préconise plutot la méthode basée sur l'interquartile range présentée dans l'autre post..
Sans connaître le fond de la question, je considère que c'est une première étape pour détecter les points aberrants.
Plus particulièrement, je me refère à la table ExtremeObs. (http://support.sas.com/documentation...te_sect058.htm)
Maintenant, rien ne dit que des extrêmes seront détectés ou bien que ces extrêmes soient pertinents dans l'étude.
C'est deux approches différentes. Comme tu le suggères, l'essentiel est de se baser sur le cas concret du jeu de données, de son contexte et de sa problématique.
Le retour de demido de ces deux approches sur son jeu de données sera le bienvenu
C'est clair.
Partager