IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Algorithmes et structures de données Discussion :

Distance de Manhattan ou euclidienne?


Sujet :

Algorithmes et structures de données

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Mai 2006
    Messages
    16
    Détails du profil
    Informations personnelles :
    Âge : 38
    Localisation : Suisse

    Informations forums :
    Inscription : Mai 2006
    Messages : 16
    Points : 12
    Points
    12
    Par défaut Distance de Manhattan ou euclidienne?
    Bonjour,

    J'imagine que c'est une question récurrente mais j'y vais tout de même.

    Je développe un algo de clustering (hiérarchique ou K-Means).

    Et là je veux fusionner les clusters les plus proches mais je ne sais pas quelle distance utiliser...

    Plutôt distance de Manhattan (simple somme de mes deltas x et y) ou euclidienne (somme des deltas au carrés puis racine).

    Outre la complexité de calcul de ces 2 distances, laquelle serait le plus appropriée pour moi?

    Autre question: l'ordre est-il toujours respecté? je veux dire une distance euclidienne entre 2 points est de longueur E1. Une autre distance entre 2 autres points est E2. Si E1 < E2, ce serait aussi toujours le cas pour M1 et M2 mesurées avec les mêmes points?

    J'espère que j'ai réussi à me faire comprendre...

    Salutations

  2. #2
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 45
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Points : 9 860
    Points
    9 860
    Par défaut
    Bonjour,

    la distance Euclidienne est la plus courante, car naturelle.
    En revanche, la distance de Manathan apporte souvent de bons résultats.
    => Il faut comparer les résultats pour ton problème.

  3. #3
    Membre régulier
    Profil pro
    Inscrit en
    Décembre 2007
    Messages
    124
    Détails du profil
    Informations personnelles :
    Âge : 39
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations forums :
    Inscription : Décembre 2007
    Messages : 124
    Points : 107
    Points
    107
    Par défaut
    Je dirai que ca depend de ce que representent tes centres de cluster : dans quel referentiel travailles tu ?
    Si tes variables sont de type "classe" par exemple la distance euclidienne n'est pas adaptée, celle de manhattan oui. Par contre si t'es variables sont les coordonnées spatiales d'un point x,y,z par ex. la distance euclidienne est la plus apropriée. (La distance de Mahalanobis aussi est pas mal, c' est une generalisation de la distance euclidienne en prennant en compte la correlation entre variables).
    Dans ton cas ce site me semble pas mal.

  4. #4
    Membre actif
    Inscrit en
    Mars 2008
    Messages
    209
    Détails du profil
    Informations forums :
    Inscription : Mars 2008
    Messages : 209
    Points : 227
    Points
    227
    Par défaut
    Ce qu'il faut savoir c'est que mathématiquement toutes les distances ( et les normes ) sont équivalentes ... reste à voir d'un point de vu algorithmique ... certaines métriques sont plus simples à calculer

  5. #5
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 45
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Points : 9 860
    Points
    9 860
    Par défaut
    Citation Envoyé par benDelphic Voir le message
    Ce qu'il faut savoir c'est que mathématiquement toutes les distances ( et les normes ) sont équivalentes ... reste à voir d'un point de vu algorithmique ... certaines métriques sont plus simples à calculer
    Tout à fait vrai en théorie, mais en pratique les résultats apportés par ces métriques dans des problèmes de classification (k-means par exemple) sont très différents.

  6. #6
    Rédacteur
    Avatar de Zavonen
    Profil pro
    Inscrit en
    Novembre 2006
    Messages
    1 772
    Détails du profil
    Informations personnelles :
    Âge : 77
    Localisation : France

    Informations forums :
    Inscription : Novembre 2006
    Messages : 1 772
    Points : 1 913
    Points
    1 913
    Par défaut
    Ce qu'il faut savoir c'est que mathématiquement toutes les distances ( et les normes ) sont équivalentes .
    Première mise au point: Il s'agit d'équivalences topologiques. C'est à dire que les espaces topologiques induits sont les mêmes.
    Seconde mise au point: C'est vrai pour les normes et pas pour les distances. Su R^n la distance d(M,N)= 0 si M=N d(M,N)=1 si M<>n n'est pas équivalente à la distance euclidienne.
    Troisième mise au point: Cela n'est vrai, pour les normes, qu'en dimension finie.
    Quatrième mise au point: Si on ne s'intéresse qu'à des distances induites par des normes sur des espaces de dimension finie, alors nous avons effectivement une équivalence topologique (les ouverts d'une topologie sont les mêmes que celle de l'autre) mais pas pour autant une équivalence métrique. La Taxi-cab geometry de Krause (autre appelation de Manhattan) est bien différente de la géométrie euclidienne. En particulier, par deux points il passe plusieurs droites.

  7. #7
    Expert éminent sénior

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 610
    Détails du profil
    Informations personnelles :
    Âge : 67
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 610
    Points : 17 923
    Points
    17 923
    Billets dans le blog
    2
    Par défaut
    je ne suis pas spécialiste des clusters, mais le bon sens voudrait que la distance à prendre en compte soit la distance mini entre les 2 clusters, et non pas entre les centres... non ?

Discussions similaires

  1. [Débutant] la distance de Manhattan
    Par meriem/assia dans le forum Images
    Réponses: 0
    Dernier message: 24/04/2014, 13h45
  2. Distance euclidienne entre 2 matrices
    Par azerty09 dans le forum MATLAB
    Réponses: 1
    Dernier message: 19/02/2008, 19h43
  3. Distance Euclidienne ou L1?
    Par nonoprig dans le forum Algorithmes et structures de données
    Réponses: 4
    Dernier message: 06/02/2008, 17h54
  4. Distance euclidienne entre deux vecteurs
    Par larimoise dans le forum MATLAB
    Réponses: 3
    Dernier message: 02/04/2007, 23h44
  5. Distance euclidienne & distance Mahalanobis
    Par hanane78 dans le forum MATLAB
    Réponses: 9
    Dernier message: 27/03/2007, 13h18

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo