Bonjour,
J'imagine que c'est une question récurrente mais j'y vais tout de même.
Je développe un algo de clustering (hiérarchique ou K-Means).
Et là je veux fusionner les clusters les plus proches mais je ne sais pas quelle distance utiliser...
Plutôt distance de Manhattan (simple somme de mes deltas x et y) ou euclidienne (somme des deltas au carrés puis racine).
Outre la complexité de calcul de ces 2 distances, laquelle serait le plus appropriée pour moi?
Autre question: l'ordre est-il toujours respecté? je veux dire une distance euclidienne entre 2 points est de longueur E1. Une autre distance entre 2 autres points est E2. Si E1 < E2, ce serait aussi toujours le cas pour M1 et M2 mesurées avec les mêmes points?
J'espère que j'ai réussi à me faire comprendre...
Salutations
Partager