Bonjour,
Je suis confronté a un problème, en apparence simple mais qui me pose beaucoup de soucis (principalement parce que je suis pas très à l'aise avec le SQL également).
J'ai plusieurs base a "nettoyer", elles ont toute une architecture différentes (autant sur le nombre de variable, que sur leurs type ou leurs taille).
Pour schématiser le problème, j'ai créer une base de test simple :
Comme vous pouvez le voir, ma table est composé de ligne complète et quasiment identique mais auquel il manque des champs.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7A B C D // Quatre variables A1 B1 C1 D1 // Quatre valeurs A1 C1 D1 B1 C1 D1 C1 A1 B1 C1
Je peux pas les garder dans ma base, ces lignes représentent juste une perte d'information.
J'arrive a traiter le cas où deux lignes sont strictement identique (doublons parfait) et à supprimer toutes ces lignes.
J'ai naïvement fait un algorithme qui compare chaque variable avec les variables des lignes suivantes mais l'algo est absolument pas évolutif et absolument pas pratique (pour 4 variables, 4*4 IF différents ...)
Il me faudrait un algo qui puisse se déplacer de variables en variables sans utiliser leurs noms et qui s'arrête quand la ligne ne contient plus de variable à comparer (comme une boucle FOR pour parcourir un tableau) mais j'ai aucunes idées de comment faire ...
Si vous avez une idée de comment éclairer ma lanterne, je vous remercie d'avance
( et si jamais je suis pas très clair dans mes explications, je peux toujours ré expliquer )
Partager