Bonjour à vous !
je résume la situation par un exemple :
- données en entrée, 2 variables ident, val1 (ce que j'ai)
Ident val1
1 0.5
2 0.4
3 0.3
4 0.6
5 0.7
- données en sortie, 3 variables ident1, ident2, resultat (ce que je veux)
Ident1 Ident2 resultat
1 2 (val1 de ident1- val1 de ident2)**2
1 3 (val1 de ident1- val1 de ident3)**2
1 4 ...........
1 5 ...........
2 3 ...........
2 4 ...........
2 5 ...........
3 4 ...........
3 5 ...........
4 5 (val1 de ident4- val1 de ident5)**2
problème : réellement, j'ai une table de plusieurs milliers de données, et que en procédant avec des call symput pour récupérer la valeur de chaque ident, ça prend un temps inimaginable (je ne suis pas arrivé au bout...)
la table en sortie fait au final (n*n-1)/2 observations. Dans mon exemple, avec 5 individus, nous n'avons que 10 lignes mais avec 10000 individus, je suis à 49995000 lignes :-s
question : y a-t-il un moyen d'aller plus vite (proc IML par exemple)
Merci beaucoup de votre réponse !
Cordialement
Partager