Bonjour à tous,
Voici un problème en programmation Shell (KSH) auquel je suis exposé et dont j'aimerai bien trouver une solution.
A partir d'un fichier CSV contenant une 20aine de champs, je dois extraire les lignes dont le champ contenant l'e-mail ne doit pas être dupliqué dans les autres lignes (donc unique). Le problème majeur est que le fichier CSV contient des milliers de lignes (~ 300.000) et qu'un algorithme avec des boucles (WHILE, FOR ou UNTIL) ne serait pas les bienvenus vu le temps de traitement que cela prendrait. Par contre j'ai à ma disposition AWK et/ou SED.
Exemple de fichier en entrée :
1,u,toto@mail.com
2,v,titi@mail.com
3,w,tutu@mail.com
4,x,tata@mail.com
5,y,titi@mail.com
Doit devenir en fichier de sortie :
1,u,toto@mail.com
3,w,tutu@mail.com
4,x,tata@mail.com
Merci d'avance pour votre aide !
Partager