Bonjour à tous,
J'ai plusieurs fichiers .vcf (type vCard) contenant beaucoup d'adresse email.
Je souhaite parser ces fichiers .vfc afin de récupérer les adresse mails. Elles sont ensuite écrites dans un fichier texte.
J'arrive à faire cette première étape via ce petit script :
less ~/Desktop/adresseMail.vcf | grep -e '\w*@\w*.\w*' -o | sort -u > ~/Desktop/recupAdresse.txt
J'aimerais améliorer cette expression régulière afin de vérifier la validité du format des adresse emails. Et là... je bloque!
J'ai essayer avec des exemples de regex trouvées sur ce site dans la section "The Official Standard: RFC 2822". Ce qui donne ceci :
less ~/Desktop/adresseMail.vcf | grep -e "[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*@(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?" -o | sort -u > ~/Desktop/recupAdresse.txt
Mon Shell me retourne deux lignes d'erreurs :
command substitution: line 1: syntax error near unexpected token `|'
command substitution: line 1: `{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_'
J'ai modifier certains caractères de cette regex, mis des antiSlashs un peu au pif étant donné que je suis loin d'être un expert mais rien ne fonctionne...
Auriez-vous une solution à ce problème? Un exemple de regex qui fonctionne pour ce cas de figure?
Merci par avance.
Partager