IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Java Discussion :

regex CSV avec des guillemets


Sujet :

Java

  1. #41
    Rédacteur
    Avatar de thierryler
    Homme Profil pro
    Inscrit en
    Octobre 2007
    Messages
    4 078
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 4 078
    Points : 12 815
    Points
    12 815
    Par défaut
    oui oui je n'oublie pas. merci.

    Ce que je veux dire, c'est que ça se mord la queue, si je lit le fichier pour ajouter un \n à la fin, bah ça veut dire que j'ai donc déjà lu le fichier.

    Ou alors il faudrait écrire un truc du style :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    if( ! line.endsWith("\n") ) {
     line += "\n";
    }
    C'est pas la mort en effet.

    Cela dit, si william44290 a raison sur les retours à la ligne dans le csv, ça va simplifier tout ça...

    Pour tout dire, ça fait déjà quelques messages que je ne comprend pas tout... et après faut que je retranscrive dans un tuto lol

  2. #42
    Rédacteur/Modérateur
    Avatar de Logan Mauzaize
    Homme Profil pro
    Architecte technique
    Inscrit en
    Août 2005
    Messages
    2 894
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Architecte technique
    Secteur : Transports

    Informations forums :
    Inscription : Août 2005
    Messages : 2 894
    Points : 7 084
    Points
    7 084
    Par défaut
    Il n'existe pas de standard CSV ...

    Sinon Excel utilise "\r\n" pour les lignes de données et "\n" comme saut de ligne des valeurs (enfin je suppose que ca dépend quelle version aussi).

  3. #43
    Rédacteur
    Avatar de thierryler
    Homme Profil pro
    Inscrit en
    Octobre 2007
    Messages
    4 078
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 4 078
    Points : 12 815
    Points
    12 815
    Par défaut
    C'est pas gagné mon affaire...

    Est ce que je peux partir du principe d'un champ qui contient un retour chariot sera forcément entouré de guillemet ?

  4. #44
    Expert éminent sénior
    Avatar de sinok
    Profil pro
    Inscrit en
    Août 2004
    Messages
    8 765
    Détails du profil
    Informations personnelles :
    Âge : 44
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Août 2004
    Messages : 8 765
    Points : 12 977
    Points
    12 977
    Par défaut
    Citation Envoyé par thierryler Voir le message
    C'est pas gagné mon affaire...

    Est ce que je peux partir du principe d'un champ qui contient un retour chariot sera forcément entouré de guillemet ?
    Ca c'est un question à poser aux gens qui produisebt/fournissent le CSV...

    Ou alors c'est à toi de fixer des règles acceptables pour les fichiers à intégrer, le CSV étant un format flou par essence...

  5. #45
    Rédacteur
    Avatar de thierryler
    Homme Profil pro
    Inscrit en
    Octobre 2007
    Messages
    4 078
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 4 078
    Points : 12 815
    Points
    12 815
    Par défaut
    Bon, je vais faire comme ça alors, en adaptant la proposition de Loceka et je vous dit ce que ça donne.

  6. #46
    Expert éminent sénior
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 482
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 45
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 482
    Points : 48 807
    Points
    48 807
    Par défaut
    beaucoup de blabla et de lignes de code alors qu'on obtiens le bon résultat avec

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
        CSVReader reader = new CSVReader(new FileReader("yourfile.csv"));
        String [] nextLine;
        while ((nextLine = reader.readNext()) != null) {
            // nextLine[] is an array of values from the line
            System.out.println(nextLine[0] + nextLine[1] + "etc...");
        }
    Arrêtez de réinventer la roue!

    Pour les retours à la ligne, c'est conventionellement bien établis qu'un retour à la ligne dans une valeur doit être quoté.

  7. #47
    Rédacteur
    Avatar de thierryler
    Homme Profil pro
    Inscrit en
    Octobre 2007
    Messages
    4 078
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 4 078
    Points : 12 815
    Points
    12 815
    Par défaut
    On le trouve où l'objet CSVReader ?

    Ajout : oups je viens de voir le lien vers CsvReader...

    Mais justement, mon objectif est précisément de réécrire un reader, pour comprendre comment ça marche.

    Mais je pense que je finirai mon tuto en renvoyant vers cette lib

  8. #48
    Rédacteur
    Avatar de thierryler
    Homme Profil pro
    Inscrit en
    Octobre 2007
    Messages
    4 078
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 4 078
    Points : 12 815
    Points
    12 815
    Par défaut
    J'ai enfin pu tester le code de Loceka. Ca me donne la sortie suivante :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
     
    Chaîne : # Fichier avec la liste des chiens du magasin
    # Propriété de Thierry
     
    # Titres id; Prénom; Couleur et Age.
    "Id";"Prénom";"Couleur";"Age"
     
    "1";"Titi";"Jaune";"5"
    "2";"Médor de 
    la branche de mes
    deux parents";"Noir";"10"
    "3";"Pitié";"Noir";"5"
    "4";"Juju";"Gris";"5"
    "5";"Vanille";"Blanc";"7"
    "6";"Chocolat";"Marron";"12"
    "7";"Milou";"Blanc";"3"
     
    # La ligne suivante (Idefix) a trois couleur avec un point-virgule dedans
    "8";"Idefix";"Blanc; noir et beige";"14"
     
    "9";"Pluto";"Jaune";"17"
    10;Dingo;Roux;1
     
    Regex : [ \t\x0B\f]*(?:(?:\r\n|\n\r|\n)|#.*(?:\r\n|\n\r|\n))|(?:((?:"(?:""|[^"])*")|(?:[^;"(?:\r\n|\n\r|\n)]*))[ \t\x0B\f]*(;|(?:\r\n|\n\r|\n)))
    1,1 : "Id" [;]
    1,2 : "Prénom" [;]
    1,3 : "Couleur" [;]
    1,4 : "Age" [
    ]
    2,1 : "1" [;]
    2,2 : "Titi" [;]
    2,3 : "Jaune" [;]
    2,4 : "5" [
    ]
    3,1 : "2" [;]
    3,2 : "Médor de 
    la branche de mes
    deux parents" [;]
    3,3 : "Noir" [;]
    3,4 : "10" [
    ]
    4,1 : "3" [;]
    4,2 : "Pitié" [;]
    4,3 : "Noir" [;]
    4,4 : "5" [
    ]
    5,1 : "4" [;]
    5,2 : "Juju" [;]
    5,3 : "Gris" [;]
    5,4 : "5" [
    ]
    6,1 : "5" [;]
    6,2 : "Vanille" [;]
    6,3 : "Blanc" [;]
    6,4 : "7" [
    ]
    7,1 : "6" [;]
    7,2 : "Chocolat" [;]
    7,3 : "Marron" [;]
    7,4 : "12" [
    ]
    8,1 : "7" [;]
    8,2 : "Milou" [;]
    8,3 : "Blanc" [;]
    8,4 : "3" [
    ]
    9,1 : "8" [;]
    9,2 : "Idefix" [;]
    9,3 : "Blanc; noir et beige" [;]
    9,4 : "14" [
    ]
    10,1 : "9" [;]
    10,2 : "Pluto" [;]
    10,3 : "Jaune" [;]
    10,4 : "17" [
    ]
    11,1 : 10 [;]
    11,2 : Dingo [;]
    11,3 : Roux [;]
    11,4 : 1 [
    ]
    Du coup ça marche bien pour les retours à la lignes, mais ça n'enlève pas les guillemets qui délimitent les champs. Je me dis que je peux les enlever lors du traitement, avec un truc du genre :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
     
    String champ = "\"titi\""; // --> "Titi"
    if(champ.startsWith("\"") && champ.endsWith("\"")) {
        champ = champ.substring(1, champ.length - 2);
    }
    Mais du coup, si je fais un truc comme ça, ça sert à quoi de faire une regex aussi avancée ?

  9. #49
    Rédacteur
    Avatar de thierryler
    Homme Profil pro
    Inscrit en
    Octobre 2007
    Messages
    4 078
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 4 078
    Points : 12 815
    Points
    12 815
    Par défaut
    Mais pour l'instant je n'en suis pas encore au stade multiligne...

    Je traite les guillemets (Idéfix) avec la regex suivante :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
     
    // "(^|(?<=;))([^\";])*((?=;)|$)|((?<=^\")|(?<=;\"))([^\"]|\"\")*((?=\";)|(?=\"$))";
    final String regex = "(^|(?<=" + separator + "))([^\"" + separator + "])*((?=" + separator + ")|$)|((?<=^\")|(?<=" + separator + "\"))([^\"]|\"\")*((?=\"" + separator + ")|(?=\"$))";
    Ca marche bien. Mais notez bien que je comprend pas comment ça marche. Si quelqu'un voulait m'expliquer.

    Avant de passer en multiligne, par exemple en utilisant le code de Loceka, je voudrais traiter le cas du double guillemet (Titi) :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
     
    # Titres id; Prénom; Couleur et Age.
    Id;Prénom;Couleur;Age
     
    # Titi a une couleur avec double-guillemet
    1;Titi;"Jaune ""bizare""";5
     
    2;Médor;Noir;10
    3;Pitié;Noir;5
    4;Juju;Gris;5
    5;Vanille;Blanc;7
    6;Chocolat;Marron;12
    7;Milou;Blanc;3
     
    # La ligne suivante (Idefix) a trois couleur avec un point-virgule dedans
    8;Idefix;"Blanc; noir et beige";14
     
    9;Pluto;Jaune;17
    10;Dingo;Roux;1
    Idéalement je voudrais carrément prendre le cas suivant en compte aussi :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    1;Titi;Jaune ""bizare"";5

Discussions similaires

  1. [XL-2010] Convertir plusieurs fichiers excel en csv avec des guillemets
    Par karido-74 dans le forum Macros et VBA Excel
    Réponses: 41
    Dernier message: 29/01/2014, 18h32
  2. [CSV] importation CSV avec des guillemets
    Par trash_board dans le forum Langage
    Réponses: 3
    Dernier message: 12/09/2006, 14h08
  3. Réponses: 9
    Dernier message: 28/10/2005, 11h43
  4. [C#] Prob IndexOf sous Pocket Pc avec des guillemets
    Par freddyboy dans le forum Windows Mobile
    Réponses: 7
    Dernier message: 10/06/2004, 09h57

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo