IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Weka et MOA Discussion :

préparation des données avec weka


Sujet :

Weka et MOA

  1. #1
    Membre confirmé Avatar de rvfranck
    Profil pro
    Étudiant
    Inscrit en
    Novembre 2004
    Messages
    746
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2004
    Messages : 746
    Points : 534
    Points
    534
    Par défaut préparation des données avec weka
    Salut,

    J'ai un fichier cvs qui contient des informations que je devrais utiliser pour une etude de data mining. les informations en question ont une structure "bizarre" et j'aimerai savoir si weka peut m'aider à faire le pré-traitement. voici un exemple:
    ligne 1: P01, nom, age, sexe
    ligne 2: P01, taille, poids
    ligne 3: P01, nationalité
    ligne 4: P02, nom, age, sexe
    ligne 5: P02, taille, poids
    Je me demandais si weka pouvait traiter un fichier structuré ainsi (ce qui m'étonnerait). Sinon est ce que je pourrai utiliser weka pour ramener par exemple les informations sur une ligne:
    P01, nom, age, sexe, taille, poids, nationalité
    Merci

  2. #2
    Rédacteur
    Avatar de JauB
    Homme Profil pro
    Freelancer
    Inscrit en
    Octobre 2005
    Messages
    1 792
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : Maroc

    Informations professionnelles :
    Activité : Freelancer
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2005
    Messages : 1 792
    Points : 2 914
    Points
    2 914
    Par défaut
    à ma connaissance WEKA ne peut traiter un fichier CSV que s'il est du format suivant :

    ligne1: AGE,SEXE,...
    ligne2: 23,M,........
    ligne3: 25,F,......

    Pourquoi t'as besoin d'une autre structure que celle que je viens de citer!?
    comme ça c'est lisible et comprhénsible non?

  3. #3
    Membre confirmé Avatar de rvfranck
    Profil pro
    Étudiant
    Inscrit en
    Novembre 2004
    Messages
    746
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2004
    Messages : 746
    Points : 534
    Points
    534
    Par défaut
    mon fichier cvs a cette structure:
    identifiant, attribut1, attribut2
    le problème c'est que les attributs d'un identifiant peuvent être sur plusieurs lignes:
    P01, nom, age, sexe
    P01, taille, poids
    P01, nationalité
    Dans l'exemple ci dessus, les attributs (nom, age, sexe, taille, poids et nationalité) de P01 ne sont pas tous sur une même ligne. Ma question est est ce que weka pourrait les mettres sur une même ligne si je lui soumettais le fichier tel quel?

    Merci

  4. #4
    Membre éprouvé Avatar de Jester
    Inscrit en
    Septembre 2003
    Messages
    813
    Détails du profil
    Informations forums :
    Inscription : Septembre 2003
    Messages : 813
    Points : 1 057
    Points
    1 057
    Par défaut
    Non weka n'arrivera même pas à lire un tel fichier CVS, le format interne de représentation ne le permet pas. Mais c'est l'histoire d'un petit script à faire pour modifier le format du fichier.

  5. #5
    Membre confirmé Avatar de rvfranck
    Profil pro
    Étudiant
    Inscrit en
    Novembre 2004
    Messages
    746
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2004
    Messages : 746
    Points : 534
    Points
    534
    Par défaut
    Merci,
    C'était juste pour eviter de faire quelque chose que weka me permettrait de faire.

  6. #6
    Rédacteur
    Avatar de JauB
    Homme Profil pro
    Freelancer
    Inscrit en
    Octobre 2005
    Messages
    1 792
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : Maroc

    Informations professionnelles :
    Activité : Freelancer
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2005
    Messages : 1 792
    Points : 2 914
    Points
    2 914
    Par défaut
    beh tu vois ?
    sinon dis nous comment t'as eu ce fichier?tu l'as extrait à partir d'une base de données toi même ou qu'on te l'a donné tel que tu nous le montres?
    sinon jette un oeuil sur mon article que je suis entrain de rédiger:
    article sur weka.

    il n'est pas encore finalisé, mais j'y travaille en ces moments. il te donnera une idée sur le comment des choses
    Bon courage

  7. #7
    Membre confirmé Avatar de rvfranck
    Profil pro
    Étudiant
    Inscrit en
    Novembre 2004
    Messages
    746
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2004
    Messages : 746
    Points : 534
    Points
    534
    Par défaut
    Merci,

    je viens d'imprimer ton article pour le lire. Au sujet des données, on me les a donné comme ça et je dois appliquer un algo de clustering dessus.

    Je viens de faire un script en pl/sql et le problème est règlé. Maintenant je vais m'attaquer à weka.

    a+++++++++

  8. #8
    Rédacteur
    Avatar de JauB
    Homme Profil pro
    Freelancer
    Inscrit en
    Octobre 2005
    Messages
    1 792
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : Maroc

    Informations professionnelles :
    Activité : Freelancer
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2005
    Messages : 1 792
    Points : 2 914
    Points
    2 914
    Par défaut
    si c'est bon alors n'oublie pas le

  9. #9
    Membre confirmé Avatar de rvfranck
    Profil pro
    Étudiant
    Inscrit en
    Novembre 2004
    Messages
    746
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2004
    Messages : 746
    Points : 534
    Points
    534
    Par défaut
    Salut JauB,
    J'ai activé le depuis la reponse de Jester.
    a+++++++

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Rafraichissement des données avec ADOConnection -SQL Server
    Par newfsch dans le forum Bases de données
    Réponses: 4
    Dernier message: 04/01/2006, 21h48
  2. Exploration des données avec cristal Reports XI
    Par silversatch62 dans le forum SAP Crystal Reports
    Réponses: 2
    Dernier message: 17/06/2005, 09h51
  3. [format des données avec une procédure stockée]
    Par viny dans le forum PostgreSQL
    Réponses: 7
    Dernier message: 10/03/2005, 13h24
  4. Exporter seulement une partie des données avec pg_dump ?
    Par Philhz dans le forum PostgreSQL
    Réponses: 2
    Dernier message: 31/07/2004, 09h50
  5. Réponses: 13
    Dernier message: 20/03/2003, 08h11

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo