IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques, Data Mining et Data Science Discussion :

Problème nature données appariées ou indépendantes


Sujet :

Statistiques, Data Mining et Data Science

  1. #1
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2024
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2024
    Messages : 5
    Points : 5
    Points
    5
    Par défaut Problème nature données appariées ou indépendantes
    Bonjour,
    J'ai une question qui paraît simple de base mais qui me tord les méninges.

    Contexte : on a des poules qui pondent et des variables reliées à la ponte sont dans une base de donnée où chaque observation est une ponte.
    J'ai différents lots de poules, et je souhaite mesurer des caractéristiques liées à ma ponte (comme le nombre d'oeufs) entre mes lots.
    Deux pontes peuvent être réalisées par la même poule mais ma base de données n'inclut pas spécifiquement l'id des poules.
    Est ce que mes données sont appariées ou indépendantes ?

    Je vous remercie par avance .
    Cordialement,
    Glougloup2

  2. #2
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 167
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 167
    Points : 9 642
    Points
    9 642
    Par défaut
    Les données appariées, c'est quand il y a 'traçabilité'.
    On a n individus. Pour chaque individu, on a 2 mesures (la taille et le poids par exemple), et surtout, on sait quelle mesure M1 correspond à quelle mesure M2. C'est à dire, on sait qu'il y a un individu qui mesure 2m05 et qui pèse 142 kg (ça doit être Teddy Rinner, mais pour notre étude, ça n'est pas utile), puis un autre individu qui mesure 1m80 et pèse 79kg etc etc

    appariées, ça fait penser au mot 'paire' : on a n paires (taille, poids) ; on sait quelle taille est associé à quel poids.

    Si on a n individus, on connait les différentes tailles (n nombres) et les différents poids (n nombres aussi), mais qu'on ne sait pas quelle taille est associé à quel poids, on retombe dans le cas de mesures indépendantes.

    Dans ton cas, je ne vois pas de paire. Donc pas de données appariées.

  3. #3
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2024
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2024
    Messages : 5
    Points : 5
    Points
    5
    Par défaut
    Merci beaucoup pour ta réponse.

    Mais le truc que je ne comprends pas, c'est que mes observations ne sont pas indépendantes au sein d'un même lot puisque une poule d'un lot peut pondre plusieurs fois.

    Est ce que je peux quand même faire une anova à 1 facteur (lot) si mes observations ne sont pas indépendantes au sein du même lot ?

    Je vous remercie d'avance pour votre aide.

    Cordialement,

    Glougloup2 🙂

  4. #4
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 167
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 167
    Points : 9 642
    Points
    9 642
    Par défaut
    Description d'un lot: Un lot est constitué d'une centaine de poules, et on s'intéresse à tous les oeufs pondus par ce lot sur une semaine. En gros 500 oeufs pondus, avec une variance faible : au max, une poule a pondu 10 oeufs ; on n'est pas dans une configuration PB1 où 4 ou 5 poules pondraient une cinquantaine d'oeufs chacune, et les autres pondraient 1 ou 2 oeufs chacune.

    Si ma description est à peu près fidèle, alors pas de problème.
    Même si au sein d'un groupe de 500 pontes, on a plusieurs pontes pour chaque poule, tu peux considérer les données comme indépendantes.

    Pour t'en convaincre, tu peux dire que tu pourrais extraire un échantillon de 100 pontes par exemple, et il n'y aurait aucun problème. Mais ne nous privons pas de 500 données quand on a 500 données.

    Et si ma description est totalement décalée par rapport à tes données, donne nous des chiffres.

  5. #5
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2024
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2024
    Messages : 5
    Points : 5
    Points
    5
    Par défaut
    Bonjour, Vous m'avez permis de résoudre mon problème il y a quelques mois je vous en remercie. Bonne journée,

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 24
    Dernier message: 16/03/2009, 19h34
  2. [VB.NET] Import donnes d'excel : chiffres et lettres
    Par JohnGT dans le forum Windows Forms
    Réponses: 5
    Dernier message: 19/10/2004, 19h53
  3. CComboBox::setCurSel ne donne rien
    Par jul54 dans le forum MFC
    Réponses: 5
    Dernier message: 11/02/2004, 14h55
  4. TreeView -> ajouter un child à un noeud donné
    Par fake dans le forum Composants VCL
    Réponses: 6
    Dernier message: 26/03/2003, 18h14
  5. connexion base de donné
    Par saidi dans le forum MFC
    Réponses: 3
    Dernier message: 07/08/2002, 23h22

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo