IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques, Data Mining et Data Science Discussion :

Différence entre Classification et Régression


Sujet :

Statistiques, Data Mining et Data Science

  1. #1
    Membre confirmé
    Profil pro
    Inscrit en
    Octobre 2007
    Messages
    95
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 95
    Par défaut Différence entre Classification et Régression
    Bonjour à tous,

    Je me pose une question somme toute assez bête, mais est-ce que quelqu'un pourrait m'expliquer quelles sont les différences entre "classification" et "régression" et également, entre "generative classifier" et "discriminative classifier" ?

    Merci d'avance
    Bonne journée à tous

  2. #2
    Membre Expert
    Homme Profil pro
    Chercheur
    Inscrit en
    Mars 2010
    Messages
    1 218
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Chercheur

    Informations forums :
    Inscription : Mars 2010
    Messages : 1 218
    Par défaut
    Bonjour,

    la signification du terme "classification" diffère selon les auteurs et surtout selon les pays.

    En France, on considère généralement que la classification concerne les problèmes de calcul d'un recouvrement d'un ensemble de données (typiquement un partitionnement). L'algorithme des k-moyennes ou la classification ascendante hiérarchique en sont des fameux exemples. On se sert principalement des algorithmes de classification pour identifier des groupes de données au sein d'un même ensemble. En anglais, on parle plutôt de problème de clustering.

    En anglais, le terme "classification" est traduit par "classement" en français. Les problèmes de classement consistent à prédire les classes ou étiquettes d'un ensemble de données à partir d'une base d'apprentissage pré-étiquetée.

    Pour la régression, il n'y a pas d'ambiguïté : il s'agit de prédire des valeurs numériques continues pour un ensemble de données à partir d'une base d'apprentissage. Le classement peut être vu comme un cas particulier de régression où les valeurs à prédire sont discrètes.

    Pour ma part, j'évite d'utiliser le terme "classification" pour éviter toute ambiguïté. Pour le "clustering", tu peux parler des méthodes d'apprentissage non-supervisés. Pour le classement et la régression, tu peux parler des méthodes d'apprentissage supervisé (par des valeurs discrètes et continues respectivement).

    Dans les modèles génératifs, on fait une ou plusieurs hypothèses sur la distribution des données. L'exemple le plus connu est le classifieur bayésien naïf avec distribution gaussienne multidimensionnelle.
    Dans les modèles discriminatifs, on ne s'intéresse pas directement à la distribution des données : on cherche à construire un modèle prédictif à l'aide d'une méthode d'approximation. C'est par exemple le cas des réseaux de neurones et des machines à vecteurs supports.

    En général, on considère que les modèles discriminatifs donnent de meilleurs résultats que les modèles génératifs (parce que les hypothèses sont généralement fausses et trop simplificatrices). Ceci dit, je te conseille de vérifier par toi-même car beaucoup de publications dans ce domaine proposent des tests expérimentaux biaisés (absence de validation, mauvais protocole, etc).

  3. #3
    Membre confirmé
    Profil pro
    Inscrit en
    Octobre 2007
    Messages
    95
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 95
    Par défaut
    Citation Envoyé par Aleph69 Voir le message
    Bonjour,

    la signification du terme "classification" diffère selon les auteurs et surtout selon les pays.

    En France, on considère généralement que la classification concerne les problèmes de calcul d'un recouvrement d'un ensemble de données (typiquement un partitionnement). L'algorithme des k-moyennes ou la classification ascendante hiérarchique en sont des fameux exemples. On se sert principalement des algorithmes de classification pour identifier des groupes de données au sein d'un même ensemble. En anglais, on parle plutôt de problème de clustering.

    En anglais, le terme "classification" est traduit par "classement" en français. Les problèmes de classement consistent à prédire les classes ou étiquettes d'un ensemble de données à partir d'une base d'apprentissage pré-étiquetée.

    Pour la régression, il n'y a pas d'ambiguïté : il s'agit de prédire des valeurs numériques continues pour un ensemble de données à partir d'une base d'apprentissage. Le classement peut être vu comme un cas particulier de régression où les valeurs à prédire sont discrètes.

    Pour ma part, j'évite d'utiliser le terme "classification" pour éviter toute ambiguïté. Pour le "clustering", tu peux parler des méthodes d'apprentissage non-supervisés. Pour le classement et la régression, tu peux parler des méthodes d'apprentissage supervisé (par des valeurs discrètes et continues respectivement).

    Dans les modèles génératifs, on fait une ou plusieurs hypothèses sur la distribution des données. L'exemple le plus connu est le classifieur bayésien naïf avec distribution gaussienne multidimensionnelle.
    Dans les modèles discriminatifs, on ne s'intéresse pas directement à la distribution des données : on cherche à construire un modèle prédictif à l'aide d'une méthode d'approximation. C'est par exemple le cas des réseaux de neurones et des machines à vecteurs supports.

    En général, on considère que les modèles discriminatifs donnent de meilleurs résultats que les modèles génératifs (parce que les hypothèses sont généralement fausses et trop simplificatrices). Ceci dit, je te conseille de vérifier par toi-même car beaucoup de publications dans ce domaine proposent des tests expérimentaux biaisés (absence de validation, mauvais protocole, etc).
    Je te remercie pour ces explications...

  4. #4
    Invité de passage
    Profil pro
    Inscrit en
    Octobre 2010
    Messages
    1
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2010
    Messages : 1
    Par défaut Intelligence artificielle
    Bonjour à tous !
    Alors voilà : je suis en première S et cette année je dois présenter un TPE.
    Avec une amie, nous avons choisi de parler de l'I.A.
    J'aimerai créer un programme intelligent pour le présenter ensuite au jury du bac
    Est-ce que vous pourriez me donnez des conseils?
    Merci beaucoup !!

Discussions similaires

  1. La différence entre le "classement" et la "classification"
    Par medpacifique dans le forum Méthodes prédictives
    Réponses: 1
    Dernier message: 25/04/2014, 20h39
  2. Réponses: 9
    Dernier message: 27/02/2014, 20h31
  3. Différence entre Régression logistique et arbre de décision
    Par cococmoi dans le forum Statistiques, Data Mining et Data Science
    Réponses: 2
    Dernier message: 25/02/2014, 14h07
  4. Différences entre des algorithmes de classification
    Par javass dans le forum Méthodes prédictives
    Réponses: 2
    Dernier message: 06/09/2010, 22h54
  5. Différences entre segmentation et classification d'image
    Par mercure321 dans le forum Traitement d'images
    Réponses: 4
    Dernier message: 05/12/2007, 21h27

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo