IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

Regression non linéaire - Prédicteurs


Sujet :

SAS STAT

  1. #1
    Membre régulier Avatar de thtghgh
    Homme Profil pro
    Inscrit en
    Mai 2009
    Messages
    221
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Secteur : Finance

    Informations forums :
    Inscription : Mai 2009
    Messages : 221
    Points : 88
    Points
    88
    Par défaut Regression non linéaire - Prédicteurs
    Bonjour à tous,

    Je m'interesse à SAS depuis peu de temps et je souhaiterais faire une étude (a priori simple) sur un echantillon de données que j'ai mis en pièce jointe de ce message.

    Le modèle est y=b0+b1*x1+b2*x2+b3*x1²+b4*x2²+b5*x1*x2+epsilon

    Je cherche les valeurs extrêmes par les stats de ce modèle pour les réponses y, racine(y) et ln(y) (Résidus Studentisés, Cook's D...)

    Pouvez vous m'aider?

    Merci
    Fichiers attachés Fichiers attachés

  2. #2
    Membre chevronné
    Homme Profil pro
    Biostatisticien
    Inscrit en
    Juin 2009
    Messages
    1 206
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Irlande

    Informations professionnelles :
    Activité : Biostatisticien
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Juin 2009
    Messages : 1 206
    Points : 1 868
    Points
    1 868
    Par défaut
    Tu peux obtenir les diagnostics d'influence en utilisant l'output out de la proc reg, en spécifiznt les options cookd et rstudent. Le reste du modèle semble on ne peut plus standard. Tu devras en faire trois puisque tu étudies trois écritures différentes de ta variable réponse. Qu'entends tu par valeurs extremes?

  3. #3
    Membre régulier Avatar de thtghgh
    Homme Profil pro
    Inscrit en
    Mai 2009
    Messages
    221
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Secteur : Finance

    Informations forums :
    Inscription : Mai 2009
    Messages : 221
    Points : 88
    Points
    88
    Par défaut
    Par valeurs extrêmes je veux dire des valeurs qui faussent le modèle et qu'on peut dont enlever.

    Pour le modèle y j'y suis arrivé en écrivant :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    model y= x1 x2 x3 x4 x5/p ;
    OUTPUT OUT = sortie COOKD = cooky RSTUDENT = stud H=hii;
    plot y*x1 y*x2 y*x3 y*x4 y*x5;
    proc print;
    run;
    Mais comment faire pour le modèle sqrt(y)?


    Merci

  4. #4
    Membre chevronné
    Homme Profil pro
    Biostatisticien
    Inscrit en
    Juin 2009
    Messages
    1 206
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Irlande

    Informations professionnelles :
    Activité : Biostatisticien
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Juin 2009
    Messages : 1 206
    Points : 1 868
    Points
    1 868
    Par défaut
    je suppose que tu es passé par une proc reg... Il te manque l'instruction évoquant le nom de la procédure. Ca marche ton plot au seinde la reg?

    pour modéliser la racine carrée et le ln, il faut que tu passes au préalable par une étape data ou tu crée les variables racine et ln comme transformation de la variable réponse. A chaque fois tu dois rééxécuter une nouvelle proc reg avec la nouvelle variable dépendante

  5. #5
    Membre chevronné
    Homme Profil pro
    Biostatisticien
    Inscrit en
    Juin 2009
    Messages
    1 206
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Irlande

    Informations professionnelles :
    Activité : Biostatisticien
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Juin 2009
    Messages : 1 206
    Points : 1 868
    Points
    1 868
    Par défaut
    Par valeurs extrêmes je veux dire des valeurs qui faussent le modèle et qu'on peut dont enlever.
    Comment sais tu qu'elles faussent le modèle? Elles peuvent témoigner de comportement atypiques. Il est important de bien réfléchir avant de retirer de l'information

  6. #6
    Membre régulier Avatar de thtghgh
    Homme Profil pro
    Inscrit en
    Mai 2009
    Messages
    221
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Secteur : Finance

    Informations forums :
    Inscription : Mai 2009
    Messages : 221
    Points : 88
    Points
    88
    Par défaut
    En étudiant justement la distance de Cook et les résidus studentisés on peut etre sur que la ou les valeurs faussent le modèle non?

  7. #7
    Membre chevronné
    Homme Profil pro
    Biostatisticien
    Inscrit en
    Juin 2009
    Messages
    1 206
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Irlande

    Informations professionnelles :
    Activité : Biostatisticien
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Juin 2009
    Messages : 1 206
    Points : 1 868
    Points
    1 868
    Par défaut
    La distance de cook est une mesure de l'influence d'une observation, calculée en se basant sur la variation de l'estimation des paramètres si cette observation était retirée.

    Le residu studentisé est un quotient résultant d'une division d'un résidu par une estimation de sa déviation standard.

    Ils fournissent des indications sur les individus extrèmes mais ne faussent pas le modèle en soi. Le tout est de savoir pourquoi ces mesures sont sensiblement différentes, est-ce une erreur de mesure? Une erreur de saisie? des comportements atypiques?

  8. #8
    Membre régulier Avatar de thtghgh
    Homme Profil pro
    Inscrit en
    Mai 2009
    Messages
    221
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Secteur : Finance

    Informations forums :
    Inscription : Mai 2009
    Messages : 221
    Points : 88
    Points
    88
    Par défaut
    D'accord merci.

    Pouvez vous m'indiquer comment faire de meme mais avec le modèle racine(y) ?

    Merci

  9. #9
    Membre chevronné
    Homme Profil pro
    Biostatisticien
    Inscrit en
    Juin 2009
    Messages
    1 206
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Irlande

    Informations professionnelles :
    Activité : Biostatisticien
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Juin 2009
    Messages : 1 206
    Points : 1 868
    Points
    1 868
    Par défaut
    cf au dessus...

  10. #10
    Membre régulier Avatar de thtghgh
    Homme Profil pro
    Inscrit en
    Mai 2009
    Messages
    221
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Secteur : Finance

    Informations forums :
    Inscription : Mai 2009
    Messages : 221
    Points : 88
    Points
    88
    Par défaut
    Oui j'ai fait un proc reg.

    Merci pour ta réponse je vais essayer

  11. #11
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Novembre 2010
    Messages
    1
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2010
    Messages : 1
    Points : 1
    Points
    1
    Par défaut Procédure de selection
    Bonjour,

    J'utilise également le logiciel SAS pour mes TP de stats. Concernant la procédure de selection du "meilleur modele lineaire" possible, J'ai fait une selection selon le R^2 , le R^2 ajusté, le AIC, le CP.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    /p r PRESS influence selection=ADJRSQ AIC CP;
    j'obtiens de beaux tableaux de valeurs, mais c'est pour les analyser que j'ai un problème. Si je suis ce qu'on a marqué dans notre cours, je sélectionnerais mon modèle en disant qu'il faut:
    1. R^2 le plus proche de 1
    2. R^2 ajusté le plus grand
    3. AIC petit


    En pratique comme je peux faire?

    "Aux échecs, Il existe deux types de sacrifices: Ceux qui sont corrects et les miens"

  12. #12
    Rédacteur

    Homme Profil pro
    SAS ALLIANCE SILVER. Consultant et formateur SAS et Cognos.
    Inscrit en
    Avril 2009
    Messages
    2 497
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 51
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : SAS ALLIANCE SILVER. Consultant et formateur SAS et Cognos.
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2009
    Messages : 2 497
    Points : 6 064
    Points
    6 064
    Par défaut
    revoir
    - dans quel cadre le R² est robuste (p/r au nombre d'obs, etc...)
    - dans quel cadre l'AIC est robuste
    - dans quel cadre il vaut mieux un R² qu'un AIC

    Choisir le meilleur modèle selon les deux critères et regarder ce qu'apporte l'un plus que l'autre. Parfois, c'est le même.

Discussions similaires

  1. regression non linéaire
    Par romainmill dans le forum Calcul scientifique
    Réponses: 24
    Dernier message: 11/03/2014, 10h54
  2. regression non linéaire
    Par thtghgh dans le forum Mathématiques
    Réponses: 8
    Dernier message: 16/09/2011, 15h49
  3. Regression non linéaire
    Par sfiliste dans le forum Mathématiques
    Réponses: 28
    Dernier message: 28/09/2010, 13h17
  4. Regression non linéaire
    Par DooX4EvEr dans le forum MATLAB
    Réponses: 0
    Dernier message: 11/08/2010, 14h01
  5. Loi de King - Regression non linéaire
    Par damienw dans le forum Mathématiques
    Réponses: 6
    Dernier message: 14/05/2008, 22h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo