IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Conception/Modélisation Discussion :

Datawarehouse : table des faits


Sujet :

Conception/Modélisation

  1. #1
    Membre habitué
    Inscrit en
    Mars 2006
    Messages
    408
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 408
    Points : 173
    Points
    173
    Par défaut Datawarehouse : table des faits
    Bjr,

    Nous avons une bdd deja toute faite relative à une application web.
    Nous souhaitons créer un reporting sur les données provenant de cette appli. Mais lors de la création du Datawarehouse, pouvons nous reprendre le schéma identique de la bdd (cad tables et relations) ou sommes nous obligé de créer un datawarehouse avec dimensions et table(s) des faits ???

    Merci pour vos infos.

  2. #2
    Membre expérimenté Avatar de Benoit_Durand
    Profil pro
    Consultant en Business Intelligence Freelance
    Inscrit en
    Mars 2005
    Messages
    861
    Détails du profil
    Informations personnelles :
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence Freelance

    Informations forums :
    Inscription : Mars 2005
    Messages : 861
    Points : 1 308
    Points
    1 308
    Par défaut
    beaucoup d'entreprises font une copie de leur base à j-1 + des index pour faire du reporting. Faire un "bon" Datawarehouse, dénormalisé coûte cher alors qu'une copie brute de la base c'est facile à mettre en place.

    Si c'est pour faire des rapports (Ireport, Birt, BO...) ca marche. Les requêtes risquent d'être complexes. Si tu veux faire des analyse olap par contre ca ne marchera pas.

  3. #3
    Membre habitué
    Inscrit en
    Mars 2006
    Messages
    408
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 408
    Points : 173
    Points
    173
    Par défaut
    Si c'est pour faire des rapports (Ireport, Birt, BO...) ca marche. Les requêtes risquent d'être complexes. Si tu veux faire des analyse olap par contre ca ne marchera pas.
    Oui mais quand on part d'une BDD deja toute faite, et que l'on souhaite créer un bon DW dénormalisé, en modele etoile ou flocon, avec une ou plusieurs tables des faits et dimensions, devrait on recréer un datawarehouse alors ?
    Quels outils devrais je utiliser ? OWB ou un ETL? ou bien simple pl/sql suffira ?

    Merci pour vos réponses.

  4. #4
    Membre éprouvé Avatar de Jester
    Inscrit en
    Septembre 2003
    Messages
    813
    Détails du profil
    Informations forums :
    Inscription : Septembre 2003
    Messages : 813
    Points : 1 057
    Points
    1 057
    Par défaut
    > simple pl/sql suffira

    oui, ça peut. Après c'est juste possiblement plus dur à maintenir.

    Un data warehouse peut être dan la même BD que la BD opérationnelle. Tout est une question de logique, de coût, de volume et d'utilisation.

  5. #5
    Membre expérimenté Avatar de Benoit_Durand
    Profil pro
    Consultant en Business Intelligence Freelance
    Inscrit en
    Mars 2005
    Messages
    861
    Détails du profil
    Informations personnelles :
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence Freelance

    Informations forums :
    Inscription : Mars 2005
    Messages : 861
    Points : 1 308
    Points
    1 308
    Par défaut
    pour compléter la réponse de Jester :
    Apparemment tu as de l'oracle en source et en cible donc OWB peut être un bon compromis entre du pl/sql maison et un etl payant.

    Il est gratuit avec une licence oracle enterprise c'est ça ?

    Je l'avais utilisé pour alimenter un petit DW, je ne sais pas ce qu'il vaut s'il y a de gros volumes.

  6. #6
    Membre habitué
    Inscrit en
    Mars 2006
    Messages
    408
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 408
    Points : 173
    Points
    173
    Par défaut
    beaucoup d'entreprises font une copie de leur base à j-1 + des index pour faire du reporting
    Salut,

    Je voulais savoir ce que tu voulais dire par faire "une copie de leur base à j-1 des index", et pourquoi cela couterait cher de dénormaliser.

    Les requêtes risquent d'être complexes. Si tu veux faire des analyse olap par contre ca ne marchera pas.
    Et pour ce cas-ci, cela dépend des besoins des utilisateurs non ?
    pour faire des analyses de type OLAP, il faut obligatoirement respecté les modeles (étoiles, flocons), je me trompe ?

    Merci pour vos réponses.

  7. #7
    Membre éprouvé Avatar de Jester
    Inscrit en
    Septembre 2003
    Messages
    813
    Détails du profil
    Informations forums :
    Inscription : Septembre 2003
    Messages : 813
    Points : 1 057
    Points
    1 057
    Par défaut
    Citation Envoyé par Go_Ahead Voir le message
    pour faire des analyses de type OLAP, il faut obligatoirement respecté les modeles (étoiles, flocons), je me trompe ?
    Pas forcément, mais dans ce cas tu as juste le plain SQL, ce qui est limité. A moins de refaire un moteur OLAP.

    Tous (?) les outils d'analyse OLAP demandent des tables en étoile pour fonctionner.

  8. #8
    Membre habitué
    Inscrit en
    Mars 2006
    Messages
    408
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 408
    Points : 173
    Points
    173
    Par défaut
    Pas forcément, mais dans ce cas tu as juste le plain SQL, ce qui est limité
    oui limité à moins d'aimer se casser vraiment la tete...

  9. #9
    Membre expérimenté Avatar de Benoit_Durand
    Profil pro
    Consultant en Business Intelligence Freelance
    Inscrit en
    Mars 2005
    Messages
    861
    Détails du profil
    Informations personnelles :
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence Freelance

    Informations forums :
    Inscription : Mars 2005
    Messages : 861
    Points : 1 308
    Points
    1 308
    Par défaut
    Citation Envoyé par Go_Ahead Voir le message
    Salut,

    Je voulais savoir ce que tu voulais dire par faire "une copie de leur base à j-1 des index", et pourquoi cela couterait cher de dénormaliser.
    La nuit tu fais une copie de ta base de prod vers une base rep_prod. Donc dans la nouvelle base tu as les données de la veille. C'est facile à mettre en place (selon la taille de ta base).

    Faire un DW dénormalisé est généralement un projet qui peut s'étaler sur plusieurs mois (étude du besoin des utilisateurs, conception du modèles, des processus d'alimentation, dév, recette...) d'où le coûteux. C'est surtout de la main d'oeuvre.

    Citation Envoyé par Go_Ahead Voir le message
    Et pour ce cas-ci, cela dépend des besoins des utilisateurs non ?
    Oui si les utilisateurs ne voient pas l'utilité de mettre du OLAP en place, cela fait une raison en moins de se casser la tête.
    Pour la complexité des requêtes généralement les analyses se font sur des compartifs sur plusieurs années, mois ... avec des tables qui setrouvent d'un bout à l'autre du modèle de données...

  10. #10
    BiM
    BiM est déconnecté
    Expert éminent sénior
    Avatar de BiM
    Femme Profil pro
    Consultante/Formatrice BIRT & Ingénieur Java/J2EE/GWT
    Inscrit en
    Janvier 2005
    Messages
    7 796
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 38
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Consultante/Formatrice BIRT & Ingénieur Java/J2EE/GWT

    Informations forums :
    Inscription : Janvier 2005
    Messages : 7 796
    Points : 10 765
    Points
    10 765
    Par défaut
    Bonjour,

    Avec mon peu d'expérience, je peux quand même te dire que si tu as des données difficiles à traiter ou extraire ou bien un grand nombre de données. Je te conseille de réfléchir au schéma ?

    Pourquoi ? Le but est d'optimiser à des fins de reporting même si tu ne trouves pas ça à première vue très optimisé au niveau base de données.

    Ca permet notamment de sortir des états ou de faire des tableaux de bord quasi instantanément et la rapidité, c'est très important chez l'utilisateur.

    Après, tout est question de choix.

    Bon courage !

  11. #11
    Membre régulier
    Profil pro
    Inscrit en
    Octobre 2007
    Messages
    92
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 92
    Points : 113
    Points
    113
    Par défaut
    Bonjour,

    La création d'un datawarehouse ne constitue pas un pré-requis.
    Pour interroger les données d'une application, on peut commencer comme le cite Hebus, par travailler sur une simple réplication nocturne de la base de production. Voire directement sur les données d'exploitation si les ressources le permettent.
    L'objectif consiste surtout à valider les prototypes elaborés auprès des utilisateurs, et dans ce cas il y a souvent des modifications, évolutions, retour en arrière, etc... et cette configuration offre cette flexibilité.
    Il est à noter au passage, qu'il existe des produits OLAP qui travaillent directement sur des bases relationnelles normalisées.

    Cette simple copie peut par la suite être améliorée : en général on commence par des procédures de nettoyage, de validation, etc...
    Puis on peut élaborer ensuite des Datamarts modélisés en étoile, comprenant des agrégats permettant de répondre à des problématiques de performance, d'historisation, etc...
    On peut alors connecter l'outil de BI sur la base Datamart qui est dénormalisée et faire évoluer l'application pour plus de performance comme le cite Bim.

  12. #12
    Membre à l'essai
    Profil pro
    Inscrit en
    Octobre 2008
    Messages
    9
    Détails du profil
    Informations personnelles :
    Âge : 54
    Localisation : France, Rhône (Rhône Alpes)

    Informations forums :
    Inscription : Octobre 2008
    Messages : 9
    Points : 11
    Points
    11
    Par défaut Outil Olap sur base normalisé ?
    Paul_S, peux-tu nous donner un exemple d'outil OLAP sur base applicative directe ???
    Tu penses à des outils MOLAP je présume ?
    Thanks

  13. #13
    Membre régulier
    Profil pro
    Inscrit en
    Octobre 2007
    Messages
    92
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 92
    Points : 113
    Points
    113
    Par défaut
    Tu penses à des outils MOLAP je présume ?
    Pouvez-vous préciser votre conception du terme "MOLAP" ?
    Merci

  14. #14
    Membre habitué
    Inscrit en
    Juillet 2008
    Messages
    181
    Détails du profil
    Informations personnelles :
    Âge : 45

    Informations forums :
    Inscription : Juillet 2008
    Messages : 181
    Points : 189
    Points
    189
    Par défaut
    Bonjour,

    Pourquoi ne pas essayer de faire un univers BO sur ta BDD?
    C'est rapide, pas cher (si tu as déjà BO) en plus tu connais déjà la structure.
    Tu peux tester quelques requêtes et puis si ça va pas là tu peux te lancer sur une analyse Datawarehouse.
    C'est ce qu'on appelle du reporting opérationnel et d'ailleurs c'est peut-être ça que tu souhaites.

  15. #15
    Membre habitué
    Inscrit en
    Mars 2006
    Messages
    408
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 408
    Points : 173
    Points
    173
    Par défaut
    dslé pour la réponse... tardive.
    Pourquoi ne pas essayer de faire un univers BO sur ta BDD?
    C'est rapide, pas cher (si tu as déjà BO) en plus tu connais déjà la structure.
    Tu peux tester quelques requêtes et puis si ça va pas là tu peux te lancer sur une analyse Datawarehouse.
    C'est ce qu'on appelle du reporting opérationnel et d'ailleurs c'est peut-être ça que tu souhaites.
    C'est ce que j'ai fais, mais le problème que je trouve avec cette "méthode" c'est qu'elle est en contradiction avec la création d'un datawarehouse (au niveau de la théorie) par exemple, tables des faits, dimensions, modele étoile/flocon... c'est ça qui me gène beaucoup. Si je le fais de cette façon, je ne fais que du simple reporting (avec peut etre du sql avancé) mais pas vraiment de la BI.
    Qu'en pensez-vous ?
    Pour ceux qui ont déjà "construit" un DW à partir d'une BDD existante en prod, comment vous etes vous pris ?
    Je pense que le PL/Sql peut représenter une contrainte dans la mesure où nous avons des données compliquées à extraire.
    Dans ce cas, un ETL comme OWB ou BODI ou encore open source sont ils plus facil à gérer ??

    Merci pour vos réponses et vos informations.

  16. #16
    Membre éclairé
    Avatar de patriceharel
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Mai 2008
    Messages
    466
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Service public

    Informations forums :
    Inscription : Mai 2008
    Messages : 466
    Points : 884
    Points
    884
    Par défaut
    Bonjour,

    Le problème est de savoir si tu as besoin d'un datawarehouse ou pas. Je ne suis pas partisan de l'idée "reporting donc datawarehouse" qui à mon avis constitue une erreur. Les entrepôts de données sont utiles pour :
    - conserver une information "propore" et sur la durée (historique) et donc gérer un gros volume de données
    - que le client est une meilleure compréhension de son nouveau SI (de manière générale, l'entrepôt de données est plus lisible que le schéma UML : les axes d'analyses y sont plus facilement identifiables) en disposant de données orientées métiers.
    - permettre une agrégation des données plus intuitive et performante

    En ce qui concerne l'extraction des données, bien évidemment les ETL sont plus souples d'utilisation que des requêtes ou du SQL procédurale. Ils constituent un gain de temps en développement et sont plus faciles à maintenir que des pages de code (enfin c'est mon avis).

  17. #17
    Membre habitué
    Inscrit en
    Mars 2006
    Messages
    408
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 408
    Points : 173
    Points
    173
    Par défaut
    Le problème est de savoir si tu as besoin d'un datawarehouse ou pas.
    Le besoin existe, dans la mesure où il faut extraire des données de la BDD pour generer des fichiers xls ou pdf. Les outils je les ai également donc pas de probleme de cout.
    j'ai déjà créer le datawarehouse mais en reprenant tel quel le schéma BDD, sans le modifier. Je cherche aussi un bouquin où je pourrai m'inspirer des méthodes à respecter lors de la création/entretien d'un DWH.

  18. #18
    Membre éclairé
    Avatar de patriceharel
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Mai 2008
    Messages
    466
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Service public

    Informations forums :
    Inscription : Mai 2008
    Messages : 466
    Points : 884
    Points
    884
    Par défaut
    Le besoin existe, dans la mesure où il faut extraire des données de la BDD pour generer des fichiers xls ou pdf. Les outils je les ai également donc pas de probleme de cout
    Le problème n'est pas pris dans le bon sens... on pourrait très bien générer des rapports Excel, Word, PDF ou ce que tu veux sans avoir d'entrepôt de données... Ce n'est pas le besoin de rapport qui encourage la mise en place d'un datawarehouse mais les analyses dont on a besoin derrière.

    j'ai déjà créer le datawarehouse mais en reprenant tel quel le schéma BDD, sans le modifier.
    Si tu as repris le schéma de la base opérationnelle tel quel, tu n'as donc pas constitué un entrepôt de données au sens où on l'entend généralement.

    Je cherche aussi un bouquin où je pourrai m'inspirer des méthodes à respecter lors de la création/entretien d'un DWH
    Il en existe des pas mal comme ceux là :
    - The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling de Kimball
    - Le data warehouse : Guide de conduite de projet toujours de Kimball (plus dans la gestion d'un projet et un peu moins dans la modélisation)
    - Data Warehousing Fundamentals: A Comprehensive Guide for IT Professionals de Paulraj Ponniah (assez avancé mais très complet : écrit dans un anglais très technique je trouve)

  19. #19
    Membre habitué
    Inscrit en
    Mars 2006
    Messages
    408
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 408
    Points : 173
    Points
    173
    Par défaut
    Le problème n'est pas pris dans le bon sens... on pourrait très bien générer des rapports Excel, Word, PDF ou ce que tu veux sans avoir d'entrepôt de données... Ce n'est pas le besoin de rapport qui encourage la mise en place d'un datawarehouse mais les analyses dont on a besoin derrière.
    Tout à fait d'accord avec ton propos. Mais quelle alternive a t on pour generer du reporting journalier, tableau de bords assez complexe (en xls, pdf pour la présentation) sans utiliser un outil de reporting qui est spécialisé sur ce theme la. La suite BO ne s'arrete pas uniquement qu'au Designer mais aussi au Reporter....
    Bref si tu as d'autres alternatives, je suis preneur.
    Si tu as repris le schéma de la base opérationnelle tel quel, tu n'as donc pas constitué un entrepôt de données au sens où on l'entend généralement.
    Oui tout à fait, pour créer un entrepot de données, il faudrait examiner les differentes dimensions qui seraient utiles, la ou les tables des faits, utiliser un ETL ou coder en pl/sql pour charger ses données etc...

  20. #20
    Membre régulier
    Profil pro
    Inscrit en
    Octobre 2007
    Messages
    92
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 92
    Points : 113
    Points
    113
    Par défaut
    Bonjour,

    @ Go_Ahead, je vous suggère de prendre un peu de recul par rapport à la théorie. Patrice Harel a raison, vous n'abordez pas le projet par le bon bout : le Datawarehouse n'est pas une finalité, mais un moyen. Sa mise en oeuvre répond à un besoin d'amélioration des performances de votre plateforme décisionnelle.
    De plus, il n'est pas obligatoirement modélisé multidimensionnel (faits + dimensions) si un outil de restitution OLAP n'y est pas associé.
    Donc,
    commencez par faire une copie améliorée de vos données de prod pour créer un "infocentre", faites vos requêtes et vos rapports sur cet infocentre et automatisez son alimentation.

Discussions similaires

  1. Datawarehouse: remplissage de la table des faits
    Par kssillati dans le forum Alimentation
    Réponses: 0
    Dernier message: 04/02/2010, 19h07
  2. [SSIS] [2K5] Vider la table des faits
    Par aqavach dans le forum SSIS
    Réponses: 3
    Dernier message: 06/08/2009, 14h32
  3. [SSIS] [2K5] chargement de la table des faits
    Par aqavach dans le forum SSIS
    Réponses: 8
    Dernier message: 22/06/2009, 09h47
  4. Remplir table des fait
    Par amiraprincesse dans le forum Alimentation
    Réponses: 4
    Dernier message: 16/05/2009, 22h13
  5. [Datawarehouse] Historisation des fait
    Par bashar99 dans le forum Conception/Modélisation
    Réponses: 4
    Dernier message: 26/02/2008, 15h49

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo