IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Conception/Modélisation Discussion :

Datawarehouse (entrepôt de données) et base de données multidimensionnelles / OLAP


Sujet :

Conception/Modélisation

  1. #1
    Futur Membre du Club
    Inscrit en
    Février 2011
    Messages
    2
    Détails du profil
    Informations forums :
    Inscription : Février 2011
    Messages : 2
    Points : 5
    Points
    5
    Par défaut Datawarehouse (entrepôt de données) et base de données multidimensionnelles / OLAP
    Bonjour,
    Je suis débutant j'aimerai bien savoir la différence entre datawarehowse (DWH), base de données multidimensionnelles et OLAP et si à partir de DWH on peut avoir une base multidim et comment.
    j'ai lus pas mal de doc mais on dit comme quoi la conception de DWH se fait avec un modèle étoile et je trouve la même chose pour une base multidimensionnelles (faite avec un modèle étoile le même que le DWH) puis on parle des cube pour les base multidimensionnelles. Est ce que ça veut dir dans une base multidimensionnelles on stock le résultats des opérations d'agrégation sur les données de DWH ? .

    MERCI BEAUCOUP PAR AVANCE

  2. #2
    Expert confirmé
    Avatar de doc malkovich
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2008
    Messages
    1 884
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence

    Informations forums :
    Inscription : Juillet 2008
    Messages : 1 884
    Points : 4 285
    Points
    4 285
    Billets dans le blog
    1
    Par défaut
    Bonjour,
    Le modèle en étoile est une méthode de conception qui permet de séparer les faits ( mesures ) et les dimensions ( axes d'analyse, typologie ). Dans un DWH sur une base de données classique on aura donc une table centrale ( les faits ) avec les tables de dimension autour. Cela permet un requêtage simple et performant, mais avec des tables à volumétrie importante il vaut mieux se tourner vers des bases MOLAP ou multidim comme tu dis, où le temps de réponse est instantané. Il s'agit dans ces bases de stocker toutes les possibilités d'agrégation possibles comme tu le pressentais.

    Voilà, en gros
    Après on peut aller dans le détail mais ça risque d'être plus long

  3. #3
    Membre éclairé
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Mai 2009
    Messages
    529
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Consultant en Business Intelligence

    Informations forums :
    Inscription : Mai 2009
    Messages : 529
    Points : 836
    Points
    836
    Par défaut
    Salut,

    La confusion est en effet aisée car une base multidimensionnelle est avant tout un concept, pas une technologie. Par exemple comme le souligne doc, un (datawarehouse) modélisé en étoile / flocon est une base multidimensionnelle, même si il est implémenté et requêté sous MySQL... On peut en plus utiliser en aval un SGBD-M mais c'est autre chose.

    Vient donc la question du requêtage OLAP sur cette base.:

    1-via les SGBD-R (relationnels): teradata, oracle, sqlserver, db2, sybase, etc. On parle alors d'outils R-OLAP, on requête en général directement sur le DWH: Microstrategy (hybride), Business Objects, Cognos etc sont utilisés pour produire les rapports. Le principal inconvénient de cette architecture est de nécessiter une forte expertise et des charges conséquentes de tuning lors de l'alimentation des données (principalement dénormalisations, tables d'aggrégats précalculées, partitionnement, indexation, création de datamarts intermédiaires, etc).

    2- via les SGBD-M (Multidimensionnels stockés):Essbase, Analysis Services, Oracle express, etc. Basés principalement sur une technologies de blocs "dense" indexés, du point de vue utilisateur ils précalculent et stockent à partir du DWH tous les aggrégats et indicateurs possibles pour produire des résultats instantanés, et une navigation d'un confort incomparable. Les inconvénients sont une mauvaise résistance aux très fortes volumétries, et surtout le fait de devoir prédéfinir les axes de calculs, ce qui est gênant pour les requêtes adhoc sur des entrepôts contenant parfois plus d'un millier de tables et des dizaines de milliers de rubriques.

    3-via les SGBD-V (verticaux ou vectoriels): Sybase IQ, Infobright, Qlikview, solutions "All memory" diverses. En gros ils reprennent les qualités des SGBD-R et SGBD-M en gommant les défauts, assurément l'avenir de la BI.

  4. #4
    Membre régulier
    Homme Profil pro
    Certifié Oracle Essbase/Planning
    Inscrit en
    Juin 2002
    Messages
    42
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Hauts de Seine (Île de France)

    Informations professionnelles :
    Activité : Certifié Oracle Essbase/Planning

    Informations forums :
    Inscription : Juin 2002
    Messages : 42
    Points : 117
    Points
    117
    Par défaut
    Un cube (comme Essbase) gère naturellement les stockages cartésiens sans jointures, puisqu'il ne contient pas de tables, mais des blocs de données dans un cadre matriciel multidimensionnel.

    Par contre, une requête qui génère un produit cartésien est un vrai problème pour les bases de données relationnelles qui peut faire tomber le serveur

    On peut toujours bricoler une base de données relationnelle (ROLAP) pour analyser les données mais elle n'est pas faite pour. La redondance des informations est ce qu'il faut éviter dans les tables, alors qu'en analyse OLAP, c'est une nécessité. Une requête sql décisionnelle peut prendre énormément de temps même avec un dataware optimisé. Les cubes fournissent des données pré-agrégées, pré-calculées et sont naturellement optimisés pour l'analyse OLAP.

    Donc clairement :
    => OLTP pour la gestion des données avec une gestion optimisée des transactions (insert, update, delete, commit, ...) et des données unitaires (factures, commandes, ...)

    => OLAP pour l'analyse des données avec une gestion optimisée de l'analyse et des données agrégées, calculées, stockées (chiffre d'affaire, moyenne, ...)

    Voilà 2 mondes différents. L'OLTP étant le plus étudié dans les écoles (cf dans le cours de base de données : la 3ème forme normale de la modélisation relationnelle normalisée...)

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Base de données sans base de données
    Par Zenklys dans le forum PHP & Base de données
    Réponses: 8
    Dernier message: 15/09/2008, 13h13
  2. Réponses: 2
    Dernier message: 08/06/2006, 20h49
  3. [C#]bases de données et base des registres
    Par fafa139 dans le forum Windows Forms
    Réponses: 2
    Dernier message: 09/05/2006, 16h40
  4. methodologie pour Supprimer données dans base de données
    Par elkhy dans le forum Décisions SGBD
    Réponses: 1
    Dernier message: 26/04/2006, 18h30
  5. insertion de données dans Base de données Oracle 9
    Par hottnikks_79 dans le forum SQL
    Réponses: 2
    Dernier message: 16/03/2006, 00h07

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo