IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Alimentation Discussion :

[Data Warehouse] Datamart, cube : différence


Sujet :

Alimentation

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    69
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Janvier 2007
    Messages : 69
    Par défaut [Data Warehouse] Datamart, cube : différence
    Bonjour à tous

    Je me lance dans le domaine de la Business Intelligence et veux mettre au point un petit datawarehouse pour analyser les ventes d'un petit magasin (donc à titre purement didactique pour moi)

    Seulement, après quelques lectures, recherches sur le sujet je me pose des questions.

    Quelles sont les différence entre un datawarehouse, un datamart et un cube?

    Voici ma vision, corrigez moi si je me trompe :

    • Un cube OLAP est une base de données multidimensionnelle. Or une base de données multidimensionnelle est modélisée selon une table des faits et des dimensions s'y rapportant.


    • Un datamart est un petit datawarehouse qui concerne un seul thème. Mais si je veux créer un datawarehouse autour du thème des ventes, est-ce que le datamart est considéré comme datawarehouse? Le datamart est donc aussi une base multidimensionnelle donc une structure en cube?


    • Le datawarehouse se compose d'un ensemble de datamart ou se décompose en un ensemble de datamarts mais est également une structure en cube



    En conclusion pour le moment, ma perception des choses est la suivante

    -> Datawarehouse = ensemble de cubes thématiques (datamart)
    -> datamart = cube OLAP
    -> cube = structure multidimensionnel stockant des données à des fin d'analyse


    Merci pour vos éclaircissements qui me seront indispensables pour continuer ce projet.

    Pmatt

  2. #2
    Modérateur
    Avatar de al1_24
    Homme Profil pro
    Retraité
    Inscrit en
    Mai 2002
    Messages
    9 132
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 64
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Retraité
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2002
    Messages : 9 132
    Par défaut
    Citation Envoyé par Pmatt
    Un cube OLAP est une base de données multidimensionnelle. Or une base de données multidimensionnelle est modélisée selon une table des faits et des dimensions s'y rapportant.
    Dans le cube OLAP, les cellules son précalculées.

    Citation Envoyé par Pmatt
    Un datamart est un petit datawarehouse qui concerne un seul thème. Mais si je veux créer un datawarehouse autour du thème des ventes, est-ce que le datamart est considéré comme datawarehouse? Le datamart est donc aussi une base multidimensionnelle donc une structure en cube?
    Au niveau de l'entrepôt de données, les faits détaillés sont conservés. Dans le datamart, un certain niveau d'agrégation a déjà été effectué et on perd le détail des faits.

    Citation Envoyé par Pmatt
    Le datawarehouse se compose d'un ensemble de datamart ou se décompose en un ensemble de datamarts mais est également une structure en cube
    A strictement parler, l'entrepôt de données ne comporte que les faits détaillés et les hériarchies dimensionnelles. Les cubes sont préparés à partir des données de l'entrepôt.
    Modérateur Langage SQL
    Règles du forum Langage SQL à lire par tous, N'hésitez pas à consulter les cours SQL
    N'oubliez pas le bouton et pensez aux balises
    [code]
    Si une réponse vous a aidé à résoudre votre problème, n'oubliez pas de voter pour elle en cliquant sur
    Aide-toi et le forum t'aidera : Un problème exposé sans mentionner les tentatives de résolution infructueuses peut laisser supposer que le posteur attend qu'on fasse son travail à sa place... et ne donne pas envie d'y répondre.

  3. #3
    Membre éprouvé Avatar de GGGGG
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    149
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 149
    Par défaut
    Citation Envoyé par Pmatt
    -> Datawarehouse = ensemble de cubes thématiques (datamart)
    -> datamart = cube OLAP
    -> cube = structure multidimensionnel stockant des données à des fin d'analyse
    Je me permets malgré mon manque d'expérience de vous répondre.
    Je pense que le cube est complémentaire au Data warehouse et au Datamart.
    C'est pourquoi, je ne pense pas qu'un datamart soit un cube olap mais juste une base relationelle (la meme chose pour l'entrepot de données d'ailleurs).

  4. #4
    Membre confirmé
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    69
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Janvier 2007
    Messages : 69
    Par défaut
    Merci al1_24 et GGGGG pour vos réponses .

    Donc si j'ai bien compris :

    -> Le datawarehouse possède le niveau d'information le plus détaillé
    -> Le datamart possèdes des données agrégées, moins détaillées

    Par contre, que voulez vous dire par cellules précalculées?

    Je vais construire une petite solution décisionnelle avec Analysis Services 2005, de Microsoft.

    GGGGG, lorsque tu dis qu'un datamart et datawarehouse sont des bases relationelles, je suppose que tu veux parler de ROLAP ?

    Donc dans mon projet en fait il serait plus approprié de parler de Cube créé par Analysis Services qui se baserait sur des vues construites par l'utilisateur mais au fond, l'information du cube serait directement tirée de la base de données relationnelle OLTP.

    Bref comme vous le voyez, tout n'est pas encore clair.

    Avez vous de bons liens ou livres à me conseiller sur le sujet?

    Merci pour votre patience et la pertinence de vos réponses

  5. #5
    Membre éprouvé Avatar de GGGGG
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    149
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 149
    Par défaut
    Alors, il semble que les bases multidimensionnelles impliquent un nombre limité de ligne contrairement au base relationnelle qui peuvent en avoir une infinité ce qui justifirait que les DW sont relationels

    Tu trouveras quelques infos sur ce site je pense : http://www.nodesway.com/business-int...telligence.htm

  6. #6
    Membre expérimenté

    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2006
    Messages
    224
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Morbihan (Bretagne)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Conseil

    Informations forums :
    Inscription : Juillet 2006
    Messages : 224
    Par défaut
    houlala ... ça part un peu dans tous les sens ...


    Un datawarehouse, ou entrepôt de données :

    Voir wikipedia

    Un datamart :

    Re-voir Wikipedia

    Un cube Olap ou Hypercube :

    Encore un coup sur Wikipedia


    Désolé de te renvoyer vers ces articles, mais ils me semblent très clair et je pense, répondent à tes questions.

    Pour préciser un peu sur les cube, le concept d'OLAP est un concept "générique" qui peut être décliné différement selon les éditeurs de solutions décisionnelles.

    Pour Analysis Services de microsoft, on est dans le R-OLAP : Les données sont stockées dans une base de données relationnelle.

    Chez cognos, ils font plus dans le M-OLAP (je ne sais plus ce que veux dire le M)... le principe est que les données sont extraites de la base pour générer un fichier (le cube)

    L'avantage du R-OLAP, c'est qu'une fois que la base est à jour, le cube est à jour ... L'avantage du M Olap, c'est une navigation plus rapide car les données sont précalculées lors de la génération du cube.

  7. #7
    Membre éprouvé Avatar de GGGGG
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    149
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 149
    Par défaut
    Oula, j'ai raconté des conneries ^^

    Merci brunolf /me est un peu moins con

    Il y a aussi le H-OLAP pour Hybride entre le R de Relationnel et le M de Multidimensionnel. Le reste de l'explication sur le wiki

  8. #8
    Membre confirmé
    Profil pro
    Inscrit en
    Mars 2007
    Messages
    42
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2007
    Messages : 42
    Par défaut
    Le M de M-OLAP veut dire multidimensionnelle
    Le M-OLAP est un OLAP optimisé pour l'analyse multidimensionnelle.
    C'est une forme d'hypercube multidimensionnel qui permet de représenter les données sous la forme d'un croisement de n dimensions, ces dimensions pouvant être plus ou moins denses, caractérisant ainsi la densité ou sparsité du cube.

    Il existe également le H-OLAP, qui est un Hybride entre le M-OLAP et le R-OLAP.
    La structure multidimensionnelle d'un hypercube est utilisée pour les données agrégées. Lorsque l'accès à un niveau de détail élémentaire plus fin est nécessaire, des tables relationnelles classiques sont utilisées : c'est le mécanisme du drill through.

    Sinon, effectivement le DataWareHouse contient les données de détail mais aussi l'historique des données (le versionning en quelque sorte).
    Le DataMart est lui, une sorte de vue sur un métier, une période, .... à un niveau soit de détail ou/et soit aggrégé. On utilisera un DM au niveau détail pour faire tourner des requêtes ou des cubes plus rapidement. En règle général, on profite du DM pour faire les 2 (vue métier avec données aggrégées par exemple).

    Penser aussi au passage de vos données opérationnelles vers votre DWH, en utilisant pe-être un ODS (Operational Data Store).
    C'est une base de données conçue pour centraliser les données issues de sources hétérogènes afin de faciliter leur intégration dans un DataWareHouse. L'intégration de ces données implique souvent une purge des informations redondantes. Un ODS est généralement destiné à contenir des données quotidiennes (type évènements du jour) de niveau fin.

    Bon courage
    Thierry Babulle
    tbabulle@objectif-informatique.fr

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. différence entre BD et data warehouse
    Par pmyriam dans le forum Décisions SGBD
    Réponses: 6
    Dernier message: 17/04/2010, 14h36
  2. Réponses: 7
    Dernier message: 11/04/2006, 19h09
  3. data warehouse builder
    Par elmounia dans le forum Oracle
    Réponses: 1
    Dernier message: 23/10/2005, 18h04
  4. [data warehouse]des liens utiles?
    Par PSYcoZZ dans le forum Décisions SGBD
    Réponses: 2
    Dernier message: 19/06/2005, 08h53
  5. Data warehouse?
    Par donny dans le forum Décisions SGBD
    Réponses: 2
    Dernier message: 16/03/2005, 17h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo