IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Décisions SGBD Discussion :

SGBD pour un data warehouse


Sujet :

Décisions SGBD

  1. #1
    Membre éprouvé Avatar de Jester
    Inscrit en
    Septembre 2003
    Messages
    813
    Détails du profil
    Informations forums :
    Inscription : Septembre 2003
    Messages : 813
    Points : 1 057
    Points
    1 057
    Par défaut SGBD pour un data warehouse
    Voilà, je voulais savoir si vous connaissiez des SGBD qui pourraient convenir pour des data warehouse avec orientation data mining.

    J'ai déjà trouvé le cadrant Gartner de 2008


    Les fonctionnalités qui me semble les plus importantes sont :
    • stockage en colonne
    • parallélisation des requêtes (qu'une requêtre SQL utilise plusieurs coeurs d'exécutions)
    • partitionnement
    • procédures stockées


    Pour l'instant j'ai trouvé infobright qui n'a juste pas la parallélisation. Je ne connais aucun SGBD gratuit (et seulement Teradata chez les payants) qui dispose de cette fonctionnalité.

  2. #2
    Membre expérimenté Avatar de scheu
    Inscrit en
    Juin 2007
    Messages
    1 506
    Détails du profil
    Informations forums :
    Inscription : Juin 2007
    Messages : 1 506
    Points : 1 738
    Points
    1 738
    Par défaut
    Ca dépend quand-même de ta volumétrie, Teradata c'est vraiment pour les très très grosses volumétries comme son nom l'indique

    Même pour quelques Tera octets de données, Oracle a toutes les fonctionnalités et peut tout à fait faire l'affaire. Le plus important pour un Datawarehouse reste néanmoins d'avoir des disques performants, après tu as notamment le parallélisme, le partitionnement, le sous-partitionnement et la compression qui te permettent d'avoir de très bonnes performances avec Oracle

    A mon avis au jour d'aujourd'hui tu ne trouveras pas encore (peut-être dans le future ?) de SGBD gratuit vraiment performant dans l'utilisation de toutes ces fonctionnalités

    Quelle est ta volumétrie exactement ?


    Edit : Postgresql n'est même pas dans la liste des SGBDs ? Je crie au scandale !

  3. #3
    Membre éprouvé Avatar de Jester
    Inscrit en
    Septembre 2003
    Messages
    813
    Détails du profil
    Informations forums :
    Inscription : Septembre 2003
    Messages : 813
    Points : 1 057
    Points
    1 057
    Par défaut
    Là je pensais à moins de 100Go. Pas forcément énorme, mais j'aurais des calculs poussifs à faire dessus sur un PC desktop assez classique.

    Mon objectif est de participer à la KDD cup, les données ne sont pas encore dispo.

    Je ne suis pas limité par le disque, mais par l'absence d'utilisation de l'architecture multicore. Au pire je peux faire des requêtes en parallèle et les fusionner, mais ce serait plus simple évidemment que ce soit une fonctionnalité du SGBD.

  4. #4
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 902
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 902
    Points : 53 143
    Points
    53 143
    Billets dans le blog
    6
    Par défaut
    Les fonctionnalités qui me semble les plus importantes sont :
    * stockage en colonne
    * parallélisation des requêtes (qu'une requêtre SQL utilise plusieurs coeurs d'exécutions)
    * partitionnement
    * procédures stockées
    Dans ce cas SQL Server est tout à fait indiqué, et sera beaucoup moins cher que Terradata !
    Cependant je ne voit pas l'intérêt de partitionner tes données avec seulement 100 Go. Cela commence à devenir intéressant pour des VLDB (plus de 1 To). Ne pas confondre partitionnement et répartition des tables dans différents espaces de stockage.

    A +

  5. #5
    Membre éprouvé Avatar de Jester
    Inscrit en
    Septembre 2003
    Messages
    813
    Détails du profil
    Informations forums :
    Inscription : Septembre 2003
    Messages : 813
    Points : 1 057
    Points
    1 057
    Par défaut
    Répartir les données peut servir dans le cas de lecture séquentielles sur certaines données, c'est du moins ce que je pense.

    Je n'ai pas besoin de différents espace de stockage, les machines que j'ai à disposition étant toutes mono disque ou en RAID.

    Finalement la volumétrie des données est faibles, 1,6Go en fichier texte (15k colonnes et 50k lignes). C'est, de plus, une matrice comportant 90% de zéro et de valeurs nulles, donc en optimisant cela ne prend que 1Go de RAM, donc l'utilisation d'une BD ne me semble pas adéquate.

  6. #6
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 902
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 902
    Points : 53 143
    Points
    53 143
    Billets dans le blog
    6
    Par défaut
    Faites des essais, vous pouvez utiliser SQL Server en démo pendant 180 jours.

    A +

Discussions similaires

  1. [Sujet pour profet fin détudes] Data Warehouse Bancaire
    Par h.daly dans le forum Forum général Business Intelligence
    Réponses: 0
    Dernier message: 29/04/2014, 17h15
  2. Optimisation pour traitement type data warehouse
    Par Bouga74 dans le forum Administration
    Réponses: 11
    Dernier message: 28/11/2013, 16h44
  3. Réponses: 10
    Dernier message: 05/06/2012, 21h50
  4. Conception data warehouse pour des campagnes de publication
    Par hatman dans le forum Conception/Modélisation
    Réponses: 0
    Dernier message: 08/07/2010, 08h33
  5. Mysql comme data warehouse pour le décisionnel
    Par Jester dans le forum Autres outils décisionnels
    Réponses: 1
    Dernier message: 15/04/2008, 14h24

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo