IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Décisions SGBD Discussion :

choix d'un SGBD pour une très forte volumétrie


Sujet :

Décisions SGBD

  1. #1
    Membre du Club
    Profil pro
    Inscrit en
    Novembre 2006
    Messages
    67
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2006
    Messages : 67
    Points : 41
    Points
    41
    Par défaut choix d'un SGBD pour une très forte volumétrie
    Bonjour,

    Je travaille sur un projet dans le domaine spatial, dans lequel la problématique principale est la forte volumétrie des données (après estimation, la base de données pourra arriver à atteindre 1 petaoctet!).

    Même si le choix d'Oracle pourrait paraître le plus pertinent, il y a l'inconvénient des prix des licences complètement abusifs.
    Il faut donc étudier la faisabilité d'utiliser un SGBD Open-Source comme PostgreSQL ou MySQL. L'option "partitioning" et une gestion optimisée des BLOBs semblent nécessaires.

    Quel est votre avis là-dessus? Connaissez-vous des VLDB (Very Large Data Bases) dans le marché qui soient gérées avec PostgreSQL ou MySQL?

    Merci pour votre rétour d'expérience,
    Cordialement,
    Fgalves

  2. #2
    Modérateur
    Avatar de al1_24
    Homme Profil pro
    Retraité
    Inscrit en
    Mai 2002
    Messages
    9 111
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 63
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Retraité
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2002
    Messages : 9 111
    Points : 28 459
    Points
    28 459
    Par défaut
    Il me semble que GreenPlum est architecturé autour de moteurs PostgreSQL et annonce des couts de licence moindres qu'Oracle.
    Toutefois, arrivé à ce niveau de volume de données, c'est surtout le cout du matériel qui est à prendre en compte, plus que celui des licences

  3. #3
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 915
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 915
    Points : 51 691
    Points
    51 691
    Billets dans le blog
    6
    Par défaut
    Compte tenu de la faiblesse de la gestion des espaces de stockage de ces deux SGBDR libres, je préconiserait de ne surtout pas les utiliser pour une telle volumétrie....

    Reste les choix suivants que l'on trouve pour les VLDB : Oracle, IBM DB2 et MS SQL Server (pour l'OLTP) et Teradata pour les OLAP.

    A +

  4. #4
    Membre éprouvé Avatar de Jester
    Inscrit en
    Septembre 2003
    Messages
    813
    Détails du profil
    Informations forums :
    Inscription : Septembre 2003
    Messages : 813
    Points : 1 057
    Points
    1 057
    Par défaut
    C'est clair que MySQL sera dans les choux, il y a néanmoins des travaux dans le domaine astronomique. Peut-être utiliser un moteur spécial pour le stockage des blob. Ça ne résoudra pas le problème que c'est trop gros néanmoins je pense.

    La seule solution je pense, c'est de faire du sharding. Avec toute la complexité qui va avec.

  5. #5
    Membre du Club
    Profil pro
    Inscrit en
    Novembre 2006
    Messages
    67
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2006
    Messages : 67
    Points : 41
    Points
    41
    Par défaut
    Merci à tous pour les réponses!

    SQLpro, pour mieux comprendre la problématique de la gestion des espaces de stockage, aurais-tu en tête un article pouvant m'éclaircir sur ce sujet?

    Jester, existe-t-il l'équivalent du sharding pour PostgreSQL?

    Merci par avance,
    Cdt,
    Fgalves

  6. #6
    Membre éprouvé Avatar de Jester
    Inscrit en
    Septembre 2003
    Messages
    813
    Détails du profil
    Informations forums :
    Inscription : Septembre 2003
    Messages : 813
    Points : 1 057
    Points
    1 057
    Par défaut
    Je pensais au niveau applicatif (d'où énormément de complexité). Après il existe des outils et fonctionnalité qui peuvent aider, mais ça demande de bien réfléchir et ça ne sortira jamais la solution directement.

  7. #7
    Modérateur
    Avatar de al1_24
    Homme Profil pro
    Retraité
    Inscrit en
    Mai 2002
    Messages
    9 111
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 63
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Retraité
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2002
    Messages : 9 111
    Points : 28 459
    Points
    28 459
    Par défaut
    Citation Envoyé par SQLpro Voir le message
    Compte tenu de la faiblesse de la gestion des espaces de stockage de ces deux SGBDR libres, je préconiserait de ne surtout pas les utiliser pour une telle volumétrie....
    eBay utilise une base GreenPlum de 6.5 Po (96 noeuds PostgreSQL), apparemment sans gros problème

  8. #8
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 915
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 915
    Points : 51 691
    Points
    51 691
    Billets dans le blog
    6
    Par défaut
    Oui, mais :
    1) l'info est découplée et la plupart des données sont des archives
    2) comme beaucoup de site web, c'est 98% de lecture pour 2% de MAJ...

    A +

  9. #9
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 915
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 915
    Points : 51 691
    Points
    51 691
    Billets dans le blog
    6
    Par défaut
    Citation Envoyé par fgalves Voir le message
    SQLpro, pour mieux comprendre la problématique de la gestion des espaces de stockage, aurais-tu en tête un article pouvant m'éclaircir sur ce sujet?
    Dans mon blog :
    http://blog.developpez.com/sqlpro/p5...fichiers-et-t/

    A +

  10. #10
    Membre éprouvé Avatar de Jester
    Inscrit en
    Septembre 2003
    Messages
    813
    Détails du profil
    Informations forums :
    Inscription : Septembre 2003
    Messages : 813
    Points : 1 057
    Points
    1 057
    Par défaut
    Sur le greenplum de eBay
    Metrics on eBay’s Greenplum data warehouse (or, if you like, data mart) include:

    * 6 1/2 petabytes of user data
    * 17 trillion records
    * 150 billion new records/day, which seems to suggest an ingest rate well over 50 terabytes/day
    * 96 nodes
    * 200 MB/node/sec of I/O (that’s the order of magnitude difference that triggered my post on disk drives)
    * 4.5 petabytes of storage
    * 70% compression
    * A small number of concurrent users
    http://www.dbms2.com/2009/04/30/ebay...ta-warehouses/

    InnoDB permet me semble de faire des tablespace de taille prévue comme l'indique votre article. Pas sur que ça apporte à MySQL par contre. Reste que la gestion des tablespace est très embryonnaire.

Discussions similaires

  1. Choix SGBD pour une compagnie d'assurance
    Par freestyler dans le forum Décisions SGBD
    Réponses: 32
    Dernier message: 14/01/2016, 16h31
  2. Réponses: 0
    Dernier message: 03/07/2014, 15h46
  3. SGBD pour une application ?
    Par shinkyo dans le forum Décisions SGBD
    Réponses: 2
    Dernier message: 08/05/2006, 18h25
  4. Choix d'un langage pour une application de gestion
    Par mister3957 dans le forum Langages de programmation
    Réponses: 6
    Dernier message: 18/02/2006, 04h39
  5. le meilleur SGBD pour une application simple
    Par nousss77 dans le forum Décisions SGBD
    Réponses: 3
    Dernier message: 23/09/2005, 07h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo