IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

  1. #1
    Community Manager

    Avatar de Malick
    Homme Profil pro
    Community Manager
    Inscrit en
    Juillet 2012
    Messages
    9 234
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Sénégal

    Informations professionnelles :
    Activité : Community Manager
    Secteur : Conseil

    Informations forums :
    Inscription : Juillet 2012
    Messages : 9 234
    Points : 85 327
    Points
    85 327
    Billets dans le blog
    15
    Par défaut Apprendre à travailler avec HBase - « Faire du NoSQL c’est juste faire des choix intelligents »
    Chers membres du club,

    J'ai le plaisir de vous présenter ce tutoriel de Juvénal CHOKOGOUE :


    Avec toute la volumétrie des données dont on dispose aujourd’hui et toutes leurs caractéristiques, c'est impossible de penser « Gestion de données » tel qu'on l'a fait dans le passé, c'est-à-dire centraliser le stockage des données sur un serveur et centraliser le traitement de ces données sur un SGBDR. Dans l’ère du Big Data, l’approche appropriée consiste à distribuer le stockage des données et à paralléliser leur traitement sur les nœuds d’un cluster d’ordinateurs.

    Les moteurs de bases de données relationnelles ne sont pas capables d’assurer la cohérence des données sur plusieurs nœuds d’un cluster. Leur capacité de distribution maximale est estimée à cinq nœuds, ce qui est largement insuffisant pour répondre aux exigences de volumétrie des données. Pour dépasser ces limites, de nouveaux SGBD dit "NoSQL" ont vu le jour. La particularité de ceux-ci est qu’ils n'imposent pas de structure particulière aux données, ils relâchent les contraintes qui empêchent les SGBDR de distribuer le stockage des données et sont linéairement scalables. HBase fait partie de cette catégorie de SGBD. Plus précisément, HBase fait partie de la catégorie de SGBD orientéscolonne, et est l’un des tous premiers SGBD NoSQL à large échelle mis sur pied. Créé en fin d'année 2006 par Chad Walters et Jim Kellerman, HBase a rejoint l'écosystème Hadoop en octobre 2007 et en juin 2010, il est devenu un projet prioritaire de la fondation Apache. Lire la suite du tutoriel....
    Bonne lecture

    Retrouvez les meilleurs cours et tutoriels NoSQL
    Retrouvez les meilleurs cours et tutoriels pour apprendre Big Data

  2. #2
    Membre habitué
    Profil pro
    Inscrit en
    Mai 2004
    Messages
    168
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2004
    Messages : 168
    Points : 140
    Points
    140
    Par défaut
    Merci pour ce tutoriel, j'y ai beaucoup découvert.
    J'ai une question concernant la cohérence des données. Une colonne doit-elle appartenir qu'à une famille de colonnes ?
    A la lecture de l'article, j'aurais dis que non vu qu'on souhaite une redondance des données pour un traitement plus rapide.

    Mais si ce n'est pas le cas, la colonne va être dupliquée un certain nombre de fois.
    Qu'est-ce qui se charge de répliquer la mise à jour d'une cellule appartenant à cette colonne dans toutes les famille qui la référence ?

  3. #3
    Membre éprouvé

    Homme Profil pro
    Développeur décisionnel
    Inscrit en
    Novembre 2012
    Messages
    28
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur décisionnel
    Secteur : Industrie

    Informations forums :
    Inscription : Novembre 2012
    Messages : 28
    Points : 969
    Points
    969
    Par défaut HBase n'est pas un SGBDR
    Bonjour @Drannor,

    j'espère que tu vas bien et je te remercie pour ton commentaire.

    Théoriquement, une colonne ne devrait appartenir qu'à une seule famille de colonnes. Mais rien ne t'empêche de la dupliquer dans plusieurs familles. HBase est très différent d'un SGBDR classique. Sa priorité ce n'est pas la cohérence [ACID]comme dans un SGBDR, mais le requêtage de gros volumes de données en un temps de latence le plus faible possible. Même si vous veniez à l'imposer, HBase ne vérifie pas le respect des contraintes d'intégrité reférentielle et sémantiques que vous auriez appliqué sur votre modèle. Ce qui fait que OUI, vous pouvez redonder ou utiliser la même colonne dans plusieurs familles différentes.

    La redondance ne se fait pas sur les colonnes ou sur les cellules, mais sur les familles entières de colonnes. Les données des colonnes de chaque famille (prises ensembles) sont partitionnées horizontalement et persistées sur le HDFS sous forme de HFiles. Ce sont ces HFiles qui sont redondés et distribués.

    J'espère que celà répond à ta question

    Si tu as d'autres interrogations, n'hésites pas.

    Cordialement,

    Juvenal JVC

  4. #4
    Nouveau Candidat au Club
    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Juin 2021
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49
    Localisation : Belgique

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Juin 2021
    Messages : 1
    Points : 1
    Points
    1
    Par défaut
    Merci pour ce tutoriel. A ma première compréhension d'Hbase, je vois un des avantages est d'avoir un système de versioning directement intégré à la solution. J'ai vu qu'avec le get, il est possible d'avoir une version antérieure d'une valeur et le TimestampsFilter permet même d'obtenir toutes les versions entre 2 dates. Toutefois, est-ce qu'il est facilement possible de remonter dans le temps? C'était de présenter l'état d'une table telle qu'elle était à un instant T? C'est à dire ignorer les insert/update postérieur à cette date et de réintégrer les valeurs qui ont été effacées. Je suppose que c'est plus compliqué se la structure de la table a été altérée mais sinon cela doit être théoriquement possible, non? Néanmoins, je ne vois pas à première vue de fonction native pour cela...

  5. #5
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 939
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 939
    Points : 51 774
    Points
    51 774
    Billets dans le blog
    6
    Par défaut
    Cela est devenu le standard dans la version 2015 de la norme SQL avec la notion de tables temporelles...
    À lire : http://mssqlserver.fr/wp-content/upl...mmentaires.pdf
    Et il existe des opérateurs spécialisés afin de remonter dans le temps à un point précis ou bien dans une période...
    Cela est intégré à SQL Server depuis la version 2017 par exemple.

    A +

Discussions similaires

  1. Comment faire pour travailler avec ce genre d'image
    Par lahcenlahcen dans le forum VB.NET
    Réponses: 4
    Dernier message: 15/05/2012, 16h42
  2. Réponses: 2
    Dernier message: 27/10/2008, 14h49

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo