Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

  1. #1
    Community Manager

    Apprendre à travailler avec HBase - « Faire du NoSQL c’est juste faire des choix intelligents »
    Ce message n'a pas pu être affiché car il comporte des erreurs.
    Vous avez envie de contribuer au sein du Club Developpez.com ? Contactez-nous maintenant !
    Vous êtes passionné, vous souhaitez partager vos connaissances en informatique, vous souhaitez faire partie de la rédaction.
    Il suffit de vous porter volontaire et de nous faire part de vos envies de contributions :
    Rédaction d'articles/cours/tutoriels, Traduction, Contribution dans la FAQ, Rédaction de news, interviews et témoignages, Organisation de défis, de débats et de sondages, Relecture technique, Modération, Correction orthographique, etc.
    Vous avez d'autres propositions de contributions à nous faire ? Vous souhaitez en savoir davantage ? N'hésitez pas à nous approcher.

  2. #2
    Membre habitué
    Merci pour ce tutoriel, j'y ai beaucoup découvert.
    J'ai une question concernant la cohérence des données. Une colonne doit-elle appartenir qu'à une famille de colonnes ?
    A la lecture de l'article, j'aurais dis que non vu qu'on souhaite une redondance des données pour un traitement plus rapide.

    Mais si ce n'est pas le cas, la colonne va être dupliquée un certain nombre de fois.
    Qu'est-ce qui se charge de répliquer la mise à jour d'une cellule appartenant à cette colonne dans toutes les famille qui la référence ?

  3. #3
    Membre éprouvé
    HBase n'est pas un SGBDR
    Bonjour @Drannor,

    j'espère que tu vas bien et je te remercie pour ton commentaire.

    Théoriquement, une colonne ne devrait appartenir qu'à une seule famille de colonnes. Mais rien ne t'empêche de la dupliquer dans plusieurs familles. HBase est très différent d'un SGBDR classique. Sa priorité ce n'est pas la cohérence [ACID]comme dans un SGBDR, mais le requêtage de gros volumes de données en un temps de latence le plus faible possible. Même si vous veniez à l'imposer, HBase ne vérifie pas le respect des contraintes d'intégrité reférentielle et sémantiques que vous auriez appliqué sur votre modèle. Ce qui fait que OUI, vous pouvez redonder ou utiliser la même colonne dans plusieurs familles différentes.

    La redondance ne se fait pas sur les colonnes ou sur les cellules, mais sur les familles entières de colonnes. Les données des colonnes de chaque famille (prises ensembles) sont partitionnées horizontalement et persistées sur le HDFS sous forme de HFiles. Ce sont ces HFiles qui sont redondés et distribués.

    J'espère que celà répond à ta question

    Si tu as d'autres interrogations, n'hésites pas.

    Cordialement,

    Juvenal JVC
    Mes cours et tutoriels bases de données et Hadoop : https://juvenal-chokogoue.developpez.com