IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Big Data Discussion :

Traitement de 100 M de données


Sujet :

Big Data

  1. #1
    Membre habitué
    Homme Profil pro
    ray man
    Inscrit en
    Juillet 2009
    Messages
    274
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations professionnelles :
    Activité : ray man

    Informations forums :
    Inscription : Juillet 2009
    Messages : 274
    Points : 130
    Points
    130
    Par défaut Traitement de 100 M de données
    Bonjour ,

    Voila ma petite histoire avec une base de données qui contient plus de 100 M de data dans un seul table

    au début on n'a la stocké dans mysql mais sa été difficile de faire de recherche (PHP,cakephp) de dedans sa prend une heure pour cherché un mots dans un champs qui contient du texte

    après on n'a migré vers mongodb mais on n'a eu le même problème de recherche sa prend 40 min pour chercher un mot dans un champs qui contient du texte

    nous sommes entrain de pensé de passer vers elasticshearch pour affaiblire le temps de recherche est ce que c'est une bonne approche ou est ce que sa existe un meilleur outils pour faire la recherche au moins de 3 min sachant que mon serveur dédié contient juste sa Intel Xeon W3520 4 c / 8 t 2.66 GHz+ RAM 32 Go ECC sous debien et ispconfig3

    Merci
    Si vous ne pouvez expliquer un concept à un enfant de six ans, c'est que vous ne le comprenez pas complètement.
    Le français n'est pas ma langue maternelle, désolé pour les éventuelles fautes.
    http://icoz.ma
    http://icozstore.com

  2. #2
    Membre éclairé Avatar de bstevy
    Homme Profil pro
    Solutions Architect
    Inscrit en
    Mai 2009
    Messages
    552
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : Japon

    Informations professionnelles :
    Activité : Solutions Architect
    Secteur : Finance

    Informations forums :
    Inscription : Mai 2009
    Messages : 552
    Points : 870
    Points
    870
    Par défaut
    100M, c'est 100 000 000 de lignes dans une table c'est ca ?
    et vous faite de la recherche de "mot" au sein d'un champs texte ?

    Vous être sur que c'est pas plutôt une erreur de modélisation ?
    Car c'est un peu curieux comme recherche récurente, donc pensez peut-être à revoir votre modèle avant de mettre en place une usine à gaz.

    Pourquoi ne pas essayer de résoudre votre problème sur le forum SQL ?

  3. #3
    Membre habitué
    Homme Profil pro
    ray man
    Inscrit en
    Juillet 2009
    Messages
    274
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations professionnelles :
    Activité : ray man

    Informations forums :
    Inscription : Juillet 2009
    Messages : 274
    Points : 130
    Points
    130
    Par défaut
    Merci pour votre réponse

    Non ce n'ai pas un défaut de conception

    c'est juste que je récupère des commentaires des réseaux sociaux et je met le tous dans une seul table commentaire afin de facilité la connexion et la recherche

    est que sa n'existe pas une solution qui me permet de recherché dans un temps réduis 3 min max
    Si vous ne pouvez expliquer un concept à un enfant de six ans, c'est que vous ne le comprenez pas complètement.
    Le français n'est pas ma langue maternelle, désolé pour les éventuelles fautes.
    http://icoz.ma
    http://icozstore.com

  4. #4
    Membre éclairé Avatar de bstevy
    Homme Profil pro
    Solutions Architect
    Inscrit en
    Mai 2009
    Messages
    552
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : Japon

    Informations professionnelles :
    Activité : Solutions Architect
    Secteur : Finance

    Informations forums :
    Inscription : Mai 2009
    Messages : 552
    Points : 870
    Points
    870
    Par défaut
    Ha, commentaires de réseaux sociaux...

    Donc données non structurées, en grande quantité. Avec demande d'accès rapide

    Alors oui, je valide BIG DATA

    Après, vous avez plusieurs possibilités aussi.

    Vous avez un articles interessant ici proposant des méthodes alternatives à Hadoop, ca vous donnera peut etre d'autres pistes.
    https://www.chrisstucchio.com/blog/2...op_hatred.html

    Après, elasticsearch, ca doit etre bien puisqu'ils veulent l'implémenter dans mon entreprise. Mais je connais pas encore assez.

  5. #5
    Modérateur
    Avatar de escartefigue
    Homme Profil pro
    bourreau
    Inscrit en
    Mars 2010
    Messages
    10 136
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : bourreau
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2010
    Messages : 10 136
    Points : 38 909
    Points
    38 909
    Billets dans le blog
    9
    Par défaut
    Bonjour,

    Quel est le DDL de la table et de ses index ?

  6. #6
    Membre averti
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Mai 2015
    Messages
    107
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2015
    Messages : 107
    Points : 348
    Points
    348
    Par défaut
    Salut,

    Bon choix!

    Par ailleur, tu peux même garder ta base MongoDB et l'indéxer via ElasticSearch.
    Ensuite tu branche sur ES et le tour est joué

  7. #7
    Membre habitué
    Homme Profil pro
    ray man
    Inscrit en
    Juillet 2009
    Messages
    274
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations professionnelles :
    Activité : ray man

    Informations forums :
    Inscription : Juillet 2009
    Messages : 274
    Points : 130
    Points
    130
    Par défaut
    Merci pour vos repenses

    Quel est le DDL de la table et de ses index ?
    Comment je peux trouver sa dans mon mysql je travail avec MYISAM


    @Moctezuma

    Comment je peux couplez avec mongodb est elastic


    est ce que l'utilisation de la technologie hadoop est nécessaire dans mon cas merci
    Si vous ne pouvez expliquer un concept à un enfant de six ans, c'est que vous ne le comprenez pas complètement.
    Le français n'est pas ma langue maternelle, désolé pour les éventuelles fautes.
    http://icoz.ma
    http://icozstore.com

  8. #8
    Membre averti
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Mai 2015
    Messages
    107
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2015
    Messages : 107
    Points : 348
    Points
    348
    Par défaut
    Tu devrais trouver ton bonheur dans cet article : http://blog.viseo-bt.com/indexation-...elasticsearch/

Discussions similaires

  1. optimisation macro de traitement d'un fichier de données
    Par jalinn dans le forum Macros et VBA Excel
    Réponses: 2
    Dernier message: 06/07/2008, 20h00
  2. [MySQL] Case à cocher et traitement avec une base de données
    Par Angelik dans le forum PHP & Base de données
    Réponses: 2
    Dernier message: 21/06/2008, 12h33
  3. Réponses: 9
    Dernier message: 14/09/2007, 15h43
  4. [XML] [EXPAT] traitement d'un flux de donnée xml contenant des \n
    Par firejocker dans le forum Bibliothèques et frameworks
    Réponses: 5
    Dernier message: 23/02/2006, 16h49

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo