Tutoriel sur un retour d'expérience sur la mise en œuvre du BigData chez PagesJaunes.fr
La société Soat, société d'ingénierie et de conseil en informatique vous propose un article sur un retour d'expérience sur la mise en œuvre du BigData chez PagesJaunes.fr présenté lors de Devoxx France 2014
http://soat.developpez.com/tutoriels...-devoxxfr2014/
Vous pouvez profiter de ce message pour partager vos commentaires.
Mickael
Mes constats sur les articles BigData.
Bonjour,
J'ai lu l'article avec beaucoup d'attention car les initiatives BigData m’intéressent beaucoup.
J'apporte ici quelques remarques d'abord sur la forme.
1) Dans le paragraphe 1, le terme "ADN" peut être mis sous forme d'acronyme (kit de rédaction d'articles).
2) Dans le 2ème paragraphe, l'expression "des hackathons interne", "interne" doit prendre un "s" à la fin.
3) dans le chapitre IV) Valeurs des données, l'expression :
Citation:
"Le virage qu'a pris et veut prendre PagesJaunes.fr met en évidence une chose : les données utilisateurs récoltées valent de l'or."
émets un certain doute, du moins pour ma part, on a l'impression de vouloir quelque chose et son contraire lorsqu'on dit
Citation:
"Le virage qu'a pris et veut prendre PagesJaunes.fr"
Depuis déjà neuf mois, je m’intéresse aux technologies dites de "BigData". Chaque fois que je lis des articles intitulés "Retours d'expériences ... Big Data" ou que j'assiste à des meetups BigData où des gens expliquent et présentent leur retour d’expérience, je me rends toujours compte (je parle à la première personne) que ces articles et ces gens se limitent toujours au QUOI mais jamais le COMMENT n'est abordé : c'est absolument le cas pour cet article.
Par exemple dans le chapitre III : Machine Learning,
Dans la première phrase :
Citation:
En envoyant ses données dans Hadoop, PagesJaunes.fr est capable de les traiter, encore faut-il en tirer quelque chose.
On dit que PagesJaunes.fr est capable de traiter des données dans Hadoop, mais on ne dit nulle part comment.
Dans la phrase suivante :
Citation:
Maintenant que PagesJaunes.fr est capable de traiter plus, plus vite et mieux, le site veut aller plus loin : travailler sur de l'A/B testing, mettre en place de la détection de fraude (génération de fausses recherches) et rendre l'interface utilisateur plus personnelle.
C'est le même constat, désormais PagesJaunes est capable de traiter encore plus vite ses données, toujours je me pose la question de savoir comment PagesJaunes le fait ou alors comment les ingénieurs de chez PagesJaunes le font.
Dans la deuxième phrase :
Citation:
Dans le but d'améliorer son moteur de recherche, une stratégie a été mise en place pour détecter les requêtes où PagesJaunes.fr est faible, c'est-à-dire qu'il ne fournit par le résultat attendu par l'utilisateur.
De même dans celle-ci, une stratégie a été mise en place pour détecter les requêtes où PagesJaunes est faible encore une déclaration et une affirmation, mais sans dire comment cela se fait ou comment cela est fait.
Je souhaiterai savoir comment les choses sont faites par les autres. C'est le comment qui m'interresse. Nous sommes tous au courant de toutes les promesses du Big Data, nous avons plus ou moins tous lu et entendu ce dont le BigData et les technologies y afférentes sont capables de faire ou alors sont capables de nous apporter.
Au vu de ce qui précède et de ma propre expérience, je viens à me poser les questions de savoir si effectivement, le BigData et les technologies sous-jacentes sont vraiment aussi performantes que l'on le dit ou le pense? ou alors est-ce que le Big Data ne promets pas trop plus qu'il n'en peut? ou peut-être c'est pour des raisons de confidentialité que les articles et les acteurs ne se prononcent pas vraiment sur le COMMENT des choses? Ce sont des questions ouvertes.
NB: Je ne suis pas un expert, je m’intéresse au sujet et je me pose des questions sur les constats que je fais.
D'avance merci :)
GYY