Bonjour,
J'ai une liste de plus de 4Millions de titres de documents (type "jesuisdocument1", "etmoiunautredoc" ...).
En texte, cette liste fait environ 100mo.
J'aimerais faire un système de recherche dans cette liste.
Niveau langage je travaille en PHP, python et bash.
J'ai aussi la possibilité de mettre de l'ES/Mongo... bref, pas trop de restriction.
Le plus simple de mon point de vu étant de monter la liste en mémoire (php) et faire une recherche dessus via "similar_text", mais j'ai des doutes sur les performance.
Monter un mongodb/es juste pour les fonctions de recherche basique, me semble surdimensionné.
Quelqu'un aurait déjà effectué des tests de performance pour ce genre de cas?
Merci !
Partager