Solr & serveur de fichier

**Linaet** · 21/06/2011, 14h03

Bonjour à tous,

après avoir cherché un peu partout des infos, je viens ici en espérant trouver la réponse à mes questions.

Je dois mettre en place le moteur de recherche à facettes Solr d'Apache sur un serveur de fichier.
Ce serveur de fichier contient plus de 293.000 fichiers. Le but de la mise en place de Solr est donc de faciliter la vie des équipes devant effectuer des recherches sur ce serveur.

J'ai pour l'instant installer Solr en local sur mon poste et réaliser un script (en Vbscript) qui me permet de récupérer le nom et l'adresse des fichiers contenus sur le serveur et qui générer un fichier xml que j'envoie à solr pour l'indexation. J'arrive à effectuer mes recherches sans soucis.

La prochaine étape est de réussir à mettre en place une recherche full-text parmi tous les fichiers contenus sur le serveur (doc, pdf, ppt...) et c'est là que ça se corse

On m'a dit qu'il fallait indexer le contenu des fichiers pour réaliser la recherche full text (via un copier coller de ce qui se trouve dans les fichiers), est-ce vrai ?
- Si oui, comment puis-je automatiser la lecture du contenu du fichier et copier/coller ce contenu dans mon fichier xml pour l'indexation ?
- Si le contenu de chaque fichier est présent dans le fichier xml, ce ne sera pas trop lourd pour solr ?

Sinon, existe-il une autre solution pour réaliser la recherche full-text avec Solr (voire au pire, avec un autre outil) ?

Je suis vraiment perdue dans la mise en place de cette recherche full-text

Merci d'avance !

Solr & serveur de fichier

API standards et tierces Java

Mode arborescent

Discussions similaires

Partager

Partager