Bonjour à tous !
En ce moment je suis à la recherche de solution pour intégrer un moteur de recherche sur un site internet fait de jsp. Ayant fait déjà quelques recherches je suis tombé sur des API très intéressante (comme Lucene). Cependant, malgrè le grand intérêt que j'y porte, je manque de temps et j'ai besoin d'une solution plus compléte : C'est a dire un moteur de recherche capable d'indexer toutes les pages de mon site (étant dynamique, jsp oblige, je pense qu'il faut un robot qui s'en charge) mais également tous les fichiers qui peut s'y trouver, c'est a dire des fichiers xml, html, pdf, doc, xls et ppt. (il n'y en a normalement pas d'autres a gérer)
En recherchant ces solutions complétes je suis tombé sur des moteurs mais qui ne couvraient pas tout mes besoins à la fois. J'ai pu trouver des crawlers et des moteurs d'indexation séparés mais je cherche plutôt, toujours par manque de temps, des solutions complétes. Je suis tombé sur un moteur interressant qui se nomme Nutch qui reprendrait l'api Lucene, mais est il configurable pour ne pas visiter d'autre site que le sien ? j'avoue n'avoir pas trouver d'information sur cela. J'ai également entendu parler de Java Search Engine mais apparemment celui ci ne pourrait indexer que des HTML, PDF et doc, ce qui ne répond pas à tous mes besoins.
Si quelqu'un peut m'aiguiller sur un ou plusieurs moteurs qui existeraient ... je l'en remercie d'avance . Je précise que je recherche quelques choses d'openSource dans un premier temps pour avoir la possibilité de bidouillé si besoin, mais s'il faut plutot se tourner vers des solutions payantes je serais preneur également .
Merci d'avance à tous !
ReiVon
Partager