IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Autres langages Discussion :

[Swish-E] Indexation de documents pour CDROM


Sujet :

Autres langages

  1. #1
    Membre régulier
    Homme Profil pro
    Responsable outils métier VIGS (Veolia)
    Inscrit en
    Septembre 2005
    Messages
    80
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Haut Rhin (Alsace)

    Informations professionnelles :
    Activité : Responsable outils métier VIGS (Veolia)
    Secteur : Industrie

    Informations forums :
    Inscription : Septembre 2005
    Messages : 80
    Points : 87
    Points
    87
    Par défaut [Swish-E] Indexation de documents pour CDROM
    Bonjour,

    Je ne sais trop si c'est le bon forum, j'ai cherché un moment avant de me décider pour le mettre ici. Ne m'en voulez donc pas si ce n'est pas bon.

    Je me lance.
    Je recherche une solution d'indexation de documents (txt, pdf, html, mais aussi doc, xls, ppt, oot, xml, ...) afin de générer un index et de l'utiliser sur un CDROM avec un petit moteur de recherche.

    Le moteur de recherche sur le CD ne doit rien installer sur l'OS, il doit en être au maximum indépendant.

    Swish-e répond très bien à ce besoin. Il permet de générer un index de différents types de documents en passant des filtres internes, des programmes perl ou d'autres programmes externes.

    Pour l'aspect du moteur de recherche sur CDROM, j'utilise jsFind qui est un ensemble de JavaScript intégré à une page HTML et utilisant les index transformés de swish-e.

    L'index de swish-e est transformé en XML via un patch sur swish-e, puis par un programme perl qui génère un index compatible avec jsFind.

    La solution est satisfaisante.

    MAIS, je ne retrouve pas le patch sur swish-e pour Linux permettant un export en XML de l'index créé.
    J'ai bien l'installation de swish-e avec support jsFind pour Windows, mais l'ensemble des autres programmes tournent sous Linux.

    Je recherche donc une personne ayant ce patch ou tout autre solution permettant d'indexer des documents de tout type et d'utiliser l'index de manière simple et "cross plateforme".

    Merci d'avance à tous ceux qui ont lu ce message quelque peu long

  2. #2
    Membre extrêmement actif
    Avatar de Madmac
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Juin 2004
    Messages
    1 707
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Alimentation

    Informations forums :
    Inscription : Juin 2004
    Messages : 1 707
    Points : 1 449
    Points
    1 449
    Billets dans le blog
    7
    Par défaut
    Effectivement, je crois que tu es dans le mauvais forum, le forum Linux serait sans doute plus approprié. Mais tu devrais s'en doute étoffé ta question...

    Pour ce que est de lire un document contenant du XML sous Linux, ce ne sera sans doute pas un problème. Le problème que veut tu faire de ces données sous Linux?

  3. #3
    Membre régulier
    Homme Profil pro
    Responsable outils métier VIGS (Veolia)
    Inscrit en
    Septembre 2005
    Messages
    80
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Haut Rhin (Alsace)

    Informations professionnelles :
    Activité : Responsable outils métier VIGS (Veolia)
    Secteur : Industrie

    Informations forums :
    Inscription : Septembre 2005
    Messages : 80
    Points : 87
    Points
    87
    Par défaut
    Bonjour Madmac,

    Merci pour ta réponse.
    J'ai pu retrouver le patch pour swish-e.
    Il est inclut dans un package jsfind.

    Le patch une fois appliqué permet d'inclure les fonctions pour exporter le fichier index en XML.
    Les différentes procédures Perl du package jsFind permettent ensuite de transformer cet index XML en quelque chose de plus lisible pour un navigateur compatible DOM-2.

    Pour ce qui de ce que je veux en faire :
    - Indexer un ensemble de répertoires contenant des fichiers PDF, DOC, XLS, HTML, ... Ces fichiers sont des cours contenant un grand nombre d'information sur divers sujets.
    - Une fois indexer, convertir l'index pour jsfind.
    - Intégrer l'index à un DVD, y inclure les javascript jsfind et une page de recherche HTML.

    Au final, cela va donc me permettre d'avoir un DVD contenant 2 Go de cours, doc, tutorial, exemples de sources, et d'avoir un moteur de recherche multi-plateforme sans installation préalable pour retrouver les documents qu'il me faut à un instant t.

    Swish-e couplé à jsFind et ces scripts Perl est la meilleur solution que j'ai pu trouver pour l'instant.
    Il existe d'autres moteurs de recherche, mais sont plus ciblés vers l'indexation d'un site Web, et donc difficilement réutilisable sur un support en Lecture Seule (CD, DVD, ...).

  4. #4
    Membre extrêmement actif
    Avatar de Madmac
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Juin 2004
    Messages
    1 707
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Alimentation

    Informations forums :
    Inscription : Juin 2004
    Messages : 1 707
    Points : 1 449
    Points
    1 449
    Billets dans le blog
    7
    Par défaut
    Cela me semble un bonne solution. Pour ce qui est des outils pour indexer, je serait moins catégorique quand tu dis qui sont fait surtout pour internet (la plupart ont été inventé avant internet....) .

    Mais ton approche me semble très valable. En passant avec un nom comme jsfind, ce serait pas un programme en java. Parce que ce s'il a été compilé avec le compileur de SUN. Il devrait tourné aussi sous Linux. Une idée comme cela...

  5. #5
    Membre régulier
    Homme Profil pro
    Responsable outils métier VIGS (Veolia)
    Inscrit en
    Septembre 2005
    Messages
    80
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Haut Rhin (Alsace)

    Informations professionnelles :
    Activité : Responsable outils métier VIGS (Veolia)
    Secteur : Industrie

    Informations forums :
    Inscription : Septembre 2005
    Messages : 80
    Points : 87
    Points
    87
    Par défaut
    Bonjour Madmac,

    Merci pour ta réponse.

    jsFind est écrit en javascript. Il utilise les capacités DOM-2 des navigatures Web. Il est donc portable sur toute machine utilisant un tel navigateur.

    Un programme en Java aurait nécessité une JVM en local ou sur le CD pour chaque type d'architecture cible.

    Pour les autres programmes, effectivement, ils ne sont pas totalement dédié aux sites web, mais leur architecture (pour ce que j'en connais) ne permet pas un export du fichier réutilisable sur un support CD avc uniquement les possibilités d'un navigateur Web pour moteur.

    Cdlt,
    Gilles

  6. #6
    Membre extrêmement actif
    Avatar de Madmac
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Juin 2004
    Messages
    1 707
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Alimentation

    Informations forums :
    Inscription : Juin 2004
    Messages : 1 707
    Points : 1 449
    Points
    1 449
    Billets dans le blog
    7
    Par défaut
    Je crois que la plupart des gens qui ont un navigateur ont presque implicitement le le runtime de java...

  7. #7
    Membre régulier
    Homme Profil pro
    Responsable outils métier VIGS (Veolia)
    Inscrit en
    Septembre 2005
    Messages
    80
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Haut Rhin (Alsace)

    Informations professionnelles :
    Activité : Responsable outils métier VIGS (Veolia)
    Secteur : Industrie

    Informations forums :
    Inscription : Septembre 2005
    Messages : 80
    Points : 87
    Points
    87
    Par défaut
    Presque en effet ... Mais pas tous, et puis le Javascript est tout de même beaucoup plus répandu sur les navigateurs !

    La solution Swish est opérationnel couplé à jsFind.
    Il me reste encore à travailler sur l'index.
    Les documents que j'utilise sont très orientés technique, donc certains termes reviennent très souvent, et sont donc très présent au sein de l'index.

    Le moteur jsFind peut être amélioré, il ne supporte pas des critères de recherche évolués (OR, (), ...).

    @ + madmac et merci pour tes réponses.

  8. #8
    Nouveau Candidat au Club
    Inscrit en
    Mai 2007
    Messages
    1
    Détails du profil
    Informations forums :
    Inscription : Mai 2007
    Messages : 1
    Points : 1
    Points
    1
    Par défaut
    Bonjour,
    Merci d'avoir expliquer la méthode avec laquelle t'as céer l'index pour ton CD, c ce que je chercher

  9. #9
    Candidat au Club
    Profil pro
    Inscrit en
    Juillet 2010
    Messages
    3
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2010
    Messages : 3
    Points : 4
    Points
    4
    Par défaut
    Bonjour,

    Si vous souhaitez réaliser une indexation sur cd-rom avec un outil "clé en main" facile d'utilisation et sans aucune installation sur votre machine, la solution Windex de Multimédia Solutions est très intéressante : http://www.lug.com/produits/logiciel...ex-pour-cd-rom

Discussions similaires

  1. utilisation de lucene JEE pour l'indexation des documents
    Par ninasili dans le forum Développement Web en Java
    Réponses: 0
    Dernier message: 07/06/2011, 18h13
  2. moteur de recherche pour indexer les documents de mon propre site
    Par cpf2006 dans le forum EDI, CMS, Outils, Scripts et API
    Réponses: 1
    Dernier message: 05/02/2009, 14h39
  3. document pour bien utiliser pgadmin
    Par hama dans le forum PostgreSQL
    Réponses: 1
    Dernier message: 11/11/2005, 11h36

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo