Précédent   Forum des professionnels en informatique > PHP > Scripts
Scripts Forum d'entraide sur les scripts PHP téléchargés. Les meilleurs scripts PHP, la FAQ scripts PHP, toutes les FAQ PHP
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 29/10/2007, 18h47   #1
Membre du Club
 
Inscription : février 2006
Messages : 199
Détails du profil
Informations forums :
Inscription : février 2006
Messages : 199
Points : 57
Points : 57
Par défaut Cherche moteur de recherche particulier

Bonjour,

Je cherche un moteur de recherche tous documents svp.
Jusqu'à maintenant je ne vois que des scripts pour des sites qui indexent les .php .html & consorts. Mais je veux un moteur qui me fasse une recherche sur un dossier sur le serveur sur les noms de fichiers .doc .xls principalement.
Et si accessoirement, il peut afficher l'arborescence des dossiers, c'est nickel

Merci à ceux qui me donneront des liens, conseils, etc
TallyHo est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 29/10/2007, 19h20   #2
Nouveau Membre du Club
 
Inscription : octobre 2007
Messages : 55
Détails du profil
Informations forums :
Inscription : octobre 2007
Messages : 55
Points : 28
Points : 28
Google indexe de nombreux type de fichiers: pdf, doc, xls, ...

exemple de recherche:
filetype:doc developpez

en savoir plus:
http://www.google.com/help/faq_filetypes.html
ragnarokr est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 29/10/2007, 23h06   #3
Membre du Club
 
Inscription : février 2006
Messages : 199
Détails du profil
Informations forums :
Inscription : février 2006
Messages : 199
Points : 57
Points : 57
Est ce que je peux intégrer Google sur un intranet ?
TallyHo est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/11/2007, 00h44   #4
Nouveau Membre du Club
 
Inscription : octobre 2007
Messages : 55
Détails du profil
Informations forums :
Inscription : octobre 2007
Messages : 55
Points : 28
Points : 28
Sans problème
http://www.webrankinfo.com/google/outils/google-api.php
ragnarokr est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/11/2007, 04h08   #5
Membre confirmé
 
Avatar de Mogwaï
 
Inscription : mai 2004
Messages : 247
Détails du profil
Informations personnelles :
Âge : 31

Informations forums :
Inscription : mai 2004
Messages : 247
Points : 243
Points : 243
Envoyer un message via MSN à Mogwaï
Citation:
Envoyé par ragnarokr Voir le message
Si, y'a un problème :

Citation:
Google ne permet plus de créer de clé pour son API SOAP. Seuls ceux qui ont déjà une clé pourront utiliser l'API SOAP.
Je peux toujours revendre une de mes anciennes clés

Ceci dit tout ceci ne répond nullement à la question initiale qui sous entendait l'indexation des fichiers de son intranet et pas ceux du web...

Si tu souhaites créer toi même le système qui va indexer tout type de document, le plus dur sera d'arriver à extraire le texte brut des documents puis indexer ce texte dans une base de données MySQL par exemple. Ensuite tu pourras effectuer des recherches fulltext dessus.

Autre piste, il existe LUCENE, moteur d'indexation relativement poussé, et programmé en java. Une version de lucene est également disponible dans le Zend Framework.

Ensuite tu peux voir beaucoup plus gros en achetant un serveur de chez Google qui permet d'indexer tes documents dedans. Exalead (boite française) fait également ce genre de choses. Mais là c'est vraiment si t'as plusieurs millions de documents à indexer, car ça vaud très cher.
__________________
Etre à son compte, y'a rien de mieux !
Mogwaï est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/11/2007, 16h58   #6
Membre du Club
 
Inscription : février 2006
Messages : 199
Détails du profil
Informations forums :
Inscription : février 2006
Messages : 199
Points : 57
Points : 57
Merci pour lucene, je vais regarder
TallyHo est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/04/2009, 15h49   #7
Futur Membre du Club
 
Inscription : mars 2007
Messages : 65
Détails du profil
Informations forums :
Inscription : mars 2007
Messages : 65
Points : 16
Points : 16
Citation:
Envoyé par Mogwaï Voir le message
Si, y'a un problème :



Je peux toujours revendre une de mes anciennes clés

Ceci dit tout ceci ne répond nullement à la question initiale qui sous entendait l'indexation des fichiers de son intranet et pas ceux du web...

Si tu souhaites créer toi même le système qui va indexer tout type de document, le plus dur sera d'arriver à extraire le texte brut des documents puis indexer ce texte dans une base de données MySQL par exemple. Ensuite tu pourras effectuer des recherches fulltext dessus.

Autre piste, il existe LUCENE, moteur d'indexation relativement poussé, et programmé en java. Une version de lucene est également disponible dans le Zend Framework.

Ensuite tu peux voir beaucoup plus gros en achetant un serveur de chez Google qui permet d'indexer tes documents dedans. Exalead (boite française) fait également ce genre de choses. Mais là c'est vraiment si t'as plusieurs millions de documents à indexer, car ça vaud très cher.
Bonjour,

avez-vous une expérience de ce produit en entreprise ?
Est-ce si cher que cela ?
Le but serait pour nous de l'intégrer à notre CMS (Ez Publish qui utilise Lucène, pas terrible...).
La recherche pouvant s'effectuer soit sur le site Intranet, soit sur les documents du réseau (les droits des utilisateurs sont gérés par LDAP).

Merci.
csszzen est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/04/2009, 16h29   #8
Expert Confirmé
 
Avatar de grunk
 
Homme Olivier
Développeur Web
Inscription : août 2003
Messages : 1 837
Détails du profil
Informations personnelles :
Nom : Homme Olivier
Âge : 27
Localisation : France, Côte d'Or (Bourgogne)

Informations professionnelles :
Activité : Développeur Web
Secteur : Industrie

Informations forums :
Inscription : août 2003
Messages : 1 837
Points : 3 319
Points : 3 319
Citation:
Envoyé par csszzen Voir le message
Bonjour,

avez-vous une expérience de ce produit en entreprise ?
Est-ce si cher que cela ?
Le but serait pour nous de l'intégrer à notre CMS (Ez Publish qui utilise Lucène, pas terrible...).
La recherche pouvant s'effectuer soit sur le site Intranet, soit sur les documents du réseau (les droits des utilisateurs sont gérés par LDAP).

Merci.
http://www.google.com/enterprise/mini/index.html
Jusqu'à 300 000 fichiers pour la version mini , interface avec LDAP , prix d'appel à 2600€. Ce qui reste tout à fait abordable.
grunk est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 04h25.


 
 
 
 
Partenaires

Hébergement Web