Utilisation de Zend_Search_Lucene
Bonjour,
Voilà j'ai une table MySql de CV.
Cette table contient un certain nombre d'information dont le nom du cv en question.
J'aimerai pouvoir faire une recherche fulltext dans ces fichiers.
Je dois donc d'abord pouvoir les indexer, c'est pourquoi j'aimerai utiliser Zend_Search_Lucene.
Les cvs sont au format doc, docx, pdf, txt et jpeg.
1) Pourrai-je le faire avec Zend_Search_Lucene? Et si oui comment?
2) A quel moment mettre en place l'indexation dans mon programme?
Merci d'avance pour votre aide.
Indexer 5000 documents avec Zend_search_lucene
Bonjour,
J'ai plus de 5000 documents a indexer avec Zend_Search_Lucene.
Seulement et bizarrement l'indexation s'arrête au 1600 ème document.
J'ai essayé de contourner le problème à l'aide des méthodes :
setMaxBufferedDocs() et setMergeFactor() sans meilleur résultat.
Voici mon code:
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
| $indexPath = APPLICATION_PATH."/cvtheque/docindex";
if (is_dir($indexPath)) {
$index = Zend_Search_Lucene::open($indexPath);
$index->optimize();
}
else
{
$index = Zend_Search_Lucene::create($indexPath);
$index->optimize();
}
$num=count($filePathDocx);
echo $num;
$i=0;
$index->setMaxBufferedDocs(100);
$index->setMergeFactor(100);
$index->optimize();
foreach ($filePathDocx as $pathDocx) {
$doc = Zend_Search_Lucene_Document_Docx::loadDocxFile($pathDocx);
$index->addDocument($doc);
$i=$i+1;
echo $i;
}
$indexSize = $index->count();
echo $indexSize; |
Pour info, l' ne s'affiche jamais vu que ma boucle foreach n'atteint jamais le dernier enregistrement.
Merci d'avance pour vos réponse.