1. #1
    Rédacteur/Modérateur

    Avatar de SpaceFrog
    Homme Profil pro
    Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Bidouilleur SharePoint
    Inscrit en
    mars 2002
    Messages
    37 439
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 67
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Bidouilleur SharePoint
    Secteur : Industrie

    Informations forums :
    Inscription : mars 2002
    Messages : 37 439
    Points : 63 755
    Points
    63 755
    Billets dans le blog
    1

    Par défaut [2013] Recherche et doublons, affiner le filtre "documents similaires"

    Je travaille sur un SharePoint 2013 en local avec des espaces collaboratifs et un portail qui affiche des composants de recherches sur des bibliothèques des espaces collaboratifs.

    Les utilisateurs du portail se plaignent de ne pas trouver certains documents sur le portail.
    Après avoir épuisé toutes les pistes de droits d'accès, je me suis penché sur les requêtes et en particulier sur le filtrage des doublons.

    Il semblerait que ce soit un souci de similarité des documents, car en désactivant le filtrage des doublons les documents incriminés remontent bien sur le portail.

    Ma question porte sur ce fameux filtrage des doublons, je n'ai pas trouvé d'explication précise sur le mode de filtrage utilisé par SharePoint.

    J'ai un début de réponse au niveau de la création de ces documents "similaires" car les collaborateurs ont pour habitude de créer les documents avec Word et de générer ensuite des PDF.
    Ils ont en général pour habitude de partir d'un template Word, Template généré une première fois avec un titre qui se peuple automatiquement et qui se trouve donc duplique pour les autre documents...

    Est ce que le fait que les documents aient le même titre peut conduire SharePoint à les considérer comme similaires ?

    Sachant que je ne tiens pas a désactiver intégralement le filtre doublon qui peut être utile pour filtrer les véritables doublons, peut on influer sur le niveau de similarité de ce filtre ?
    Ma page Developpez - Mon Blog Developpez
    Président du CCMPTP (Comité Contre le Mot "Problème" dans les Titres de Posts)
    Deux règles du succès: 1) Ne communiquez jamais à quelqu'un tout votre savoir...
    Votre post est résolu ? Alors n'oubliez pas le Tag


    réalisations :www.oxygen-translations.com|www.saftair.com| www.ouestisol.fr | www.sistac-alizay.fr | www.acoustishop.fr | www.litt.fr | www.ouestventil.fr
    Humour

  2. #2
    Membre chevronné
    Profil pro
    Inscrit en
    mai 2004
    Messages
    1 471
    Détails du profil
    Informations personnelles :
    Âge : 31
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations forums :
    Inscription : mai 2004
    Messages : 1 471
    Points : 2 063
    Points
    2 063

    Par défaut

    Bonjour

    Malheureusement non. C'est comme le tabac, avec ou sans filtre.
    Dans une grande majorite de projets auxquels j'ai participe, la desactivation du filtrage des doublons est necessaire, a tel point que je me demande pourquoi ce n'est pas desactive par defaut...
    Vous pourriez proposer a vos utilisateurs un lien "relancer la recherche avec doublons" vers une autre page de resultats de recherche qui remonte tous les doublons.
    Ou alors essayer d'affiner la granularite contextuelle de la recherche (quel site, quelle liste, quelle date de creation)?

    La similarite entre les documents depend d'une valeur calculee par un jeu de hash successifs par le processeur de contenus du service Search.
    Cet algorithme n'est pas connu ni parametrable a ma connaissance.

    Par contre le contenu utilise pour le hash ne concerne pas les metadonnees, uniquement le contenu du doc.

    Un peu plus d'infos ici:
    https://blogs.technet.microsoft.com/...mentsignature/

  3. #3
    Rédacteur/Modérateur

    Avatar de SpaceFrog
    Homme Profil pro
    Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Bidouilleur SharePoint
    Inscrit en
    mars 2002
    Messages
    37 439
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 67
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Bidouilleur SharePoint
    Secteur : Industrie

    Informations forums :
    Inscription : mars 2002
    Messages : 37 439
    Points : 63 755
    Points
    63 755
    Billets dans le blog
    1

    Par défaut

    C'est vraiment curieux cette fausse notion de doublon ...
    Un doublon => identiques , pas similaires ...
    de plus la notion de similarité calculé est vraiment relativement large.

    Bref c'est vraiment pénalisant ...


    Merci Nono de ces précisions.. :awe:
    Ma page Developpez - Mon Blog Developpez
    Président du CCMPTP (Comité Contre le Mot "Problème" dans les Titres de Posts)
    Deux règles du succès: 1) Ne communiquez jamais à quelqu'un tout votre savoir...
    Votre post est résolu ? Alors n'oubliez pas le Tag


    réalisations :www.oxygen-translations.com|www.saftair.com| www.ouestisol.fr | www.sistac-alizay.fr | www.acoustishop.fr | www.litt.fr | www.ouestventil.fr
    Humour

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Recherche de doublons "non strict"
    Par Oluha dans le forum Langage SQL
    Réponses: 2
    Dernier message: 10/01/2005, 09h21
  2. [VBA] Algo de recherche de doublons
    Par guams dans le forum VBA Access
    Réponses: 6
    Dernier message: 27/07/2004, 17h10
  3. recherche de doublons dans un fichier texte
    Par portu dans le forum Général Algorithmique
    Réponses: 3
    Dernier message: 07/10/2003, 14h13
  4. Réponses: 2
    Dernier message: 19/08/2003, 18h04

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo