IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bibliothèques, systèmes et outils C Discussion :

Implémentation SET et rapidité de recherche


Sujet :

Bibliothèques, systèmes et outils C

  1. #1
    Expert confirmé
    Homme Profil pro
    Développeur
    Inscrit en
    Août 2003
    Messages
    1 267
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Développeur

    Informations forums :
    Inscription : Août 2003
    Messages : 1 267
    Points : 4 067
    Points
    4 067
    Par défaut Implémentation SET et rapidité de recherche
    Bonjour,

    J'ai besoin de faire de nombreuses recherche dans une liste d'éléments uniques (plusieurs millions) de type mpz_t (bigint de la bibliothèque mpir).

    Quelles implémentations de set performante existe-t-il en C ?

    Dois-je m'orienter sur un hashset ou un treeset pour avoir les meilleures performances en recherche ?

    Merci d'avance.

  2. #2
    Modérateur
    Avatar de dinobogan
    Homme Profil pro
    ingénieur
    Inscrit en
    Juin 2007
    Messages
    4 073
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France

    Informations professionnelles :
    Activité : ingénieur
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2007
    Messages : 4 073
    Points : 7 163
    Points
    7 163
    Par défaut
    Tu ne donnes pas assez de détails, alors je vais faire des suppositions.
    Supposons que tous tes mpz_t tiennent en RAM dans un seul tableau. Supposons que tu puisses y appliquer une relation d'ordre total (je ne connais pas la structure mpz_t). Supposons enfin que l'ensemble des mpz_t ne change pas.
    Alors pour une première approche, tu vas trier le tableau. Puis, pour toutes tes recherches, tu feras une recherche dichotomique.
    Si tu as 16 millions d'éléments, ta recherche dichotomique ne demandera que 24 tests pour trouver l'élément cherché.
    L'avantage de cette approche est que le code est simple et court. Tu vas très vite avoir un chronométrage sur les temps de recherches et tu pourras revenir ici s'il faut améliorer les temps de recherches.
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java
    Que la force de la puissance soit avec le courage de ta sagesse.

  3. #3
    Expert confirmé
    Homme Profil pro
    Développeur
    Inscrit en
    Août 2003
    Messages
    1 267
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Développeur

    Informations forums :
    Inscription : Août 2003
    Messages : 1 267
    Points : 4 067
    Points
    4 067
    Par défaut
    Bonjour,

    Tous les mpz_t sont en RAM (ça fait en tableau de 2 à 4 Go) et il ne change pas sauf si le programme redémarre.

  4. #4
    Expert confirmé
    Homme Profil pro
    Développeur
    Inscrit en
    Août 2003
    Messages
    1 267
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Développeur

    Informations forums :
    Inscription : Août 2003
    Messages : 1 267
    Points : 4 067
    Points
    4 067
    Par défaut
    Bonjour,

    J'ai pu changé les mpz_t par des unsigned long long et j'ai alimenté un tableau de taille fixe (actuellement 26 898 867 éléments) avec les nombres triés.

    J'ai essayé une recherche dichotomique mais je ne trouve pas ça rapide, avez-vous une meilleure alternative ?
    Sachant que :
    • le nombre d'éléments est fixe et aucun élément n'est ajouté/supprimé après initialisation du tableau
    • l'ordre n'a pas d'importance



    PS : je peux éventuellement switcher vers du C++
    si c'est une librairie externe, elle doit être utilisable sur Windows ET Linux

  5. #5
    Rédacteur/Modérateur


    Homme Profil pro
    Network game programmer
    Inscrit en
    Juin 2010
    Messages
    7 115
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : Canada

    Informations professionnelles :
    Activité : Network game programmer

    Informations forums :
    Inscription : Juin 2010
    Messages : 7 115
    Points : 32 967
    Points
    32 967
    Billets dans le blog
    4
    Par défaut
    - pas rapide : C'est a dire ? Tu as quel résultat et espères quel résultat ?
    - ordre pas important : Tes éléments ne sont pas triés ? Comment effectues donc ta recherche alors ?
    - changement de langage : C++ a une structure set et unordered_set (hashset) en standard, aucune idée des performance par contre

    Plus rapide que du dichotomique sur structure triée euh.. On se rapproche de la science fiction. Tes éléments se suivent-ils ? Y'a-t-il aucun trous ? Peux-tu créer un index unique dans [1-X] depuis chacun d'eux ? Si oui a une de ces question, un tableau pourrait être envisagé, et la recherche devient juste le calcul de l'index et un décalage de pointeur.
    Pensez à consulter la FAQ ou les cours et tutoriels de la section C++.
    Un peu de programmation réseau ?
    Aucune aide via MP ne sera dispensée. Merci d'utiliser les forums prévus à cet effet.

  6. #6
    Expert confirmé
    Inscrit en
    Mars 2005
    Messages
    1 431
    Détails du profil
    Informations forums :
    Inscription : Mars 2005
    Messages : 1 431
    Points : 4 182
    Points
    4 182
    Par défaut
    Une recherche dichotomique sur un tableau de cette taille, c'est cache miss garanti à chaque accès. Autrement dit, le processeur va passer deux pour cent de ses cycles à exécuter ton code et le reste à attendre les informations.

    Pas mieux que Bousk : quel est ton cas d'utilisation ? Qu'espères-tu ? Quels sont tes points de comparaison ?

  7. #7
    Membre éprouvé Avatar de fenkys
    Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Octobre 2007
    Messages
    376
    Détails du profil
    Informations personnelles :
    Âge : 56
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Octobre 2007
    Messages : 376
    Points : 1 054
    Points
    1 054
    Par défaut
    Citation Envoyé par Bousk Voir le message
    - ordre pas important : Tes éléments ne sont pas triés ?
    Il n'a pas dit que sa liste n'était pas trié, mais que l'ordre n'était pas important. En clair, si on lui propose un ordre qui permet d'améliorer les performances, il n'aura aucun problème à l'adopter.
    Enfin, c'est comme ça que je l'ai compris.

Discussions similaires

  1. Implémentation d'un moteur de recherche interne
    Par dré kam dans le forum MySQL
    Réponses: 7
    Dernier message: 24/05/2017, 19h42
  2. [XL-2010] Filtre élaboré : rapidité en recherche
    Par QuestVba dans le forum Macros et VBA Excel
    Réponses: 16
    Dernier message: 07/01/2016, 13h42
  3. Augmenter la rapidité de recherche dans un fichier volumineux
    Par abdelkarim_1987 dans le forum Excel
    Réponses: 34
    Dernier message: 17/09/2013, 17h00
  4. Erreur implémentation d'arbre binaire de recherche.
    Par Pallas. dans le forum Débuter
    Réponses: 2
    Dernier message: 24/03/2011, 19h27
  5. Classe implémentant Set
    Par Space23 dans le forum Débuter avec Java
    Réponses: 1
    Dernier message: 09/03/2009, 13h47

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo