IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Fusion de plusieurs dictionnaires (optimisation)


Sujet :

Python

  1. #1
    Nouveau Candidat au Club
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Décembre 2019
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Chercheur en informatique

    Informations forums :
    Inscription : Décembre 2019
    Messages : 2
    Points : 1
    Points
    1
    Par défaut Fusion de plusieurs dictionnaires (optimisation)
    Bonjour,

    Je souhaiterai optimiser mon code pour effectuer une fusion de plusieurs dictionnaires :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    d1={"a":"1.0","b":"1.0", "c":"1.0"} 
    d2={"a":"1.1","b":"1.1", "c":"1.1"} 
    d3={"a":"1.2","b":"1.3", "c":"1.4"} 
     
    d4 doit donner un dictionnaire qui résulte de la fusion de d1 d2 et d3 mais en gardant les valeurs les plus hautes
     
    d4={"a":"1.2","b":"1.3", "c":"1.4"}
    Mon code code fonctionne mais le temps de traitement est trop élevé (compte tenu du nombre de valeurs /dictionnaires à traiter).
    Pourriez-vous m'indiquer l'algorithme le moins "couteux" ?
    Merci de votre aide.

  2. #2
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 283
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 283
    Points : 36 770
    Points
    36 770
    Par défaut
    Salut,

    Citation Envoyé par xlpython Voir le message
    Pourriez-vous m'indiquer l'algorithme le moins "couteux" ?
    Un algorithme est une solution qui comprends une structuration des données adaptée au problème à résoudre. Par exemple pourquoi "mouliner" des dictionnaires alors que des tableaux seraient plus efficaces (surtout avec numpy)?

    Et si vous êtes "obligé" d'utiliser des dictionnaires, ce n'est plus de la programmation, mais un exercice où on s'amuse à coder un truc avec des contraintes qu'on s'impose...

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Expert éminent
    Avatar de fred1599
    Homme Profil pro
    Lead Dev Python
    Inscrit en
    Juillet 2006
    Messages
    3 813
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Lead Dev Python
    Secteur : Arts - Culture

    Informations forums :
    Inscription : Juillet 2006
    Messages : 3 813
    Points : 7 102
    Points
    7 102
    Par défaut
    Bonjour,

    La difficulté dans votre exemple et que les multiples dictionnaires présentés ont les mêmes clés.

    Vous ne pouvez donc pas passer par un raccourci tel que d4 = {**d1, **d2, **d3}Il va falloir créer une boucle qui détecte chaque clé, détecter son existence dans le dictionnaire résultant, et y ajouter les valeurs dans une liste.

    Quelque chose comme {'a': ['1.0', '1.1', '1.2'], 'b': ['1.0', '1.1', '1.3'], 'c': ['1.0', '1.1', '1.4']}Est-cela que vous souhaitez ?
    Celui qui trouve sans chercher est celui qui a longtemps cherché sans trouver.(Bachelard)
    La connaissance s'acquiert par l'expérience, tout le reste n'est que de l'information.(Einstein)

  4. #4
    Nouveau Candidat au Club
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Décembre 2019
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Chercheur en informatique

    Informations forums :
    Inscription : Décembre 2019
    Messages : 2
    Points : 1
    Points
    1
    Par défaut
    Merci pour cette réponse.
    En effet, les dictionnaires ont potentiellement des clés communes, mais avec des valeurs pouvant être différentes. L'objectif étant de retenir uniquement la valeur la plus haute dans mon dictionnaire.
    Dans l'exemple, cela donnerait le résultat :

    {'a': '1.2', 'b': '1.3', 'c':'1.4'}
    Mais d'après vos réponses il n'existe pas de méthode plus optimale que de passer par des boucles.

  5. #5
    Expert éminent
    Avatar de fred1599
    Homme Profil pro
    Lead Dev Python
    Inscrit en
    Juillet 2006
    Messages
    3 813
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Lead Dev Python
    Secteur : Arts - Culture

    Informations forums :
    Inscription : Juillet 2006
    Messages : 3 813
    Points : 7 102
    Points
    7 102
    Par défaut
    J'avais zappé le coup de la valeur la plus haute et effectivement, il faut un algorithme le permettant.

    Comme le dis @wiztricks plus haut, il faut se poser la question du bien fondé à utiliser les dictionnaires et se demander si ce traitement ne pourrait pas être fait lors de la construction et non une fois que tout est construit.

    Sinon c'est assez simple, mais encore faut-il maîtriser la manière dont on utilise les dictionnaires, boucles, etc... Avec votre interpréteur, amusez vous à faire des petits tests sur des exemples de dictionnaires et voir ce que ça peut donner.
    Celui qui trouve sans chercher est celui qui a longtemps cherché sans trouver.(Bachelard)
    La connaissance s'acquiert par l'expérience, tout le reste n'est que de l'information.(Einstein)

  6. #6
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 283
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 283
    Points : 36 770
    Points
    36 770
    Par défaut
    Citation Envoyé par xlpython Voir le message
    Mais d'après vos réponses il n'existe pas de méthode plus optimale que de passer par des boucles.
    Réfléchissez un peu: l'ordinateur (utilisé aujourd'hui) est une machine séquentielle qui ne sait faire que des boucles (pas un ordinateur quantique, ni une machine vectorielle).

    La seule chose qu'on peut faire, c'est réduire le nombre de boucles, organiser les données de la façon la plus intéressante pour faire le moins de boucles possible... et alors on peut essayer de faire ces boucles de la façon la plus efficace possible.

    A partir du moment où l'organisation des données est "imposée" et que l'algo. n'est pas trop mauvais, on peut juste faire faire des boucles plus efficacement. Et çà suppose de poster le code que vous avez fait plutôt que d'espérer que la magie va vous sortir de là.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  7. #7
    Expert éminent sénior
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 684
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 684
    Points : 30 973
    Points
    30 973
    Billets dans le blog
    1
    Par défaut
    Bonjour
    Citation Envoyé par xlpython Voir le message
    Je souhaiterai optimiser mon code pour effectuer une fusion de plusieurs dictionnaires :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    d1={"a":"1.0","b":"1.0", "c":"1.0"} 
    d2={"a":"1.1","b":"1.1", "c":"1.1"} 
    d3={"a":"1.2","b":"1.3", "c":"1.4"} 
     
    d4 doit donner un dictionnaire qui résulte de la fusion de d1 d2 et d3 mais en gardant les valeurs les plus hautes
     
    d4={"a":"1.2","b":"1.3", "c":"1.4"}
    Déjà, est-ce garanti que tous les dictionnaires ont tous les mêmes clefs ou bien peut-on avoir des trucs style
    Code python : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    d1={"a":"1.0","b":"1.0", "c":"1.0"} 
    d2={"a":"1.1","b":"1.1", "d":"1.1"} 
    d3={"a":"1.2","b":"1.3", "e":"1.4"}
    ???

    Citation Envoyé par xlpython Voir le message
    Pourriez-vous m'indiquer l'algorithme le moins "couteux" ?
    La moindre des choses eut été que tu donnes ton code qu'on le regarde. Si les clefs sont toutes garanties identiques, alors on peut jouer avec du max(x[k] for x in (d1, d2, d3)). Toutefois je remarque que les valeurs ne sont pas des nombres mais des strings. Donc pour comparer, chaque valeur doit être convertie en float puis au final, la valeur max trouvée doit être remise en string (puisque apparemment tu veux des strings à l'issue). Fatalement ces conversions prennent du temps...
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  8. #8
    Expert éminent
    Avatar de fred1599
    Homme Profil pro
    Lead Dev Python
    Inscrit en
    Juillet 2006
    Messages
    3 813
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Lead Dev Python
    Secteur : Arts - Culture

    Informations forums :
    Inscription : Juillet 2006
    Messages : 3 813
    Points : 7 102
    Points
    7 102
    Par défaut
    Citation Envoyé par Sve@r Voir le message
    Donc pour comparer, chaque valeur doit être convertie en float puis au final, la valeur max trouvée doit être remise en string (puisque apparemment tu veux des strings à l'issue). Fatalement ces conversions prennent du temps...
    Je ne suis pas certains, faudrait tester, mais je crois que la comparaison se fait bien dans mes souvenirs... Même si il est logique de passer par ce stade, ça semble implicite selon l'interprétation du langage.
    Celui qui trouve sans chercher est celui qui a longtemps cherché sans trouver.(Bachelard)
    La connaissance s'acquiert par l'expérience, tout le reste n'est que de l'information.(Einstein)

  9. #9
    Expert éminent sénior
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 684
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 684
    Points : 30 973
    Points
    30 973
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par fred1599 Voir le message
    mais je crois que la comparaison se fait bien dans mes souvenirs...
    Oui, Python comme tout langage objet sait comparer les objets qu'il manipule mais il le fait "au mieux" par rapport à la nature des choses à comparer. Et donc pour les strings, la comparaison se fait selon la valeur ascii. Ainsi comparer "12.5" avec (par exemple) "2.0" se fera sur la valeur ascii des caractères. Et comme le caractère "1" est inférieur au caractère "2", la suite "12.0" restera elle-aussi inférieure à la suite "2.5".

    Il y a eu une discussion très récente à ce sujet.
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

Discussions similaires

  1. Union de plusieurs dictionnaires
    Par Loko dans le forum Général Python
    Réponses: 4
    Dernier message: 20/03/2007, 13h08
  2. Fusion de plusieurs tables
    Par Rikou31 dans le forum Requêtes et SQL.
    Réponses: 16
    Dernier message: 23/02/2007, 11h08
  3. [XSLT] Fusion de plusieurs XML
    Par syvid dans le forum XSL/XSLT/XPATH
    Réponses: 5
    Dernier message: 25/07/2006, 16h24
  4. fusion de plusieurs champs d'une table à une autre
    Par reolik dans le forum Requêtes
    Réponses: 1
    Dernier message: 16/02/2006, 08h39
  5. Fusion de plusieurs requetes
    Par rossy dans le forum Access
    Réponses: 3
    Dernier message: 22/12/2005, 10h41

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo