IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C Discussion :

Créer 100 blocs mémoire


Sujet :

C

  1. #1
    Membre averti
    Femme Profil pro
    Étudiant
    Inscrit en
    Juin 2013
    Messages
    52
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Électronique et micro-électronique

    Informations forums :
    Inscription : Juin 2013
    Messages : 52
    Par défaut Créer 100 blocs mémoire
    Bonjour,
    Je vous explique mon problème. Je fais des tests en exécutant un programme 1000 fois, et mesure à chaque fois son temps d'exécution, pour en faire la moyenne.
    Le truc c'est que d'après ce que j'ai compris, le système copie alors les blocs mémoire de la RAM utilisés pas le programme dans le cache, pour un accès plus rapide.
    Le problème c'est que cela fausse mes résultats (vu que pour une utilisation normale d'une programme, c'est à dire une seule exécution, le système ne ferait pas ça).
    Afin de m'aider à résoudre ce problème, on m'a posé la question suivante:
    Comment créer 100 blocs de mémoire de même taille, mais ayant donc des adresses différentes?
    Merci d'avance pour vos réponses

  2. #2
    Membre chevronné
    Homme Profil pro
    Cadre informatique
    Inscrit en
    Avril 2013
    Messages
    183
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Cadre informatique

    Informations forums :
    Inscription : Avril 2013
    Messages : 183
    Par défaut
    Si je ne me trompe pas, quand tu alloues la mémoire de la manière suivante:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    malloc(nbCases*sizeof(int))
    Tu alloues toutes les cases adjacentes.

    Pourquoi ne pas essayer de faire une boucle de 0 à 100 et faire un malloc dont tu stockeras dans un tableau ce qu'il te fournira.
    Effectivement, je trouve ça laid mais si tu veux des adresses différentes (ou surtout non adjacentes), je pense que cela fait ce que tu recherches.

    Le tableau étant juste là pour pouvoir accéder à la zone allouée bien sûr

  3. #3
    Membre Expert
    Homme Profil pro
    Inscrit en
    Décembre 2010
    Messages
    734
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Décembre 2010
    Messages : 734
    Par défaut
    Citation Envoyé par Analou Voir le message
    Bonjour,
    Je vous explique mon problème. Je fais des tests en exécutant un programme 1000 fois, et mesure à chaque fois son temps d'exécution, pour en faire la moyenne.
    Le truc c'est que d'après ce que j'ai compris, le système copie alors les blocs mémoire de la RAM utilisés pas le programme dans le cache, pour un accès plus rapide.
    Le problème c'est que cela fausse mes résultats (vu que pour une utilisation normale d'une programme, c'est à dire une seule exécution, le système ne ferait pas ça).
    Afin de m'aider à résoudre ce problème, on m'a posé la question suivante:
    Comment créer 100 blocs de mémoire de même taille, mais ayant donc des adresses différentes?
    Merci d'avance pour vos réponses
    Un tel artefact serait facile à repérer dans une série statistique, si tu a toujours un temps long et 999 temps plus court!
    MAIS de toutes façons je doute que tu aies à te préoccuper d'un tel effet:
    le cache a une durée de vie limitée, de plus en fonction de l'activité de ta machine si on parle bien de 1000 EXECUTIONS DE PROGRAMME (et non 1000 appels de fonction dans un MEME PROCESSUS), il paraît peu probable que l'adresse soit la même à chaque exécution, car de nombreux processus tournent en permanence sur un ordinateur, demandant et libérant de la mémoire...

  4. #4
    Rédacteur
    Avatar de Franck.H
    Homme Profil pro
    Développeur .NET
    Inscrit en
    Janvier 2004
    Messages
    6 951
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Haut Rhin (Alsace)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : Service public

    Informations forums :
    Inscription : Janvier 2004
    Messages : 6 951
    Par défaut
    Citation Envoyé par therwald Voir le message
    il paraît peu probable que l'adresse soit la même à chaque exécution, car de nombreux processus tournent en permanence sur un ordinateur, demandant et libérant de la mémoire...
    Certaines suites d'appels peuvent justement utiliser les mêmes adresses ou du moins une partie, ce qui m'est déjà arrivé à de nombreuses reprises dans un de mes projets où je dispose même d'une trace de la mémoire utilisée.

    Grâce à ce module de traçage j'ai pu remarquer que le programme utilisais souvent les même adresses. Il faut se dire une chose, même si tu fait un free, cela ne veut pas dire que le système sous-jacent le fasse immédiatement alors à la prochaine demande d'allocation il se peut que le système te renvoie vers les même adresses.
    Mon Site
    Ma bibliothèque de gestion des chaînes de caractères en C

    L'imagination est plus importante que le savoir. A. Einstein

    Je ne répond à aucune question technique par MP, merci d'avance !

  5. #5
    Expert confirmé

    Inscrit en
    Août 2006
    Messages
    3 977
    Détails du profil
    Informations forums :
    Inscription : Août 2006
    Messages : 3 977
    Par défaut
    Joa,

    Effectivement.

    Si le temps entre les exécutions n'est pas trop long, on retombe fréquemment sur la même adresse.

  6. #6
    Expert éminent
    Avatar de Médinoc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 400
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 400
    Par défaut
    Ne pas oublier non plus que les adresses sont vues du processus lui-même, indépendamment de la vraie position en mémoire physique (qui peut changer).
    En fait, un programme donné sans ASLR et avec les mêmes données d'entrée n'a aucune raison de ne pas toujours allouer le même bloc à la même adresse (de son point de vue).
    SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parlé avant.

    "Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
    Apparently everyone.
    -- Raymond Chen.
    Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.

  7. #7
    Membre Expert
    Homme Profil pro
    Inscrit en
    Décembre 2010
    Messages
    734
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Décembre 2010
    Messages : 734
    Par défaut
    Effectivment, je n'avais pas considéré ce point de vue (adresse virtuelle). Il n'en reste pas moins que je serais surpris que la zone physique soit toujours en cache. Pensez vous que ça pourrait être le cas? Je voyais plutôt le cache comme à courte durée de vie, permettant plutôt d'accélérer les traitements répétitifs au sein d'un même process, à condition que les commutations de contexte ne s'en mêlent pas, d'ailleurs.

  8. #8
    Expert éminent
    Avatar de Médinoc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 400
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 400
    Par défaut
    Ah, côté cache et mémoire physique, je ne connais pas assez pour affirmer quoi que ce soit.
    SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parlé avant.

    "Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
    Apparently everyone.
    -- Raymond Chen.
    Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.

  9. #9
    Expert confirmé
    Avatar de Mat.M
    Profil pro
    Développeur informatique
    Inscrit en
    Novembre 2006
    Messages
    8 548
    Détails du profil
    Informations personnelles :
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Novembre 2006
    Messages : 8 548
    Par défaut
    Le truc c'est que d'après ce que j'ai compris, le système copie alors les blocs mémoire de la RAM utilisés pas le programme dans le cache, pour un accès plus rapide.
    il faut d'abord s'assurer si c'est le cas.
    Pour cela il faut connaitre l'assembleur ( x86 ) et voir dans le code assembleur généré du programme si on adresse directement des zones de RAM avec par exemple LEA ( Load Effective Adress ) ou MOV PTR...
    Si en assembleur le code fait des PUSH et des POP c'est qu'on peut penser effectivement que le CPU utilise la mémoire cache

    Pour répondre à ta question l'allocation des blocs mémoires cela dépend de l'OS ça fait 100 fois qu'on l'écrit
    Donc avec des API comme HeapAlloc si tu est sous Windows ça devrait peut-être marcher

    Tu alloues toutes les cases adjacentes.
    en appelant malloc rien ne prouve que les adresses mémoires soient adjacentes...
    on peut s'en rendre compte en mettant des point d'arrêts sur la ligne de code où on fait l'allocation du pointeur en exécutant pas-à-pas

    Pourquoi ne pas essayer de faire une boucle de 0 à 100 et faire un malloc dont tu stockeras dans un tableau ce qu'il te fournira.
    Effectivement, je trouve ça laid mais si tu veux des adresses différentes (ou surtout non adjacentes), je pense que cela fait ce que tu recherches.
    il vaut mieux utiliser des listes chaînées mais là encore ce n'est pas forcément une solution..faut voir

  10. #10
    Membre prolifique
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 869
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 869
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par Analou Voir le message
    Comment créer 100 blocs de mémoire de même taille, mais ayant donc des adresses différentes?
    Merci d'avance pour vos réponses
    Salut
    Tu peux essayer de définir un tableau de 100 pointeurs puis d'allouer de la mémoire pour chaque pointeur
    Code c : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    int *pt[100];
    for (i=0; i < 100; i++)
        pt[i]=malloc(nb_cases * sizeof(int));
    Donc les 100 pt[i] seront contigus en mémoire, chaque malloc te donnera lui-aussi nb_cases contigües ; mais chaque malloc te donnera une adresse différente et pas forcément à suivre (bien qu'il y ait des probabilités que ce soit le cas)

    Citation Envoyé par Mat.M Voir le message
    en appelant malloc rien ne prouve que les adresses mémoires soient adjacentes...
    Ah si, un malloc de n éléments te garantit que les n cases prévues pour stocker chaque élément seront contigües en mémoire. Sinon comment le compilo ferait ensuite pour aller taper dans pt[i] si chaque case pt[i] était dispatchée au hasard ???
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  11. #11
    Membre Expert
    Homme Profil pro
    Inscrit en
    Décembre 2010
    Messages
    734
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Décembre 2010
    Messages : 734
    Par défaut
    Citation Envoyé par Mat.M Voir le message
    il faut d'abord s'assurer si c'est le cas.
    Pour cela il faut connaitre l'assembleur ( x86 ) et voir dans le code assembleur généré du programme si on adresse directement des zones de RAM avec par exemple LEA ( Load Effective Adress ) ou MOV PTR...
    Si en assembleur le code fait des PUSH et des POP c'est qu'on peut penser effectivement que le CPU utilise la mémoire cache
    Là je ne suis pas sûr de te suivre...à ma connaissance l'utilisation du cache dépend surtout du mode d'accès à la mémoire...sauf si on travaille en registre quelle que soit l'instruction, un accès à la mémoire RAM est caché avec la zone adjacente dans l'espoir que les prochains accès seront voisins, donc pris en charge par le cache.
    Le point intéressant suivant c'est quand les données sont elles vidées du cache? A priori, quand il faut de la place pour des donnes plus fraiches et que les anciennes données sont marquées peu intéressantes par l'algorithme de gestion. Plus il s'écoule de temps, plus la probabilité que les données soient ressorties du cache augmente...
    EDIT: à la relecture je me suis trouvé embrouillé, j'ai préféré rectifier

  12. #12
    Membre Expert
    Avatar de Metalman
    Homme Profil pro
    Enseignant-Chercheur
    Inscrit en
    Juin 2005
    Messages
    1 049
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Hauts de Seine (Île de France)

    Informations professionnelles :
    Activité : Enseignant-Chercheur
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2005
    Messages : 1 049
    Par défaut
    La gestion des caches L1 - L2 - L3 est assez spéciale en fait...
    Aujourd'hui, seul le L3 est sur la carte mère il me semble, donc l'algorithme dépendra du fabricant de celle-ci...

    Par contre les L1 et L2 sont internes au CPU, et là, je ne peux que vous conseiller ce "vieux" lien qui est très instructif : lien

    En fonction de la taille des caches (à voir sur chaque CPU), des algorithmes des caches, de l'OS qui préempte (et rafraichit donc les @ à chaque accès par un processus), de l'algorithme du malloc, de la taille demandée à malloc, le nombre de mallocs.... alors l'écriture peut être répercutées en RAM ou pas.
    Dans tous les cas, les adresses seront quand même MMUtisées avec optionnellement ASLR...

    Ajoute mon petit texte à tout ce qui a été précédemment déduit, et tu auras une explication assez complète à remettre en ordre sur la gestion mémoire depuis un processus jusqu'au CPU en passant par les caches et la carte mère.
    --
    Metalman !

    Attendez 5 mins après mes posts... les EDIT vont vite avec moi...
    Les flags de la vie : gcc -W -Wall -Werror -ansi -pedantic mes_sources.c
    gcc -Wall -Wextra -Werror -std=c99 -pedantic mes_sources.c
    (ANSI retire quelques fonctions comme strdup...)
    L'outil de la vie : valgrind --show-reachable=yes --leak-check=full ./mon_programme
    Et s'assurer que la logique est bonne "aussi" !

    Ma page Developpez.net

  13. #13
    Membre averti
    Femme Profil pro
    Étudiant
    Inscrit en
    Juin 2013
    Messages
    52
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Électronique et micro-électronique

    Informations forums :
    Inscription : Juin 2013
    Messages : 52
    Par défaut
    Pour répondre à la question de therwald, je fais 1000 appels de fonctions (une boucle for dans un main).
    Pour résoudre mon problème, j'ai finalement fait un tableau de pointeurs.
    L'architecture de mon programme est donc:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
     
    int main()
        for(i=0; i<nombre_executions_programme; i++)
        {
             création de tab[i];
        }
        for(i=0; i<nombre_executions_programme; i++)
        {
             exécution du programme;
        }
        for(i=0; i<nombre_executions_programme; i++)
        {
             libération de tab[i];
        }
        return 0;
    }
    Le temps d’exécution de mon programme a doublé, je pense donc que j'ai atteint le but recherché.
    Cependant, lorsque je lance mon programme sur mon pc, la 1ère itération est toujours plus lente que les suivantes, alors que lorsque je le lance sur une carte ARM, les itérations sont toutes approximativement égales.
    Auriez-vous une idée de là où ça peut venir?

  14. #14
    Membre très actif

    Femme Profil pro
    Collégien
    Inscrit en
    Juillet 2010
    Messages
    598
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Afghanistan

    Informations professionnelles :
    Activité : Collégien

    Informations forums :
    Inscription : Juillet 2010
    Messages : 598
    Par défaut
    Bonjour,

    Les designeurs de CPU se cassent la tête pour maximiser le nombre de cache hit quelque soit le programme, malloc ou non.

    Si tu veux faire des tests en forçant les caches miss il faut que tu les désactivent ou que tu invalides ligne de cache associée à ton pointeur.
    Pour ce faire je pense qu'il n'y a que l'assembleur.
    Je ne pense pas que l'OS te donne accès a ce genre de routines.

  15. #15
    Membre Expert
    Homme Profil pro
    Inscrit en
    Décembre 2010
    Messages
    734
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Décembre 2010
    Messages : 734
    Par défaut
    A mon avis, dfficile de contrôler le cache comme ça. Il est possible que ton accélération résiduelle corresponde à la mise en cache du code, et là je vois pas trop ce que tu y peux...
    Si tu veux des stats sur l'exécution à froid, fais 1000 exécutions du programme. Pour démontrer que tes 1000 exécutions ne sont pas biaisées, tu peux conserver quelques itérations (pas forcément 1000) dans ton programme, de manière à pouvoir comparer tes 1000 itérations 1 aux itérations de rang n>1.

    bon courage

Discussions similaires

  1. Créer un bloc "Interrogation de clause From"
    Par macben dans le forum Forms
    Réponses: 4
    Dernier message: 13/06/2007, 16h06
  2. Bloc mémoire maximum allouable avec new
    Par uriotcea dans le forum C++Builder
    Réponses: 1
    Dernier message: 28/02/2007, 19h50
  3. Copier une bloc mémoire dans un CDC
    Par kinhelios dans le forum MFC
    Réponses: 3
    Dernier message: 23/02/2007, 10h17
  4. Réponses: 2
    Dernier message: 19/02/2007, 16h46
  5. Partage de blocs mémoire entre 2 processus
    Par rolkA dans le forum Windows
    Réponses: 6
    Dernier message: 18/11/2003, 20h08

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo