IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques, Data Mining et Data Science Discussion :

Méthodes de calcul de l'âge moyen


Sujet :

Statistiques, Data Mining et Data Science

  1. #1
    Membre à l'essai
    Homme Profil pro
    Inscrit en
    Octobre 2011
    Messages
    47
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Octobre 2011
    Messages : 47
    Points : 24
    Points
    24
    Par défaut Méthodes de calcul de l'âge moyen
    Bonjour,

    dans notre entreprise il sont habitué à chercher l'âge moyen en utilisant les classes comme suit : à titre d'exemple

    20-25 : 3 personnes

    26-31 : 4 personnes

    32-37 : 2 personnes

    alors il calcule l'âge moyen comme suit : (22,5 *3 + 28,5*4+34,5*2)/9 =27,83 an

    alors que les valeurs des âges sont connus on a 20 ,21, 22 ,27, 28,29,30,32,36 alors l'âge moyen calculé = (20+21+22+27+28+29+30+32+36)/9=27,22 an

    les 2 âges sont différents lequel est le plus exacte ? et si dorénavant on utilise la moyenne arithmétique est ce qu'on peut comparer l'âge moyen de cette année avec l'année précédente alors qu'il est calculé avec l'autre manière ou c'est faux

    Merci infiniment d'avance pour toute réponse

  2. #2
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 057
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 057
    Points : 9 397
    Points
    9 397
    Par défaut
    La 2ème méthode est évidemment plus précise.
    La première méthode peut avoir un intérêt par exemple dans un sondage. On demande aux gens dans quelle tranche d'âge ils sont, on ne connaît par leur âge précis, et donc, on doit se contenter de tranches d'âge.
    Mais à l'arrivée, 27,83ans ou 27,22ans, l'écart est non significatif.
    Ce serait ridicule d'afficher sur un tableau : l'âge moyen est de 27,22 ans.

    Quand la première personne dit qu'elle a 20 ans, peut-être qu'elle a 20 ans et 9 mois. Refaisons le calcul avec simplement cette correction, et on trouve 27,3 au lieu de 27,22.
    Et les 8 autres personnes aussi n'ont pas exactement 21 ans ou 22 ans, elles ont environ 21 ans ou 22 ans.

    Comparer l'âge moyen des salariés entre 2 années successives, est-ce possible, est-ce utile ?
    - Si le résultat est très différent entre les 2 années (au moins 1 an et demi d'écart), on peut dire des choses, il s'est passé quelque chose.
    - Si l'écart est plus faible, il n'y a rien à dire.

    Et si entre les 2 années, on a changé de méthodologie de calcul, est-ce grave ?
    On parle de 9 salariés.
    C'est certainement possible de retrouver la liste des salariés qui étaient présents il y a 1 an, et de calculer la moyenne de l'année passée, avec la formule 'précise'. Ainsi on peut avoir les chiffres des 2 années, avec la formule n°1, ou avec la formule n°2, au choix.

    A mon tour de poser des questions.
    Dans quel cadre on se pose ces questions ? C'est un exercice scolaire, ou bien c'est une vraie question dans une entreprise dans la vraie vie, et dans ce cas, qui est derrière la question, c'est le chef d'entreprise ? Dans quel but ?
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

  3. #3
    Responsable Qt & Livres


    Avatar de dourouc05
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    Août 2008
    Messages
    26 619
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2008
    Messages : 26 619
    Points : 188 601
    Points
    188 601
    Par défaut


    Citation Envoyé par tbc92 Voir le message
    Dans quel but ?
    Améliorer la vie privée des gens, de telle sorte qu'on ne puisse pas vraiment retrouver les gens avec les réponses ? Sur neuf personnes, je doute du bien-fondé, vu qu'il sera assez facile de voir qui a écrit quoi avec les autres questions :/. Dans le même ordre d'idées, le service RH n'a-t-il pas l'info accessible ?

    est ce qu'on peut comparer l'âge moyen de cette année avec l'année précédente alors qu'il est calculé avec l'autre manière ou c'est faux
    Statistiquement, c'est faux de faire une comparaison directe (tu n'estimes pas la même quantité ; par contre, très clairement, les deux estimateurs sont fortement corrélés). Dans un sondage, dès que tu changes une virgule, tu peux changer la manière dont les gens comprennent la question et donc la manière dont ils répondent. Sur neuf personnes, avec des catégories qui sont déjà assez précises, ça ne doit faire aucune différence en pratique.
    Vous souhaitez participer aux rubriques Qt (tutoriels, FAQ, traductions) ou HPC ? Contactez-moi par MP.

    Créer des applications graphiques en Python avec PyQt5
    Créer des applications avec Qt 5.

    Pas de question d'ordre technique par MP !

  4. #4
    Membre à l'essai
    Homme Profil pro
    Inscrit en
    Octobre 2011
    Messages
    47
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Octobre 2011
    Messages : 47
    Points : 24
    Points
    24
    Par défaut
    merci beaucoup les amis
    Citation Envoyé par tbc92 Voir le message


    Et si entre les 2 années, on a changé de méthodologie de calcul, est-ce grave ?
    On parle de 9 salariés.
    Non c'est 800 salariés et pas 9 j'ai juste donné un exemple
    Citation Envoyé par tbc92 Voir le message
    A mon tour de poser des questions.
    Dans quel cadre on se pose ces questions ? C'est un exercice scolaire, ou bien c'est une vraie question dans une entreprise dans la vraie vie, et dans ce cas, qui est derrière la question, c'est le chef d'entreprise ? Dans quel but ?
    c'est une entreprise travail de RH pour savoir si il y a veillissement donc besoin de recrutement etc

  5. #5
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 057
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 057
    Points : 9 397
    Points
    9 397
    Par défaut
    800 personnes et non plus 9, c'est autre chose.
    J'imagine que d'une année sur l'autre, les effectifs changent peu, tous ceux qui sont présents en année 1 et en année 2 ont vieilli d'un an, et les personnes qui sont parties ont été remplacées par des personnes plus jeunes. Et du coup, on compare 2 âges moyens qui sont très proches. Si l'âge moyen augment d'un an, ça veut dire qu'en gros, il n'y a eu aucun départ ni aucun recrutement, problème quand on a 800 personnes, et s'il diminue, ça veut dire que les départs et les recrutements ont plus que compensé le vieillissement, belle performance. Donc on parle d'un âge moyen qui normalement augmente ou diminue très peu d'une année sur l'autre. En gros, si l'âge moyen diminue de 3 mois, ou augmente de 6 mois, il y a une alerte, c'est atypique.
    Quand on calcule l'âge moyen avec l'une ou l'autre méthode, est-ce que le résultat obtenu est fiable, quel est l'intervalle de confiance ? Si l'intervalle de confiance est supérieur à 3 mois, on a un problème ! On cherche à mesurer des écarts de quelques semaines ou quelques mois, et la mesure serait donnée à plus de 3 mois près.

    Quand on part de l'âge de chaque personne (nouvelle méthode, on prend les âges, et pas les tranches d'âge), il y a une impasse qui est faite. La personne dit 21 ans, c'est un arrondi. Elle a entre 21 ans et 21 ans et 11 mois... On a une fourchette de 1 an autour de la valeur donnée (et la valeur donnée est systématiquement en bas de la fourchette, mais peu importe). Une fourchette de 1 an, ça veut dire un écart-type de 4 mois environ.
    Quand on a 800 nombres 'aléatoires', qui ont tous un écart type de 4, et qu'on fait la moyenne de ces 800 nombres, on a un écart-type qui est divisé par racine(800), donc divisé par 30 environ. L'écart-type de l'âge moyen est donc de 4 jours.
    Et donc, la Vraie moyenne, (si on la calculait en prenant l'âge de chacun en mois ou en semaines ou en jours et non en années, c'est la moyenne qu'on a trouvée, à une semaine près environ. C'est très précis.

    Quand on part de tranches d'âge, qui ont une amplitude de 5 ans, on multiplie ce résultat par 5, le résultat obtenu pour l'âge moyen est correct à 1 mois près environ. C'est également très précis.

    Donc, sans parler de changement de méthodologie, si on travaille avec les tranches d'âge (5 ans d'amplitude pour chaque tranche), un âge moyen qui augmente d'un mois entre 2 mesures, c'est non significatif, c'est dans l'intervalle de confiance : on mesure un truc avec un outil peu précis, on se trompe peut-être d'un mois.
    Avec la nouvelle norme (utiliser les âges sans faire des tranches de 5 ans), c'est plus précis, si l'âge moyen augmente (ou diminue) d'1 ou 2 mois entre 2 années successives, ce n'est pas une erreur de mesure, c'est un vieillissement (ou un rajeunissement) des effectifs.

    Au changement de méthodologie, est-ce que les 2 nombres sont comparables ?
    Oui, les exemples que tu donnes sont bons. Si on considère que pour la tranche 26-31, on compte 28.5 - au milieu entre 26 et 31) , et idem pour chaque tranche, il n'y a pas de biais.
    Tu dois pouvoir le vérifier.
    Sur les données de cette année, tu peux faire les 2 calculs. Prendre les 800 nombres, faire leur moyenne. Et prendre les 800 nombres, les remplacer par les 'tranches', et faire les moyennes. Normalement, tu devrais trouver moins d'un mois d'écart entre ces 2 moyennes. Il faut faire ce calcul, pour vérifier si je ne dis pas trop de bêtises.
    Dans les 2 calculs, on rajeunit tout le monde de 6 mois. Mais c'est le même écart de 6 mois qu'on a partout, dans tous les calculs. Donc pas de problème.

    Il y a peut-être les 2 tranches extrêmes qui peuvent poser problème. La tranche 20-25, on remplace l'âge de tous les individus de cette tranche par 22.5. Mais en vrai, on a probablement sensiblement plus de personnes de 23 ou 24 ans que de personnes de 20 ou 21 ans. Et donc, quand on fait des tranches, on rajeunit sensiblement l'âge moyen des gens de cette tranche. On dit que tous ces gens là on 22.5 ans, alors qu'en vrai, ils ont plutôt 23 voire 24 ans.
    Et pareil pour la dernière tranche, mais là, c'est l'inverse, on vieillit les gens.
    Donc les 2 erreurs se compensent plus ou moins.

    Donc à nouveau, pas de problème dû au changement de méthode, il faut juste se dire qu'une variation de 1 mois, ce n'est pas significatif du tout, parce que l'une des mesures est faite avec une marge d'erreur d'un mois..

    Dernier point de ce très très long baratin.
    Si j'étais décideur, je ne m'intéresserais pas trop à l'âge moyen.
    Si on a un âge moyen de 40 ans, mais avec une très forte dispersion (beaucoup de vieux et beaucoup de jeunes), c'est plus problématique que si on a un âge moyen de 41 ans, et une faible dispersion (forte concentration entre 30 et 50 ans). Si on a beaucoup de vieux et beaucoup de jeunes, il faut s'imaginer que tous les vieux vont partir très bientôt, et donc lancer ces recrutements, même si l'âge moyen est faible.
    Mais j'imagine que c'est pour ça qu'il y a les effectifs par tranche d'âge, et que ces effectifs par tranche d'âge sont conservés.
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

  6. #6
    Membre à l'essai
    Homme Profil pro
    Inscrit en
    Octobre 2011
    Messages
    47
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Octobre 2011
    Messages : 47
    Points : 24
    Points
    24
    Par défaut
    bonsoir
    Citation Envoyé par tbc92 Voir le message
    En gros, si l'âge moyen diminue de 3 mois, ou augmente de 6 mois, il y a une alerte, c'est atypique.
    Q1: expliquez plus s'il vous plait
    Citation Envoyé par tbc92 Voir le message
    Quand on calcule l'âge moyen avec l'une ou l'autre méthode, est-ce que le résultat obtenu est fiable, quel est l'intervalle de confiance ? Si l'intervalle de confiance est supérieur à 3 mois, on a un problème ! On cherche à mesurer des écarts de quelques semaines ou quelques mois, et la mesure serait donnée à plus de 3 mois près.
    Q2: je n'ai pas compris je calcule l'intervalle de confiance des 2 méthodes ? et comment ?

    Citation Envoyé par tbc92 Voir le message
    Au changement de méthodologie, est-ce que les 2 nombres sont comparables ?*
    Oui, les exemples que tu donnes sont bons. Si on considère que pour la tranche 26-31, on compte 28.5 - au milieu entre 26 et 31) , et idem pour chaque tranche, il n'y a pas de biais.
    Tu dois pouvoir le vérifier.
    Sur les données de cette année, tu peux faire les 2 calculs. Prendre les 800 nombres, faire leur moyenne. Et prendre les 800 nombres, les remplacer par les 'tranches', et faire les moyennes. Normalement, tu devrais trouver moins d'un mois d'écart entre ces 2 moyennes. Il faut faire ce calcul, pour vérifier si je ne dis pas trop de bêtises
    Q3: en fait je ne parle pas de la comparaison des 2 méthode sur une même année mais pour 2 année différente càd l'an précédent ils ont calculé l'âge moyen avec les classes et si pour cette année je le calcule en moyenne arithmétique est ce que je peux comparer cette année à l'année précédente ou pas
    merci beaucoup d'avance
    -

  7. #7
    Expert confirmé
    Avatar de anapurna
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mai 2002
    Messages
    3 421
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Arts - Culture

    Informations forums :
    Inscription : Mai 2002
    Messages : 3 421
    Points : 5 820
    Points
    5 820
    Par défaut
    salut

    calcul d'ecart type,de variance et autre indicateur

    voir ici
    Nous souhaitons la vérité et nous trouvons qu'incertitude. [...]
    Nous sommes incapables de ne pas souhaiter la vérité et le bonheur, et sommes incapables ni de certitude ni de bonheur.
    Blaise Pascal
    PS : n'oubliez pas le tag

  8. #8
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 057
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 057
    Points : 9 397
    Points
    9 397
    Par défaut
    Pour la question 1, je me place dans la tête du dirigeant de cette entreprise. J'ai l'impression que le type en question va mettre en place des actions si l'âge moyen varie de 6 mois à peu près d'une année sur l'autre. Et je me demande ensuite : Est-on en mesure de lui fournir des indicateurs fiables à 6 mois près. Est-ce qu'une variation de 6 mois, c'est aléatoire, ou c'est significatif.

    Question 2 : L'intervalle de confiance, je te le donne. C'est environ 1 mois avec l'ancienne méthode, c'est environ 1 semaine avec la nouvelle.
    Et donc, si notre patron veut mettre en place des actions si par hasard les chiffres qu'on annonce varie de 6 mois, il peut le faire, nos chiffres sont suffisamment précis pour ça.

    Question 3 : J'avais bien compris ça. Je t'ai exposé des calculs. Je dis que l'ancienne méthode donne des chiffres assez précis, à 1 mois près environ. Peut-être que je me trompe (j'ai pas relu mes livres de cours depuis longtemps), peut-être que tu ne me fais pas confiance (et tu as tout à fait le droit, c'est sain). Donc je te conseille de calculer l'âge moyen avec les 2 méthodologies, sur un même effectif, celui de cette année. Si la différence entre les 2 calculs est inférieure à 1 mois, c'est que je ne raconte pas trop de bêtises (ou que j'ai de la chance), et si la différence est supérieure à 1 mois, c'est que je me plante complètement, ou peut-être aussi que j'ai raison, mais que j'ai très peu de chance.
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

  9. #9
    Membre à l'essai
    Homme Profil pro
    Inscrit en
    Octobre 2011
    Messages
    47
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Octobre 2011
    Messages : 47
    Points : 24
    Points
    24
    Par défaut
    merci à vous

    j'ai un petit problème dans le calcul la dernière classe est 55 ans et plus je ne peux pas déterminer le centre de la classe donc s juste ou faux de prendre 55 fois effectif de la classe ? et comment calculer l'écart type dans ce cas ?

    autre chose l'écriture suivante des intervalles est juste ou non

    20-25
    26-31

    ou bien la seconde classe doit commencer par la valeur extrême de la première classe car l'âge est une variable continue càd
    20-25
    25-30

    Merci beaucoup d'avance

  10. #10
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 057
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 057
    Points : 9 397
    Points
    9 397
    Par défaut
    Avec des classes 20-25, 26-31 etc etc , les personnes qui ont 25 ans sont clairement dans la tranche 20-25, pas de doute. Mais attention, chaque tranche correspond à 6 ans (ceux qui ont 26, 27, 28 ,29, 30 ou 31 ans cont dans la même tranche, ça fait 6 ans).
    Avec l'autre écriture, il faut clarifier. Par exemple en écrivant [20,25[, [25,30[, [30,35[, etc Ainsi, c'est clair , ceux qui ont 25 ans sont dans la tranche [25,30[.
    Avec ton écriture, aucun moyen de deviner si les 25 ans sont dans la 1ère tranche ou la 2ème.

    Pour la tranche 55 ans et plus, tu es en train de dire : je ne sais pas arbitrer entre 57 ou 58, et donc je choisis 55. Non.
    Choisis un truc réaliste, soit 57, soit 58, soit même 59, ou 57.5, ce que tu veux, ce sera toujours mieux que 55.
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

  11. #11
    Membre confirmé
    Profil pro
    Inscrit en
    Mai 2007
    Messages
    341
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2007
    Messages : 341
    Points : 528
    Points
    528
    Par défaut
    Bonsoir,

    Attention, la moyenne est un indicateur fiable à condition que les données soient bien réparties sinon cela peut masquer la vraie situation.
    Il peut être également utile de calculer la médiane et d'observer si celle-ci s'écarte de la moyenne.

  12. #12
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 057
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 057
    Points : 9 397
    Points
    9 397
    Par défaut
    Evidemment, réduire 800 nombres à un seul nombre, ça cache plein de choses. La médiane est souvent utile, mais ici, je pense que les chiffres communiqués aux décideurs sont plus nombreux.
    En particulier, avec 8 tranches (20-25, 26-30 etc etc ), les effectifs de ces 8 tranches sont des indicateurs très utiles.
    Si on a 100 personnes dans chaque tranche, ou si on a 140 personnes dans les 4 tranches extrêmes et 60 dans les 4 tranches centrales, la situation est totalement différente, alors que moyennes et médianes seront les mêmes pour ces 2 séries de données.
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 18
    Dernier message: 23/08/2010, 16h44
  2. Méthode de Calcul d'exponentiel
    Par étoile de mer dans le forum Shell et commandes GNU
    Réponses: 64
    Dernier message: 11/01/2010, 18h39
  3. Réponses: 0
    Dernier message: 16/07/2009, 17h15
  4. Méthode de calcul d'un échantillon représentatif
    Par auredura dans le forum SAS STAT
    Réponses: 5
    Dernier message: 24/04/2009, 19h12
  5. Calcul de prix unitaire moyen
    Par smail21 dans le forum Bases de données
    Réponses: 4
    Dernier message: 28/11/2005, 12h10

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo