-
algo calcul probabilité
Je souhaite calculer la probabilité que l'evenement E se réalise pour une personne donnée grace aux informations que j'ai sur cette personne
Prenons par exemple le critère age que nous appelerons P1, sexe P2 et ville P3 :
P1 = nb de personnes de cet age réalisant l'evenement E / nb de personnes total de cet age
P2 = nb de personnes de ce sexe réalisant l'evenement E / nb de personnes total de ce sexe
P3 = nb de personnes de cette ville réalisant l'evenement E / nb de personnes total de cette ville
Il y a en tout environ 25 criteres dans mon calcul
On calcule une proba générale :
Pe = nb de personnes total réalisant l'evenement E / nb de personnes total
Et on calcule un score global en tenant compte des 3 criteres par rapport a la proba générale :
P = P1/Pe * P2/Pe * P3/Pe
Pour les critères avec trop peu de personnes au total, on remplace P1/Pe par 1
Au final on estime que si P est supérieur a 1, il y a de grandes chances que l'evenement E se réalise pour cette personne
Je m'interroge sur plusieurs choses :
- Peut on définir plus précisement ce seuil arbitraire de P>1, et si oui comment ?
- Comment savoir quels sont les critéres discriminant, et eventuellement leur attribuer un poids plus important dans le calcul ?
- Que pensez vous de l'algo ? Auriez vous fait autrement ? Est il faux ?
Merci d'avance
-
Je n'ai pas vraiement de réponse à te donner mais juste une remarque/question:
As tu pris en compte les coefficients de corrélation entre tes critères
du genre...
critere x: si le sujet a moins de 20 ans
critère y: si le sujet a des enfants
si x est vrai il est tres peu probable qu'y le soit.
donc, tes critères sont ils décorellés?
Je comprend bien le concept qui est que si le sujet fait parti de plusieurs groupes à risque, il a plus de chance de voir E se réaliser, mais ces groupes ne sont ils pas redondants?
PS: CONTRE EXEMPLE
Pe=0.005
P1=P2=...=P25=0.01
Pe/Px=2
score= 2^25 = 33 554 432
Pe=0.005
P1=P2=...=P24=0.005
P25=1
score = 200
Pourtant dans le 2e cas le sujet verra E se réaliser à 100% alors que dans le 1er il a, selon toute vraisemblance, 1% de chance de voir E se réaliser.