Le poker n'est pas un jeu de hasard pur comme la roulette par exemple. A la roulette quoi qu'on fasse il n'existe aucune méthode pour faire mieux que jouer au hasard.
Au poker il y a une part de hasard très présente et visible sur le court terme mais elle s'annule sur le long terme.
A l'infini tout le monde se retrouve dans les même situations mais les bons joueurs, eux, seront capables d'obtenir une meilleur EV (expected value = espérance de gain en français) en maximisant leurs gains et en minimisant leurs pertes.
Pour s'assurer qu'un joueur est vraiment supérieur à un autre il faut donc beaucoup de mains joués. Avec 120 000 mains on commence seulement à avoir un échantillon intéressant.
L'IA au poker s'est beaucoup intéressé au calcul de l'équilibre de Nash (NE).
Il est très difficile de la calculer avec les ordinateurs actuels car l'arbre de décision à parcourir est immense.
Cet NE a été calculé il y a quelques années pour le Limit Holdem qui comporte un arbre de décision bien inférieur au No Limit Holdem.
La stratégie résultante est optimale dans le sens où elle est impossible à battre, c'est une stratégie purement défensive, elle ne cherche pas à exploiter les faiblesses d'un joueur.
Une IA qui chercherait à maximiser ces profits pourrait donc dans un premier temps jouer le NE, le temps de récupérer un maximum d'information sur les faiblesses d'un adversaire.
Il exploiterait ensuite ces faiblesses de temps en temps en faisant attention à ne pas devenir exploitable à son tour.






Répondre avec citation














Partager