Bonjour tout le monde,

Voilà j'entends beaucoup parlé d'algorithmes d'apprentissage continu (machine learning) où la machine, à travers cet algorithme, pourrait ajuster les paramètres de l'algorithme pour optimiser le résultat.

Prenons un exemple simple : scoring/classification pour l'obtention d'un prêt dans une banque.
Suivant leur appartenance à telle ou telle classe des actions sont réalisées sur les individus : on accorde un prêt ou non.

On va estimer les paramètres du modèle (scoring/classification) sur un jeu d'apprentissage en essayant de minimiser le taux d'erreur.
Après forcément sur le jeu de test on valide ou pas. Jusqu'ici tout va bien.

Toutefois la "dynamique" de la population va évoluer dans le temps. Mais les paramètres du modèle ne seront pas changé tant qu'il n'y pas d'étape d'estimation. C'est là que je me pose 2 questions :

- Comment ré-estimer les paramètres sur une population qui a évoluée et surtout sur des individus sur lesquels on a fait des actions ... pour moi il y a un gros gros biais non? En gros il est facile de voir pour les personnes qui ont obtenu un prêt à tord ... mais l'inverse? Et il est impossible de prendre une population indépendante de tout ça car forcément une fois le modèle en "production" toutes les personnes sont scorées pour l'obtention d'un prêt. Là je suis un peu perdu.

- Forcément l'idéal serait d'avoir un algo qui "apprenne" au cours du temps. Mais je vois pas du tout sur quel critère et comment la machine pourrait d'elle même apprendre et ré-ajuster les paramètres?

Si quelqu'un pouvait m'expliquer ou m'éclairer sur cet exemple qui me parait assez "simple" je suis preneur car je trouve encore flou tout ce qu'on peut mettre derrière le machine learning.

Bien cordialement,

Hollow