IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes prédictives Discussion :

Eclaircissements sur les perceptrons multicouches


Sujet :

Méthodes prédictives

  1. #1
    Membre régulier
    Inscrit en
    Mai 2006
    Messages
    330
    Détails du profil
    Informations forums :
    Inscription : Mai 2006
    Messages : 330
    Points : 85
    Points
    85
    Par défaut Eclaircissements sur les perceptrons multicouches
    Salut,

    J'essaye de mieux comprendre l'utilisation pratique des PMC. Beaucoup d'articles (notamment celui de Alp sur le site) parlent très bien de l'architecture et le fonctionnement du réseau de neurones et la technique de descente de gradient. Par contre comme le souligne cet article l'aspect méthodologique et pratique est plutôt éludé. Au mieux les articles disent "il n'y a pas de méthode" et sinon ils ne posent même pas la question.
    Pourriez vous me donner quelques indications (ou renvoyer vers des exemple un peu pratiques) pour alimenter ma réflexion sur des questions aussi élémentaires que :
    - le nombre de couches (intérêt d'avoir plusieurs couches, risque associé à un nombre de couches élevé...)
    - le nombre de neurones par couche intermédiaire
    - la signification et le choix des neurones d'entrée
    - le choix de la fonction d'activation

    J'ai aussi une question très bête sur les neurones de la couche intermédiaire. Dans les diverses descriptions j'ai l'impression qu'ils sont tous connectés aux mêmes sorties des neurones des couches d'entrée et de sortie et qu'ils ont généralement la même fonction d'activation, comment peut-on arriver à désymmétriser pour arriver à une situation où ils jouent un rôle différent ?

    Merci

  2. #2
    Alp
    Alp est déconnecté
    Expert éminent sénior

    Avatar de Alp
    Homme Profil pro
    Inscrit en
    Juin 2005
    Messages
    8 575
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations forums :
    Inscription : Juin 2005
    Messages : 8 575
    Points : 11 861
    Points
    11 861
    Par défaut
    Citation Envoyé par tnarol Voir le message
    Salut,

    J'essaye de mieux comprendre l'utilisation pratique des PMC. Beaucoup d'articles (notamment celui de Alp sur le site) parlent très bien de l'architecture et le fonctionnement du réseau de neurones et la technique de descente de gradient. Par contre comme le souligne cet article l'aspect méthodologique et pratique est plutôt éludé. Au mieux les articles disent "il n'y a pas de méthode" et sinon ils ne posent même pas la question.
    Pourriez vous me donner quelques indications (ou renvoyer vers des exemple un peu pratiques) pour alimenter ma réflexion sur des questions aussi élémentaires que :
    - le nombre de couches (intérêt d'avoir plusieurs couches, risque associé à un nombre de couches élevé...)
    - le nombre de neurones par couche intermédiaire
    - la signification et le choix des neurones d'entrée
    - le choix de la fonction d'activation

    J'ai aussi une question très bête sur les neurones de la couche intermédiaire. Dans les diverses descriptions j'ai l'impression qu'ils sont tous connectés aux mêmes sorties des neurones des couches d'entrée et de sortie et qu'ils ont généralement la même fonction d'activation, comment peut-on arriver à désymmétriser pour arriver à une situation où ils jouent un rôle différent ?

    Merci
    Alors, je vais répondre du mieux que je peux.

    - Le nombre de couches augmente la complexité de ton réseau de neurones. Cela veut notamment dire qu'il pourra représenter une fonction beaucoup plus complexe, mais aussi que si tu veux approcher une fonction "pas si complexe" cette architecture sera trop lourde. Pour terminer, ce théorème limite pas mal l'intérêt des perceptrons multicouches à plus d'une couche cachée.
    - Le nombre de neurones de la couche cachée est un sujet très gênant. Il n'existe rien qui dans le cas général permet de calculer le nombre de neurones à mettre dans la couche cachée. Il a par contre été démontré que pour un certain type de fonctions booléennes, le nombre de neurones à mettre dans la couche cachée était je crois de 2^n, où n est le nombre d'informations en entrée.
    - Pour les informations d'entrée, il s'agit simplement de fournir au réseau de neurones des informations caractérisant parfaitement les objets que tu vas étudier. Par exemple, si tu veux donner une image de taille 40x40 pixels, il te faudra 1600 informations à fournir à l'entrée du réseau de neurones. La valeur étant à chaque fois un nombre identifiant uniquement la couleur, par exemple.
    - Le choix de la fonction... ça dépend en fait de tes besoins. La fonction sigmoïde permet de "mettre à l'échelle" de grands nombres entre 0 et 1 sans que cela soit linéaire, avec toutefois un "seuil" visible. La fonction tanh remplit le même rôle mais a une dérivée plus complexe, ce qui est gênant pour la delta rule. Après, la fonction seuil par exemple est utile lorsque l'on désire avoir uniquement des valeurs qui sont soit 0 soit 1, par exemple pour des fonctions logiques. Mon article étant un article d'introduction, je te conseille de consulter des documents plus techniques et poussés sur le sujet (tu n'en trouveras pas en français je pense ) afin de mieux te représenter tout ça.

    En espérant t'avoir aidé

  3. #3
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 45
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Points : 9 860
    Points
    9 860
    Par défaut
    Bonjour,

    juste deux petites précisions même si tu viens d'obtenir des réponses à tes questions.

    Pour le nombre de couches : plus tu mets des couches cachées (intermédiaires), plus le pmc sera capable de construire un modèle complexe. Mais plus il y a de couche, plus les calculs sont longs et fastidieux, mais surtout plus tu risques de faire de l'apprentissage par coeur et ton modèle ne sera pas capable de généraliser. Ce qui est le risque majeur à l'utilisation des pmc.

    Pour le nombre de neurones en entrée : comme on te l'a dit, tu mets autan de neurones que de descripteurs. C'est en fait la dimension du vecteur caractéristique. L'erreur la plus courante lorsque l'on utilise un pmc (erreur que l'on pourrait nommer l'erreur du "neuneu"), c'est de mettre bêtement un maximum d'information quelconques et de faire tourner le tout. Par exemple, l'exemple typiquement bourrin mais très fréquent est de mettre en entrée la valeur de tous les pixels de ton image et de dire "le pcm trouvera tout seul" (il y a d'ailleurs une discussion sur la reconnaissance de portes où j'explique le défaut de cette approche). Ce que Alp vient de te donner c'était un exemple, pas un conseil . Là typiquement ton rdn va faire de l'apprentissage par coeur. Donc à cette étape, c'est à toi de réfléchir sur les caractérisques de ce que tu souhaites classer afin d'extraire des descripteurs (caractéristiques) pertinents. Le mieux est toujours d'utiliser un minimum de descripteurs.

  4. #4
    Alp
    Alp est déconnecté
    Expert éminent sénior

    Avatar de Alp
    Homme Profil pro
    Inscrit en
    Juin 2005
    Messages
    8 575
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations forums :
    Inscription : Juin 2005
    Messages : 8 575
    Points : 11 861
    Points
    11 861
    Par défaut
    D'ailleurs, il y a souvent un traitement préalable à faire sur des informations fournies pour n'obtenir que le strict nécessaire d'informations à fournir au réseau de neurones.

Discussions similaires

  1. Questions sur les perceptrons multicouches
    Par alcino dans le forum Méthodes prédictives
    Réponses: 0
    Dernier message: 14/04/2010, 21h23
  2. eclaircissement sur les threads
    Par marocleverness dans le forum Débuter avec Java
    Réponses: 7
    Dernier message: 12/07/2009, 10h48
  3. Eclaircissements sur les barres d'outils perso
    Par La Zélie dans le forum Macros et VBA Excel
    Réponses: 3
    Dernier message: 12/06/2008, 21h24
  4. besoins d'eclaircissements sur les dossiers cron.*
    Par rhaamo dans le forum Administration système
    Réponses: 5
    Dernier message: 23/02/2007, 11h38
  5. Eclaircissement sur les clé dans un DWH(fact table)
    Par Melvine dans le forum Décisions SGBD
    Réponses: 4
    Dernier message: 12/05/2006, 17h46

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo