IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Algorithmes et structures de données Discussion :

Une startup californienne annonce avoir battu Captcha


Sujet :

Algorithmes et structures de données

  1. #1
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 45
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Points : 9 860
    Points
    9 860
    Par défaut Une startup californienne annonce avoir battu Captcha
    Vicarious, une startup californienne vient d'annoncer avoir battu le fameux test de Captcha.

    Qui utilise internet et n'a jamais eu à affronter ce test ? Réponse : personne !
    Captcha est ce fameux test que vous devez passer lorsque vous souhaitez créer un compte, faire une réservation, etc. sur un site internet.



    Ce test (parfois même compliqué pour un humain, car les chiffres sont illisibles) créé par Luis von Ahn, permet de différencier automatiquement un humain d'une machine. En effet, lors de l'essor d'internet et de la multiplication des comptes emails, des robots créaient automatiquement des milliers de faux comptes chaque jour, afin d'être utilisés pour envoyer des spams.
    Captcha a stoppé tout ceci, car les machines/robots n'arrivent pas à lire ces chiffres tordus/barrés/bruités/etc.

    Seulement, voilà, Vicarious, une startup spécialisée en intelligence artificielle, vient de créer un algorithme qui battrait Captcha.
    Celui-ci est basé sur un réseau de neurones artificiel multicouche.
    1. La première couche analyse de façon basique les pixels afin de déterminer s'ils peuvent être pertinents.
    2. La deuxième couche, analyse les agglomérations de pixels afin de voir s'ils forment un arrangement cohérent (un pixel isolé est par exemple rejeté).
    3. La troisième couche détermine si la forme est au moins partiellement connue (Captcha déformant les formes de base).
    4. Ces trois couches sont répétées plusieurs fois.


    Au total, ce sont environ huit millions de neurones qui sont connectés afin de réaliser l'analyse. On devine alors la taille gigantesque de l'échantillon d'apprentissage qu'il aura fallu pour entrainer un tel réseau.


    Source "New Scientist".

  2. #2
    Membre régulier
    Profil pro
    Inscrit en
    Juillet 2010
    Messages
    74
    Détails du profil
    Informations personnelles :
    Âge : 36
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations forums :
    Inscription : Juillet 2010
    Messages : 74
    Points : 114
    Points
    114
    Par défaut
    Je trouve la taille du réseau démesurée... A la fac on me disait de ne pas dépasser la cinquantaine de neurones pour éviter le sur-apprentissage, j'ai du mal à voir comment ce réseau réussi à généraliser.

    Outre la taille gigantesque de l'échantillon de données qu'il aura fallu pour l'entrainer (et encore autant pour le valider), combien de temps faut il pour faire des calculs sur des matrices aussi grosses ?

  3. #3
    Membre éclairé
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Mars 2011
    Messages
    222
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mars 2011
    Messages : 222
    Points : 767
    Points
    767
    Par défaut
    En fait les Captcha ont déjà été contournés depuis longtemps: il suffit 1/ d'ouvrir un site porno, ou de partage de fichiers ou parfois de simples forum, 2/ recopier l'image à décoder pour la proposer aux visiteurs nombreux et intéressés de notre site ad hoc, 3/ et voilà!

    On savait déjà déjà que le Captcha avait parfois tendance à éjecter de l'humanité des personnes bien réelles (Des associations australiennes de personnes invalides veulent le voir disparaître du Web), maintenant on est certain que des robots peuvent résoudre un Captcha.

    La seule question qui reste c'est: mais pourquoi continuer à utiliser des Captcha?

  4. #4
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 45
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Points : 9 860
    Points
    9 860
    Par défaut
    Citation Envoyé par link66 Voir le message
    Je trouve la taille du réseau démesurée... A la fac on me disait de ne pas dépasser la cinquantaine de neurones pour éviter le sur-apprentissage, j'ai du mal à voir comment ce réseau réussi à généraliser.

    Outre la taille gigantesque de l'échantillon de données qu'il aura fallu pour l'entrainer (et encore autant pour le valider), combien de temps faut il pour faire des calculs sur des matrices aussi grosses ?
    Des réseaux de plus de 50 neurones sont juste courants.
    Tout dépend de la taille de l'échantillon d'apprentissage, qui doit être au moins trois fois supérieur au nombre de poids à évaluer.
    Donc ici, ils ont certainement utiliser plusieurs millions d'images.




    Citation Envoyé par olreak Voir le message
    En fait les Captcha ont déjà été contournés depuis longtemps: il suffit 1/ d'ouvrir un site porno, ou de partage de fichiers ou parfois de simples forum, 2/ recopier l'image à décoder pour la proposer aux visiteurs nombreux et intéressés de notre site ad hoc, 3/ et voilà!
    Rien à voir.
    On parle d'un logiciel capable de traiter l'image, pas d'une astuce pour faire traiter le problème par un autre humain.


    Citation Envoyé par olreak Voir le message
    On savait déjà déjà que le Captcha avait parfois tendance à éjecter de l'humanité des personnes bien réelles (Des associations australiennes de personnes invalides veulent le voir disparaître du Web)
    C'est une association de personnes "invalides" et notamment avec des problèmes de vue !

  5. #5
    Membre régulier
    Homme Profil pro
    Doctorant en Data Scientce et Consultant en Informatique
    Inscrit en
    Novembre 2004
    Messages
    93
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Doctorant en Data Scientce et Consultant en Informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Novembre 2004
    Messages : 93
    Points : 73
    Points
    73
    Par défaut le nombre de neurones!!
    Je trouve aussi 8 millions, c'est trop. Maintenant cela dépend de la taille de l'image (en nombre de pixels donc nombre de données). Je me demande aussi comment est-ce que cela serait mis en pratique?

  6. #6
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 45
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Points : 9 860
    Points
    9 860
    Par défaut
    Citation Envoyé par MBAYE BABACAR GUEYE Voir le message
    Je trouve aussi 8 millions, c'est trop. Maintenant cela dépend de la taille de l'image (en nombre de pixels donc nombre de données). Je me demande aussi comment est-ce que cela serait mis en pratique?
    Dans l'article d'origine, les auteurs disent qu'ils ne souhaitent pas le mettre en pratique, cela n'aurait d'intérêt que pour les spameurs.
    Le but était de tester la capacité des rdns qu'ils créent.

  7. #7
    Membre émérite

    Homme Profil pro
    Développeur informatique
    Inscrit en
    Octobre 2013
    Messages
    1 106
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2013
    Messages : 1 106
    Points : 2 663
    Points
    2 663
    Par défaut
    C'est l'enfer, pour les non voyants.
    Et les catchas audios ne sont pas mieux

Discussions similaires

  1. Uber annonce avoir été victime d'une intrusion informatique en mai dernier
    Par Stéphane le calme dans le forum Actualités
    Réponses: 1
    Dernier message: 02/03/2015, 13h53
  2. Réponses: 4
    Dernier message: 09/04/2014, 15h09
  3. Réponses: 2
    Dernier message: 05/09/2006, 11h08

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo