Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

  1. #1
    Chroniqueur Actualités

    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    mars 2013
    Messages
    4 670
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : mars 2013
    Messages : 4 670
    Points : 121 774
    Points
    121 774
    Par défaut Collecter des données publiques d'un site pour les utiliser dans ses activités n'est probablement pas illégal
    LinkedIn ne parvient pas à restreindre la collecte d'informations sur les profils publics de ses membres,
    la Cour estime que cette activité n'est pas illégale

    Le web scraping est une technique permettant l'extraction des données d'un site via un programme, un logiciel automatique ou un autre site. L'objectif est donc d'extraire le contenu d'une page d'un site de façon structurée. Le scraping permet ainsi de pouvoir réutiliser ces données.

    Faire du web scraping sur un site Web public sans l'approbation du propriétaire du site Web ne constitue pas une violation de la loi sur les fraudes et les abus informatiques, a estimé une cour d'appel américaine lundi. La décision intervient dans une bataille juridique qui oppose LinkedIn, une société appartenant à Microsoft, à une petite société d'analyse de données appelée hiQ Labs.

    HiQ effectue du web scraping de profils publics des utilisateurs de LinkedIn, puis les utilise pour aider les entreprises à mieux comprendre leurs propres effectifs. Après avoir toléré les activités de web scraping de hiQ pendant plusieurs années, LinkedIn a envoyé à la société une lettre de cessation et d'abstention en 2017 lui demandant de cesser de collecter des données à partir de profils LinkedIn. LinkedIn a notamment fait valoir que hiQ violait la Computer Fraud and Abuse Act, la principale loi antipiratage des États-Unis.

    La Computer Fraud and Abuse Act (CFAA) est une loi du gouvernement fédéral américain mise en vigueur en 1986 qui porte sur la sécurité des systèmes d'information. Il s'agit d'un amendement à une loi sur les fraudes informatiques qui fait maintenant partie du Comprehensive Crime Control Act of 1984. Cette loi interdit tout accès à un ordinateur sans autorisation préalable ou tout accès qui excède les autorisations.

    Cela représentait une menace existentielle pour hiQ car le site Web de LinkedIn est la principale source de données de hiQ sur les employés de ses clients. HiQ a donc poursuivi LinkedIn en justice, cherchant non seulement à déclarer que ses activités de web scraping ne constituaient pas un piratage, mais également une ordonnance interdisant à LinkedIn d’interférer.

    Un tribunal de première instance s’est rangé du côté de hiQ en 2017. Lundi, la Cour d’appel du 9e circuit a entériné la décision de la juridiction inférieure, estimant que la loi sur la fraude et les abus informatiques ne s’appliquait tout simplement pas aux informations accessibles au grand public.

    « La CFAA a été promulguée pour empêcher toute intrusion intentionnelle dans l'ordinateur de quelqu'un d'autre, notamment le piratage informatique », a écrit un panel de trois juges. La cour a noté que lorsque les législateurs débattaient de cette loi, des analogies avec des crimes physiques tels que l'introduction par effraction ont été faites à plusieurs reprises. Du point de vue du neuvième circuit, cela implique que la CFAA ne s’applique qu’aux systèmes d’information ou informatiques qui étaient au départ privés, ce que les propriétaires de sites Web signalent généralement avec un mot de passe.

    La cour note que, lorsque la CFAA a été adoptée, dans les années 80, elle ne s'appliquait qu'à certaines catégories d'ordinateurs contenant des données militaires, financières ou autres.

    « Aucun des ordinateurs auxquels la CFAA avait initialement été appliquée n'était accessible au grand public », écrit le tribunal. « Une autorisation affirmative quelconque était présumément requise ».

    Lorsque la loi a été étendue à un plus grand nombre d'ordinateurs en 1996, un rapport du Sénat a déclaré que son objectif était « d'accroître la protection de la vie privée et la confidentialité des informations numériques ». En conséquence, le neuvième circuit explique que « l'interdiction des accès non autorisés est bien comprise comme s'appliquant uniquement aux informations privées - les informations définies comme privées par le biais d'une autorisation quelconque ».

    En revanche, hiQ ne fait que « récolter » des informations des profils LinkedIn publics. Par définition, tout membre du public a l'autorisation d'accéder à ces informations. LinkedIn a fait valoir qu'il pouvait révoquer sélectivement cette autorisation en utilisant une lettre de cessation et d'abstention. Mais le 9ème circuit a trouvé cet argument peu convaincant. Ignorer une lettre de cessation et d'abstention n’est pas assimilable à du piratage informatique.

    Nom : linked.png
Affichages : 14579
Taille : 143,7 Ko

    LinkedIn ne peut pas interférer avec la collecte de données de hiQ

    La décision de lundi va au-delà de la conclusion que hiQ n'a pas violé les lois antipiratage. La cour d'appel a également confirmé une ordonnance d'un tribunal inférieur interdisant à LinkedIn d'interférer dans les activités de Web scraping de hiQ.

    HiQ affirme que si LinkedIn commençait à utiliser des mesures techniques pour empêcher hiQ de collecter des données des utilisateurs de LinkedIn, alors LinkedIn s'immiscerait dans les contrats de hiQ avec ses propres clients, qui s'appuient sur ces données. HiQ a noté que LinkedIn acceptait tacitement ses activités de collecte de données depuis plusieurs années, au point où LinkedIn envoyait des représentants à des conférences hiQ où hiQ expliquait ouvertement que ses produits étaient basés sur les données de LinkedIn.

    LinkedIn a fait valoir la nécessité de limiter la collecte de données pour protéger la vie privée de ses propres utilisateurs. Mais hiQ a rétorqué que les données n'appartenaient pas à LinkedIn, mais à ses utilisateurs, qui ont explicitement marqué les données comme étant publiques. HiQ ne collecte pas de données sur les profils LinkedIn non publics. HiQ indique également que LinkedIn n'a commencé à s'y opposer qu'au moment où LinkedIn a lancé ses propres outils d'analyse concurrençant ses offres.

    Tenant compte de tout cela, la cour d’appel a statué que hiQ avait de bonnes chances de prouver qu’elle avait le droit de continuer à collecter des données de LinkedIn pendant la bataille juridique. LinkedIn a encore des chances de l'emporter sur ce point et espère obtenir le droit de mettre en liste noire les outils de collecte de hiQ. Mais la cour d’appel a confirmé l’ordonnance de la juridiction inférieure selon laquelle LinkedIn devait attendre la fin de la procédure judiciaire avant de le faire. La cour a fait valoir que, dans le cas contraire, hiQ pourrait ne plus être en activité avant d’avoir la possibilité de clore le dossier.

    Source : décision de justice

    Et vous ?

    Que pensez-vous du Web scraping ?
    L'avez-vous déjà fait ?
    Le Web scraping sur des informations explicitement définies comme étant publiques doit-il être prohibé ? Pourquoi ?
    Que pensez-vous de l'affirmation de hiQ qui rappelle que ces données appartiennent aux utilisateurs LinkedIn et non à LinkedIn ?
    hiQ doit-il donc chercher à obtenir le consentement explicite de l'utilisateur ou ce consentement peut-être supposé dans la mesure où les informations sont définies comme étant publiques ?

    Voir aussi :

    Comment LinkedIn détecte les extensions installées sur votre navigateur, une découverte de Dan Andrews, développeur web chez Techstars
    Rumeur : Microsoft envisagerait d'acquérir la société de Freelance Upwork pour peut-être compléter l'offre de sa plateforme LinkedIn
    Le développeur Blockchain est l'emploi qui connaît la croissance la plus rapide ces 4 dernières années selon un rapport de LinkedIn
    LinkedIn s'est servi de 18 millions d'adresses mail de non-membres, à des fins de publicités ciblées sur Facebook
    Images attachées Images attachées
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  2. #2
    Membre expérimenté

    Homme Profil pro
    Privacy, EBusiness, Bases de données, Sécurité, ...
    Inscrit en
    novembre 2004
    Messages
    386
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations professionnelles :
    Activité : Privacy, EBusiness, Bases de données, Sécurité, ...
    Secteur : Service public

    Informations forums :
    Inscription : novembre 2004
    Messages : 386
    Points : 1 535
    Points
    1 535
    Par défaut
    Marre de ces réseaux sociaux qui communiquent à leur insu de leur plein gré les données de leur membres.
    Bientôt un nouveau scandale Cambridge Analytica & Linkedin ?

  3. #3
    Expert éminent sénior

    Avatar de Neckara
    Homme Profil pro
    Doctorant sécurité informatique — Diplômé master Droit/Économie/Gestion
    Inscrit en
    décembre 2011
    Messages
    8 050
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 26
    Localisation : France, Loire (Rhône Alpes)

    Informations professionnelles :
    Activité : Doctorant sécurité informatique — Diplômé master Droit/Économie/Gestion
    Secteur : Enseignement

    Informations forums :
    Inscription : décembre 2011
    Messages : 8 050
    Points : 20 335
    Points
    20 335
    Par défaut
    Citation Envoyé par Namica Voir le message
    Marre de ces réseaux sociaux qui communiquent à leur insu de leur plein gré les données de leur membres.
    Bientôt un nouveau scandale Cambridge Analytica & Linkedin ?
    Ce sont des données publiques dont il est question ici...
    "Parce que le diable est dans les détails, une vision sans nuance ne peut prétendre à la compréhension du monde."

    Mon ancienne page perso : https://neckara.developpez.com/

  4. #4
    Membre actif

    Homme Profil pro
    Responsable SI
    Inscrit en
    mars 2004
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Côte d'Or (Bourgogne)

    Informations professionnelles :
    Activité : Responsable SI

    Informations forums :
    Inscription : mars 2004
    Messages : 185
    Points : 290
    Points
    290
    Par défaut Une pratique courante depuis des années !
    Dans le milieu du web et depuis qu'existent les MFA ("Made for Adsense" ou "Made for advertising", un acronyme désignant tous les sites destinés à rémunérer leur auteur via la pub, et plus particulièrement via la régie de Google) c'est une pratique extrêmement courante, qui permet notamment de générer des contenus à partir des sites concurrents.

    Comment croyez-vous que d'innombrables annuaires professionnels ont vu le jour au fil des années ? Avant l'essor de data.gouv.fr (qui "offre" de la data gratuitement) les techniques consistaient à aller scraper un ou plusieurs concurrents, assainir les données et les rebalancer dans un site tout frais.

    Je l'ai fait dans le passé dans un domaine bien précis, ce qui m'a rapporté jusqu'à quelques centaines d'euros par mois de revenus publicitaires.

    Aujourd'hui, c'est une technique que j'utilise pour l'essentiel pour faire du benchmarking. Couplé à un outil de recherche par similarité, ça permet d'établir avec des ratios ± corrects, un rapprochement des prix de la concurrence sur notre catalogue produit (il est rare que les revendeurs mettent les réf. fabricant en ligne d'où la recherche par similarité sur les désignations, avec vérif manuelle derrière) ; les données sont visibles manuellement, le webscraping ne fait qu'automatiser la collecte, rien de plus.
    Mouton à 5 pattes. Ma spécialité : la transformation de flux de données...

  5. #5
    Membre émérite
    Avatar de DelphiManiac
    Homme Profil pro
    Homme à tout faire
    Inscrit en
    mars 2002
    Messages
    1 124
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Homme à tout faire
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : mars 2002
    Messages : 1 124
    Points : 2 428
    Points
    2 428
    Par défaut
    Déclarer illégal la collecte et l'analyse de données publiques reviendrait à rendre illégaux les moteurs de recherche.

    Ça risque d'être compliqué ^^
    Si ce message vous a semblé utile, il est possible qu'il soit utile à d'autres personnes. Pensez au . Et n'oubliez pas le le moment venu !

    On n'a pas à choisir si l'on est pour ou contre la décroissance, elle est inéluctable, elle arrivera qu'on le veuille ou non.

  6. #6
    Membre éprouvé Avatar de petitours
    Homme Profil pro
    Ingénieur développement matériel électronique
    Inscrit en
    février 2003
    Messages
    1 478
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Savoie (Rhône Alpes)

    Informations professionnelles :
    Activité : Ingénieur développement matériel électronique
    Secteur : Industrie

    Informations forums :
    Inscription : février 2003
    Messages : 1 478
    Points : 963
    Points
    963
    Par défaut
    Mais qu'est ce que ce non sujet ?

    si elles sont publiques les données, elles sont publiques...

    C'est comme si on mettait un procès à celui qui accède à data.gouv.fr ou celui qui va lire le journal en ligne
    Il y a 10 sortes de personnes dans le monde : ceux qui comprennent le binaire et les autres

  7. #7
    Membre du Club
    Avatar de Aiigl59
    Homme Profil pro
    Inscrit en
    janvier 2008
    Messages
    38
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations professionnelles :
    Secteur : High Tech - Électronique et micro-électronique

    Informations forums :
    Inscription : janvier 2008
    Messages : 38
    Points : 68
    Points
    68
    Billets dans le blog
    1
    Par défaut What else ?
    Bonjour,

    Tout à fait d'accord avec la décision de justice. Il est du devoir de chacun de ne PAS mettre ses données en accès public si on ne veut pas qu'un tiers les utilise...

    C'est juste une question de bon sens et de responsabilité "minimum".

    En d'autres termes, si je ne veut pas me retrouver "nu" un beau matin et bien je ne mettrai tout simplement PAS les accès à mon compte en banque en données publiques. ça tombe simplement sous le sens non ?

    M'enfin...

  8. #8
    Membre émérite
    Avatar de DelphiManiac
    Homme Profil pro
    Homme à tout faire
    Inscrit en
    mars 2002
    Messages
    1 124
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Homme à tout faire
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : mars 2002
    Messages : 1 124
    Points : 2 428
    Points
    2 428
    Par défaut
    Données accessible publiquement ne veut pas automatiquement dire : libre de droit.

    Un article sur un média d'information est accessible publiquement et pourtant tu n'as pas le droit de le reproduire et de l'utiliser tel quel. Il y a bien une notion de droit.
    Si ce message vous a semblé utile, il est possible qu'il soit utile à d'autres personnes. Pensez au . Et n'oubliez pas le le moment venu !

    On n'a pas à choisir si l'on est pour ou contre la décroissance, elle est inéluctable, elle arrivera qu'on le veuille ou non.

Discussions similaires

  1. Réponses: 1
    Dernier message: 17/08/2017, 09h38
  2. Collecter des informations sur les SSII
    Par bejaouizied dans le forum SSII
    Réponses: 27
    Dernier message: 04/10/2014, 11h10
  3. Réponses: 4
    Dernier message: 22/02/2010, 15h36
  4. Collecte des metrics sur les objets invalides
    Par meufeu dans le forum Administration
    Réponses: 0
    Dernier message: 14/01/2010, 11h18

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo