Les informations sensibles de près de 3 milliards de personnes auraient été divulguées sur le dark Web

**Stéphane le calme** · 10/09/2019, 18h13

LinkedIn ne parvient pas à restreindre la collecte d'informations sur les profils publics de ses membres,
la Cour estime que cette activité n'est pas illégale

Le web scraping est une technique permettant l'extraction des données d'un site via un programme, un logiciel automatique ou un autre site. L'objectif est donc d'extraire le contenu d'une page d'un site de façon structurée. Le scraping permet ainsi de pouvoir réutiliser ces données.

Faire du web scraping sur un site Web public sans l'approbation du propriétaire du site Web ne constitue pas une violation de la loi sur les fraudes et les abus informatiques, a estimé une cour d'appel américaine lundi. La décision intervient dans une bataille juridique qui oppose LinkedIn, une société appartenant à Microsoft, à une petite société d'analyse de données appelée hiQ Labs.

HiQ effectue du web scraping de profils publics des utilisateurs de LinkedIn, puis les utilise pour aider les entreprises à mieux comprendre leurs propres effectifs. Après avoir toléré les activités de web scraping de hiQ pendant plusieurs années, LinkedIn a envoyé à la société une lettre de cessation et d'abstention en 2017 lui demandant de cesser de collecter des données à partir de profils LinkedIn. LinkedIn a notamment fait valoir que hiQ violait la Computer Fraud and Abuse Act, la principale loi antipiratage des États-Unis.

La Computer Fraud and Abuse Act (CFAA) est une loi du gouvernement fédéral américain mise en vigueur en 1986 qui porte sur la sécurité des systèmes d'information. Il s'agit d'un amendement à une loi sur les fraudes informatiques qui fait maintenant partie du Comprehensive Crime Control Act of 1984. Cette loi interdit tout accès à un ordinateur sans autorisation préalable ou tout accès qui excède les autorisations.

Cela représentait une menace existentielle pour hiQ car le site Web de LinkedIn est la principale source de données de hiQ sur les employés de ses clients. HiQ a donc poursuivi LinkedIn en justice, cherchant non seulement à déclarer que ses activités de web scraping ne constituaient pas un piratage, mais également une ordonnance interdisant à LinkedIn d’interférer.

Un tribunal de première instance s’est rangé du côté de hiQ en 2017. Lundi, la Cour d’appel du 9^e circuit a entériné la décision de la juridiction inférieure, estimant que la loi sur la fraude et les abus informatiques ne s’appliquait tout simplement pas aux informations accessibles au grand public.

« La CFAA a été promulguée pour empêcher toute intrusion intentionnelle dans l'ordinateur de quelqu'un d'autre, notamment le piratage informatique », a écrit un panel de trois juges. La cour a noté que lorsque les législateurs débattaient de cette loi, des analogies avec des crimes physiques tels que l'introduction par effraction ont été faites à plusieurs reprises. Du point de vue du neuvième circuit, cela implique que la CFAA ne s’applique qu’aux systèmes d’information ou informatiques qui étaient au départ privés, ce que les propriétaires de sites Web signalent généralement avec un mot de passe.

La cour note que, lorsque la CFAA a été adoptée, dans les années 80, elle ne s'appliquait qu'à certaines catégories d'ordinateurs contenant des données militaires, financières ou autres.

« Aucun des ordinateurs auxquels la CFAA avait initialement été appliquée n'était accessible au grand public », écrit le tribunal. « Une autorisation affirmative quelconque était présumément requise ».

Lorsque la loi a été étendue à un plus grand nombre d'ordinateurs en 1996, un rapport du Sénat a déclaré que son objectif était « d'accroître la protection de la vie privée et la confidentialité des informations numériques ». En conséquence, le neuvième circuit explique que « l'interdiction des accès non autorisés est bien comprise comme s'appliquant uniquement aux informations privées - les informations définies comme privées par le biais d'une autorisation quelconque ».

En revanche, hiQ ne fait que « récolter » des informations des profils LinkedIn publics. Par définition, tout membre du public a l'autorisation d'accéder à ces informations. LinkedIn a fait valoir qu'il pouvait révoquer sélectivement cette autorisation en utilisant une lettre de cessation et d'abstention. Mais le 9^ème circuit a trouvé cet argument peu convaincant. Ignorer une lettre de cessation et d'abstention n’est pas assimilable à du piratage informatique.

Nom : linked.png
Affichages : 22339
Taille : 143,7 Ko

LinkedIn ne peut pas interférer avec la collecte de données de hiQ

La décision de lundi va au-delà de la conclusion que hiQ n'a pas violé les lois antipiratage. La cour d'appel a également confirmé une ordonnance d'un tribunal inférieur interdisant à LinkedIn d'interférer dans les activités de Web scraping de hiQ.

HiQ affirme que si LinkedIn commençait à utiliser des mesures techniques pour empêcher hiQ de collecter des données des utilisateurs de LinkedIn, alors LinkedIn s'immiscerait dans les contrats de hiQ avec ses propres clients, qui s'appuient sur ces données. HiQ a noté que LinkedIn acceptait tacitement ses activités de collecte de données depuis plusieurs années, au point où LinkedIn envoyait des représentants à des conférences hiQ où hiQ expliquait ouvertement que ses produits étaient basés sur les données de LinkedIn.

LinkedIn a fait valoir la nécessité de limiter la collecte de données pour protéger la vie privée de ses propres utilisateurs. Mais hiQ a rétorqué que les données n'appartenaient pas à LinkedIn, mais à ses utilisateurs, qui ont explicitement marqué les données comme étant publiques. HiQ ne collecte pas de données sur les profils LinkedIn non publics. HiQ indique également que LinkedIn n'a commencé à s'y opposer qu'au moment où LinkedIn a lancé ses propres outils d'analyse concurrençant ses offres.

Tenant compte de tout cela, la cour d’appel a statué que hiQ avait de bonnes chances de prouver qu’elle avait le droit de continuer à collecter des données de LinkedIn pendant la bataille juridique. LinkedIn a encore des chances de l'emporter sur ce point et espère obtenir le droit de mettre en liste noire les outils de collecte de hiQ. Mais la cour d’appel a confirmé l’ordonnance de la juridiction inférieure selon laquelle LinkedIn devait attendre la fin de la procédure judiciaire avant de le faire. La cour a fait valoir que, dans le cas contraire, hiQ pourrait ne plus être en activité avant d’avoir la possibilité de clore le dossier.

Source : décision de justice

Et vous ?

Que pensez-vous du Web scraping ?

L'avez-vous déjà fait ?

Le Web scraping sur des informations explicitement définies comme étant publiques doit-il être prohibé ? Pourquoi ?

Que pensez-vous de l'affirmation de hiQ qui rappelle que ces données appartiennent aux utilisateurs LinkedIn et non à LinkedIn ?

hiQ doit-il donc chercher à obtenir le consentement explicite de l'utilisateur ou ce consentement peut-être supposé dans la mesure où les informations sont définies comme étant publiques ?

Voir aussi :

Comment LinkedIn détecte les extensions installées sur votre navigateur, une découverte de Dan Andrews, développeur web chez Techstars

Rumeur : Microsoft envisagerait d'acquérir la société de Freelance Upwork pour peut-être compléter l'offre de sa plateforme LinkedIn

Le développeur Blockchain est l'emploi qui connaît la croissance la plus rapide ces 4 dernières années selon un rapport de LinkedIn

LinkedIn s'est servi de 18 millions d'adresses mail de non-membres, à des fins de publicités ciblées sur Facebook

**Namica** · 11/09/2019, 02h41

Marre de ces réseaux sociaux qui communiquent à leur insu de leur plein gré les données de leur membres.
Bientôt un nouveau scandale Cambridge Analytica & Linkedin ?

**Neckara** · 11/09/2019, 07h05

Envoyé par Namica

Marre de ces réseaux sociaux qui communiquent à leur insu de leur plein gré les données de leur membres.
Bientôt un nouveau scandale Cambridge Analytica & Linkedin ?

Ce sont des données publiques dont il est question ici...

**xXxNeWgEnErAtIoN** · 30/01/2020, 07h34

Envoyé par Neckara

Ce sont des données publiques dont il est question ici...

Et alors ? C'est pas parce qu'elles sont publiques qu'elles devraient être libre de droits.

J'adore les informaticiens qui protègent leurs projets avec des licences toutes plus folles les unes que les autres, par contre sur les données alors nan tout le monde peut y toucher.

Juste que quand ça vous arrange on vous entend beaucoup moins.

**Vulcania** · 30/01/2020, 09h04

Envoyé par xXxNeWgEnErAtIoN

Et alors ? C'est pas parce qu'elles sont publiques qu'elles devraient être libre de droits.

J'adore les informaticiens qui protègent leurs projets avec des licences toutes plus folles les unes que les autres, par contre sur les données alors nan tout le monde peut y toucher.

Juste que quand ça vous arrange on vous entend beaucoup moins.

Non pas que je prône le non droit sur les données, mais à partir du moment où tu les laisses sur la place publique, il n'y a plus de contrôle possible. Et c'est pas comme si les utilisateurs ne pouvaient pas bloquer ces accès, et LinkedIn était au courant et y participait depuis des années.

Et j'aime bien entendre que les "informaticiens" sont juste des hypocrites, alors qu'une vaste majorité des technologies permettant d'envoyer ton message sont open source...

**xXxNeWgEnErAtIoN** · 30/01/2020, 12h07

Envoyé par Vulcania

Non pas que je prône le non droit sur les données, mais à partir du moment où tu les laisses sur la place publique, il n'y a plus de contrôle possible. Et c'est pas comme si les utilisateurs ne pouvaient pas bloquer ces accès, et LinkedIn était au courant et y participait depuis des années.

Et j'aime bien entendre que les "informaticiens" sont juste des hypocrites, alors qu'une vaste majorité des technologies permettant d'envoyer ton message sont open source...

Ton argument ne tient pas, certains projets sont accessibles depuis git hub par exemple.

Ça reste des données accessibles au publique. Pourtant ya toujours une licence pourrie en haut du fichier.

**cedric_g** · 11/09/2019, 12h04

Dans le milieu du web et depuis qu'existent les MFA ("Made for Adsense" ou "Made for advertising", un acronyme désignant tous les sites destinés à rémunérer leur auteur via la pub, et plus particulièrement via la régie de Google) c'est une pratique extrêmement courante, qui permet notamment de générer des contenus à partir des sites concurrents.

Comment croyez-vous que d'innombrables annuaires professionnels ont vu le jour au fil des années ? Avant l'essor de data.gouv.fr (qui "offre" de la data gratuitement) les techniques consistaient à aller scraper un ou plusieurs concurrents, assainir les données et les rebalancer dans un site tout frais.

Je l'ai fait dans le passé dans un domaine bien précis, ce qui m'a rapporté jusqu'à quelques centaines d'euros par mois de revenus publicitaires.

Aujourd'hui, c'est une technique que j'utilise pour l'essentiel pour faire du benchmarking. Couplé à un outil de recherche par similarité, ça permet d'établir avec des ratios ± corrects, un rapprochement des prix de la concurrence sur notre catalogue produit (il est rare que les revendeurs mettent les réf. fabricant en ligne d'où la recherche par similarité sur les désignations, avec vérif manuelle derrière) ; les données sont visibles manuellement, le webscraping ne fait qu'automatiser la collecte, rien de plus.

**DelphiManiac** · 11/09/2019, 16h47

Déclarer illégal la collecte et l'analyse de données publiques reviendrait à rendre illégaux les moteurs de recherche.

Ça risque d'être compliqué ^^

**petitours** · 13/09/2019, 16h24

Mais qu'est ce que ce non sujet ?

si elles sont publiques les données, elles sont publiques...

C'est comme si on mettait un procès à celui qui accède à data.gouv.fr ou celui qui va lire le journal en ligne

**Aiigl59** · 13/09/2019, 22h15

Bonjour,

Tout à fait d'accord avec la décision de justice. Il est du devoir de chacun de ne PAS mettre ses données en accès public si on ne veut pas qu'un tiers les utilise...

C'est juste une question de bon sens et de responsabilité "minimum".

En d'autres termes, si je ne veut pas me retrouver "nu" un beau matin et bien je ne mettrai tout simplement PAS les accès à mon compte en banque en données publiques. ça tombe simplement sous le sens non ?

M'enfin...

**DelphiManiac** · 14/09/2019, 00h03

Données accessible publiquement ne veut pas automatiquement dire : libre de droit.

Un article sur un média d'information est accessible publiquement et pourtant tu n'as pas le droit de le reproduire et de l'utiliser tel quel. Il y a bien une notion de droit.

**petitours** · 14/10/2019, 20h47

Envoyé par DelphiManiac

Données accessible publiquement ne veut pas automatiquement dire : libre de droit.

Un article sur un média d'information est accessible publiquement et pourtant tu n'as pas le droit de le reproduire et de l'utiliser tel quel. Il y a bien une notion de droit.

Ne serait ce pas juste la création artistique qui est protégée ici ? si on ne peut pas reproduire l'article du média d'information on peut bien faire ce que l'on veut de l'information en question.

Si ce modèle là on pourrait imaginer que Facebook ou Linkedin ont une forme création artistique

mais au final l'information publique qui est dans le contenu, la vie des gens qu'ils ont bien voulu raconter, a aucune forme de création associée.

**Stéphane le calme** · 14/10/2019, 18h37

Une Cour de justice estime qu'il n'est pas illégal de collecter des données publiques d'un site
pour les utiliser dans ses activités

HiQ effectue du web scraping de profils publics des utilisateurs de LinkedIn, puis les utilise pour aider les entreprises à mieux comprendre leurs propres effectifs. Le web scraping est une technique permettant l'extraction des données d'un site via un programme, un logiciel automatique ou un autre site. L'objectif est donc d'extraire le contenu d'une page d'un site de façon structurée. Le scraping permet ainsi de pouvoir réutiliser ces données.

Après avoir toléré les activités de web scraping de hiQ pendant plusieurs années, LinkedIn a envoyé à la société une lettre de cessation et d'abstention en 2017 lui demandant de cesser de collecter des données à partir de profils LinkedIn. LinkedIn a notamment fait valoir que hiQ violait la Computer Fraud and Abuse Act, la principale loi antipiratage des États-Unis.

La Computer Fraud and Abuse Act (CFAA) est une loi du gouvernement fédéral américain mise en vigueur en 1986 qui porte sur la sécurité des systèmes d'information. Il s'agit d'un amendement à une loi sur les fraudes informatiques qui fait maintenant partie du Comprehensive Crime Control Act of 1984. Cette loi interdit tout accès à un ordinateur sans autorisation préalable ou tout accès qui excède les autorisations.

Cela représentait une menace existentielle pour hiQ car le site Web de LinkedIn est la principale source de données de hiQ sur les employés de ses clients. HiQ a donc poursuivi LinkedIn en justice, cherchant non seulement à déclarer que ses activités de web scraping ne constituaient pas un piratage, mais également une ordonnance interdisant à LinkedIn d’interférer.

Nom : linked.png
Affichages : 4271
Taille : 143,7 Ko

hiQ n'a pas violé les lois antipiratage

Un tribunal de première instance s’est rangé du côté de hiQ en 2017. Début septembre 2019, la Cour d’appel du 9^e circuit a entériné la décision de la juridiction inférieure, estimant que la loi sur la fraude et les abus informatiques ne s’appliquait tout simplement pas aux informations accessibles au grand public.

« La CFAA a été promulguée pour empêcher toute intrusion intentionnelle dans l'ordinateur de quelqu'un d'autre, notamment le piratage informatique », a écrit un panel de trois juges. La cour a noté que lorsque les législateurs débattaient de cette loi, des analogies avec des crimes physiques tels que l'introduction par effraction ont été faites à plusieurs reprises. Du point de vue du neuvième circuit, cela implique que la CFAA ne s’applique qu’aux systèmes d’information ou informatiques qui étaient au départ privés, ce que les propriétaires de sites Web signalent généralement avec un mot de passe.

La cour a rappelé que, lorsque la CFAA a été adoptée, dans les années 80, elle ne s'appliquait qu'à certaines catégories d'ordinateurs contenant des données militaires, financières ou autres.

« Aucun des ordinateurs auxquels la CFAA avait initialement été appliquée n'était accessible au grand public », a écrit le tribunal. « Une autorisation affirmative quelconque était vraisemblablement requise ».

Lorsque la loi a été étendue à un plus grand nombre d'ordinateurs en 1996, un rapport du Sénat a déclaré que son objectif était « d'accroître la protection de la vie privée et la confidentialité des informations numériques ». En conséquence, le neuvième circuit explique que « l'interdiction des accès non autorisés est bien comprise comme s'appliquant uniquement aux informations privées - les informations définies comme privées par le biais d'une autorisation quelconque ».

En revanche, hiQ ne fait que « récolter » des informations des profils LinkedIn publics. Par définition, tout membre du public a l'autorisation d'accéder à ces informations. LinkedIn a fait valoir qu'il pouvait révoquer sélectivement cette autorisation en utilisant une lettre de cessation et d'abstention. Mais le 9e circuit a trouvé cet argument peu convaincant. Ignorer une lettre de cessation et d'abstention n’est pas assimilable à du piratage informatique.

Nom : in.png
Affichages : 3013
Taille : 264,0 Ko

LinkedIn invité à ne pas interférer dans les activités de Web scraping de hiQ pendant la bataille juridique

La cour d'appel a également confirmé une ordonnance d'un tribunal inférieur interdisant à LinkedIn d'interférer dans les activités de Web scraping de hiQ.

HiQ affirme que si LinkedIn commençait à utiliser des mesures techniques pour empêcher hiQ de collecter des données des utilisateurs de LinkedIn, alors LinkedIn s'immiscerait dans les contrats de hiQ avec ses propres clients, qui s'appuient sur ces données. HiQ a noté que LinkedIn acceptait tacitement ses activités de collecte de données depuis plusieurs années, au point où LinkedIn envoyait des représentants à des conférences hiQ où hiQ expliquait ouvertement que ses produits étaient basés sur les données de LinkedIn.

LinkedIn a fait valoir la nécessité de limiter la collecte de données pour protéger la vie privée de ses propres utilisateurs. Mais hiQ a rétorqué que les données n'appartenaient pas à LinkedIn, mais à ses utilisateurs, qui ont explicitement marqué les données comme étant publiques. HiQ ne collecte pas de données sur les profils LinkedIn non publics. HiQ indique également que LinkedIn n'a commencé à s'y opposer qu'au moment où LinkedIn a lancé ses propres outils d'analyse concurrençant ses offres.

Nom : hiq-affarsvarlden-700-394.jpg
Affichages : 2900
Taille : 9,1 Ko

Le verdict final

La 9^e Cour d’appel du circuit des États-Unis a confirmé l’injonction préliminaire d’août 2017 exigeant que LinkedIn, une unité de Microsoft Corp comptant plus de 645 millions de membres, permette à hiQ Labs Inc d’avoir accès aux profils de membres disponibles au public. La décision à l'unanimité de la cour d’appel de San Francisco a penché en faveur de hiQ sur la question du Web scraping qui, selon les critiques, peut être assimilé à un vol ou à la violation de la vie privée des utilisateurs.

Marsha Berzon, juge de circuit, a déclaré que hiQ a fait savoir qu'il faisait face à un préjudice irréparable en l'absence d'injonction, car il risquait de fermer ses portes s'il se voyait bloquer l'accès. Elle a également déclaré que donner à des entreprises telles que LinkedIn la liberté de choisir qui peut utiliser les données publiques des utilisateurs risquait de créer des « monopoles de l'information » préjudiciables à l'intérêt public.

« LinkedIn n'a aucun intérêt de propriété protégée dans les données fournies par ses utilisateurs, car les utilisateurs conservent la propriété de leurs profils », a écrit Berzon. « Et en ce qui concerne les profils accessibles au public, les utilisateurs souhaitent bien évidemment que d'autres puissent y accéder », y compris les employeurs potentiels.

Dans un communiqué, LinkedIn s'est dit déçu de la décision et de l'évaluation de ses options et a affirmé avoir l'intention de se battre « pour protéger nos membres et les informations qu'ils nous confient ». Craigslist, le site Web de petites annonces, avait soutenu l'appel de LinkedIn, avertissant que l'injonction pourrait avoir un « impact dangereux » en permettant aux « mauvais acteurs » de trouver plus facilement des cibles pour le marketing par courrier électronique, par SMS ou par téléphone.

Berzon a toutefois précisé que hiQ avait soulevé de sérieuses questions sur la conduite de LinkedIn, notamment sur le fait de savoir s'il pouvait invoquer une loi fédérale contre la fraude et les abus informatiques pour empêcher les « utilisateurs clandestins » d'accéder aux données des utilisateurs. « Bien sûr, LinkedIn pourrait répondre à sa préoccupation concernant les "utilisateurs clandestins" en supprimant l’option d’accès public, même si cela a un coût pour les préférences de nombreux utilisateurs et, éventuellement, pour ses propres résultats », a-t-elle écrit.

Source : Reuters

Et vous ?

Que pensez-vous du Web scraping ? L'avez-vous déjà fait ?

Le Web scraping sur des informations explicitement définies comme étant publiques doit-il être prohibé ? Pourquoi ?

Que pensez-vous de l'affirmation de hiQ qui rappelle que ces données appartiennent aux utilisateurs LinkedIn et non à LinkedIn ?

hiQ doit-il donc chercher à obtenir le consentement explicite de l'utilisateur ou ce consentement peut-être supposé dans la mesure où les informations sont définies comme étant publiques ?

**petitours** · 14/10/2019, 21h05

Envoyé par Stéphane le calme

hiQ doit-il donc chercher à obtenir le consentement explicite de l'utilisateur ou ce consentement peut-être supposé dans la mesure où les informations sont définies comme étant publiques ?

La notion de consentement explicite est une fourberie absolue. Il n'y a pas 1/1000 utilisateur du web dans le monde qui lit ce qu'il coche et pas 1/20000 qui comprend ce qu'il lit quand il lit un message juridique. De plus les gros ont des armées de juristes qui contournent ça joyeusement et au final on donne des droits explicites au yeux de la loi pour des choses que l'on refuse absolument.
En gros ce truc de l’explicite c'est aussi efficace que de demander à un anglais s'il veut ou pas quitter l’Europe pour économiser 25milliards de livres que l’Angleterre paierait à l’Europe chaque jour.
Autre exemple plus informatique, j'ai découvert hier que AirBnb avait sauvegardé 2 carte bancaires alors que par principe je dis systématiquement non à ce genre de question, il est certain à 200% que je ne leur ai jamais donné une autorisation explicite pour faire ça et pourtant je ne doute pas une seconde de leur conformité avec la loi.
Bref, la demande d'autorisation explicite c'est ridicule. De plus si un utilisateur de Linkedin qui publie des choses sur le réseau social n'est pas d'accord pour que ses données soient utilisées à quoi ça rimerait ? Il serait juste aussi idiot que l'utilisateur de Facebook qui veut pas qu'on lui envoi de la pub ciblée...

Mon point de vue c'est que la loi devrait interdire toute utilisation des données autre que ce pourquoi elles ont été donné au départ, autorisation explicite ou pas de l'utilisateur.
>Tu donnes tes coordonnées pour te faire livrer un truc, on ne peut t'envoyer de la pub avec.
>Ici sur linkedin, tu mets des infos pour développer ton business ou ta carrière, on ne peut pas en faire autre chose. Si HiQ permet à un employeur de proposer le poste de ses rêves à un employé, tant mieux

Si HiQ permet à l'employeur de comprendre que tous ses employés se font suer à leur poste et corrige le tir, tant mieux.

Si HiQ permet à des employeurs de trouver des arguments pour mieux licencier un employé

**matthius** · 14/10/2019, 21h49

La réalité est que nos dirigeants passent leur temps à copier la population pour eux-même. On leur explique ce principe avec la théorie des jeux.

Ainsi le Huffington Post a osé copier-coller les sites web et blogs créatifs en changeant les mots, ce que nos politicens médiocres ont accepté, ayant par ailleurs eux-mêmes peur des créatifs.

**Stéphane le calme** · 30/01/2020, 07h27

Une décision de justice US a légalisé la collecte des données publiques d'un site pour les utiliser dans ses activités,
certains sites veulent se protéger en y mettant des moyens techniques

Le web scraping est une technique permettant l'extraction des données d'un site via un programme, un logiciel automatique ou un autre site. L'objectif est donc d'extraire le contenu d'une page d'un site de façon structurée. Le scraping permet ainsi de pouvoir réutiliser ces données. L'année dernière, la 9^e cour d'appel des États-Unis a jugé que le web scraping de sites Web ne violait pas la CFAA (Computer Fraud and Abuse Act).

La décision est intervenue dans une bataille juridique qui a opposé LinkedIn, une société appartenant à Microsoft, à une petite société d'analyse de données appelée hiQ Labs.

HiQ effectue du web scraping de profils publics des utilisateurs de LinkedIn, puis les utilise pour aider les entreprises à mieux comprendre leurs propres effectifs. Après avoir toléré les activités de web scraping de hiQ pendant plusieurs années, LinkedIn a envoyé à la société une lettre de cessation et d'abstention en 2017 lui demandant de cesser de collecter des données à partir de profils LinkedIn. LinkedIn a notamment fait valoir que hiQ violait la Computer Fraud and Abuse Act, la principale loi antipiratage des États-Unis.

La Computer Fraud and Abuse Act (CFAA) est une loi du gouvernement fédéral américain mise en vigueur en 1986 qui porte sur la sécurité des systèmes d'information. Il s'agit d'un amendement à une loi sur les fraudes informatiques qui fait maintenant partie du Comprehensive Crime Control Act of 1984. Cette loi interdit tout accès à un ordinateur sans autorisation préalable ou tout accès qui excède les autorisations.

Cela représentait une menace existentielle pour hiQ car le site Web de LinkedIn est la principale source de données de hiQ sur les employés de ses clients. HiQ a donc poursuivi LinkedIn en justice, cherchant non seulement à déclarer que ses activités de web scraping ne constituaient pas un piratage, mais également une ordonnance interdisant à LinkedIn d’interférer.

Un tribunal de première instance s’est rangé du côté de hiQ en 2017. Puis en 2019, la Cour d’appel du 9^e circuit a entériné la décision de la juridiction inférieure, estimant que la loi sur la fraude et les abus informatiques ne s’appliquait tout simplement pas aux informations accessibles au grand public.

« La CFAA a été promulguée pour empêcher toute intrusion intentionnelle dans l'ordinateur de quelqu'un d'autre, notamment le piratage informatique », a écrit un panel de trois juges. La cour a noté que lorsque les législateurs débattaient de cette loi, des analogies avec des crimes physiques tels que l'introduction par effraction ont été faites à plusieurs reprises. Du point de vue du neuvième circuit, cela implique que la CFAA ne s’applique qu’aux systèmes d’information ou informatiques qui étaient au départ privés, ce que les propriétaires de sites Web signalent généralement avec un mot de passe.

La cour a noté que, lorsque la CFAA a été adoptée, dans les années 80, elle ne s'appliquait qu'à certaines catégories d'ordinateurs contenant des données militaires, financières ou autres. « Aucun des ordinateurs auxquels la CFAA avait initialement été appliquée n'était accessible au grand public », écrit le tribunal. « Une autorisation affirmative quelconque était présumément requise ».

Lorsque la loi a été étendue à un plus grand nombre d'ordinateurs en 1996, un rapport du Sénat a déclaré que son objectif était « d'accroître la protection de la vie privée et la confidentialité des informations numériques ». En conséquence, le neuvième circuit explique que « l'interdiction des accès non autorisés est bien comprise comme s'appliquant uniquement aux informations privées - les informations définies comme privées par le biais d'une autorisation quelconque ».

Nom : linkedIn.png
Affichages : 3487
Taille : 125,4 Ko

HiQ a noté que LinkedIn acceptait tacitement ses activités de collecte de données depuis plusieurs années, au point où LinkedIn envoyait des représentants à des conférences hiQ où hiQ expliquait ouvertement que ses produits étaient basés sur les données de LinkedIn.

LinkedIn a fait valoir la nécessité de limiter la collecte de données pour protéger la vie privée de ses propres utilisateurs. Mais hiQ a rétorqué que les données n'appartenaient pas à LinkedIn, mais à ses utilisateurs, qui ont explicitement marqué les données comme étant publiques. HiQ ne collecte pas de données sur les profils LinkedIn non publics. HiQ indique également que LinkedIn n'a commencé à s'y opposer qu'au moment où LinkedIn a lancé ses propres outils d'analyse concurrençant ses offres.

Les retombées de la jurisprudence

Il s'agit d'une décision vraiment importante. Le tribunal a non seulement légalisé cette pratique, mais a également interdit aux concurrents de faire supprimer automatiquement les informations d'un site si le site est public. Le tribunal a confirmé la logique claire que l'entrée du bot de web scraping n'est pas juridiquement différente de l'entrée du navigateur. Dans les deux cas, « l'utilisateur » demande des données ouvertes.

Désormais, de nombreux propriétaires de sites tentent de mettre des obstacles techniques aux concurrents qui copient complètement leurs informations qui ne sont pas protégées par le droit d'auteur. Par exemple, les prix des billets, les lots de produits, les profils d'utilisateurs ouverts, etc. Certains sites considèrent que ces informations sont « les leurs » et considèrent le web scraping comme un « vol ». Légalement, le cas qui a opposé LinkedIn à hiQ peut faire office de jurisprudence aux États-Unis.

Lorsque la cour d'appel a confirmé une décision d'un tribunal inférieur qui interdit à LinkedIn d'interférer avec le web scraping de son site Web par hiQ, cela a modifié fondamentalement l'équilibre des pouvoirs dans le traitement de tels cas à l'avenir.

C'est peut-être une caractéristique spécifique de la législation américaine. Dans ce cas, hiQ a fait valoir que les mesures techniques de LinkedIn pour bloquer le scraping Web interfèrent avec les contrats de hiQ avec ses propres clients qui s'appuient sur ces données. Dans le jargon juridique, cela s'appelle « une ingérence malveillante dans un contrat », ce qui est interdit par la loi américaine.

En Russie, la protection de votre site contre les bots, y compris ceux qui effectuent du web scraping, est considérée comme une pratique normale, même si le propriétaire du site ne possède pas de droits de propriété intellectuelle sur les informations publiées (par exemple, les profils utilisateur).

Source : décision de justice

Et vous ?

Que pensez-vous du web scraping ?

Quelles seraient, selon vous, les retombées de la décision de justice opposant hiQ à LinkedIn ?

Quelle est la position de la législation française à ce sujet ?

**walfrat** · 30/01/2020, 09h10

Le problème ça reste surtout pourquoi ils font ça ? J'ai pas spécialement envie que chacune de mes activités sur le net, même publiés sous mon vrai nom, atterrisse directement dans la boîte mail des RH et de mon manager grâce à la magie du web scraping et de l'analyse de données.

Après franchement, comme dit dans l'article, LinkedIn n'a lancé cette bataille judiciaire que quand il a commencé à lancer ces propres outils alors que jusqu'ici il collaborait ouvertement avec hiQ. J'imagine que quand tu utilises un tribunal pour ce genre de coup bas, certains juges peuvent ne pas apprécier. D'autant que côté USA, le nombre de procès qu'il y a eu juste pour couler des petites structures le temps du procès, ça ne manque pas.

**Edrixal** · 30/01/2020, 09h58

Envoyé par walfrat

Le problème ça reste surtout pourquoi ils font ça ? J'ai pas spécialement envie que chacune de mes activités sur le net, même publiés sous mon vrai nom, atterrisse directement dans la boîte mail des RH et de mon manager grâce à la magie du web scraping et de l'analyse de données.

Après franchement, comme dit dans l'article, LinkedIn n'a lancé cette bataille judiciaire que quand il a commencé à lancer ces propres outils alors que jusqu'ici il collaborait ouvertement avec hiQ. J'imagine que quand tu utilises un tribunal pour ce genre de coup bas, certains juges peuvent ne pas apprécier. D'autant que côté USA, le nombre de procès qu'il y a eu juste pour couler des petites structures le temps du procès, ça ne manque pas.

Parce que tu crois que les RH ne vont pas scruter tes comptes sur les réseaux sociaux ?

J'ai eu un ami qui n'arrivais pas à trouver un boulot ou à en garder un au delà de la période d’essais. Bizarrement une fois qu'il à nettoyer ses comptes de toutes les photos de soirée des propos raciste et qu'il à privatiser la visibilité de sont FB, il à enfin pu décrocher un CDI.
Coïncidence peut être, ou peut être tout simplement que les employeurs fouille autant que possible la vie de leur employés.

C'est à toi de maitriser au mieux ce que tu laisse comme trace sur le net si tu veut pas être traquer de partout et que ta vie internet ne soit rendu publique. Ses entreprises ne font que profité de ce que tu leur offre gracieusement.

**lsbkf** · 30/01/2020, 10h54

Envoyé par Edrixal

Parce que tu crois que les RH ne vont pas scruter tes comptes sur les réseaux sociaux ?

Il y a des gens qui ont le même nom + prénom que moi sur internet. Je trouve que c'est extrêmement débile de tenter de scruter les réseaux sociaux comme ça, mais bon après tout les RH ne sont pas en manques de techniques douteuses.

**Edrixal** · 30/01/2020, 11h16

Envoyé par lsbkf

Il y a des gens qui ont le même nom + prénom que moi sur internet. Je trouve que c'est extrêmement débile de tenter de scruter les réseaux sociaux comme ça, mais bon après tout les RH ne sont pas en manques de techniques douteuses.

Parce que tu crois qu'ils regarde que le nom et prénom?
Adresse Email, numéro de téléphone, photo (la recherche par photo existe depuis pas mal de temps maintenant

), mot clé ou juste lorsque tu entre un ou une collègue en amis sur un réseau social ça peut suffire pour te trouver.

Et c'est pas débile en soit. Beaucoup de personne balance toute leur vie privée sur les réseaux sociaux. Sa permet de savoir à qui tu à affaire, si ses idées correspondent à celle de ta boite, si la personne peut présenter un risque pour l'image de la boite, ect...
Au delà de ça, ils peuvent aussi déterminer si tu compte vraiment rester dans la boite, si t'es quelqu'un de fiable, si t'es du genre à cracher sur la direction, ect...

Bien sur si tu ne met rien sur les réseaux sociaux et que tu n'est quasi pas sur internet, ça ne leur servira pas beaucoup. Mais c'est loin d'être le cas de tous.

Les informations sensibles de près de 3 milliards de personnes auraient été divulguées sur le dark Web

Vue hybride

Discussions similaires

Partager

Partager