Forum
Scraping est-il légale ?
Amazigh21
Contacter en MP
Amazigh21
Nombre de posts : 29
Nombre de likes : 1
Inscrit :
19 juin 2019
Bonjour,
Je suis entrain de dev un petit outil pour qu'il récupère quelques contenus sur des sites.
Donc je le demande est ce que c'est légale de faire ça ?
Il existe bien des comparateurs de prix des vols, hébergement...
Donc je me dis que, non, ce n'est pas illégale .
Mais j'aimerais bien avoir votre expértise.
Merci pour votre réponse.
Je suis entrain de dev un petit outil pour qu'il récupère quelques contenus sur des sites.
Donc je le demande est ce que c'est légale de faire ça ?
Il existe bien des comparateurs de prix des vols, hébergement...
Donc je me dis que, non, ce n'est pas illégale .
Mais j'aimerais bien avoir votre expértise.
Merci pour votre réponse.
-
hmg
Nombre de posts : 26858Nombre de likes : 415Inscrit : 9 janvier 2005Bonjour,
Tout dépend.
Du côté documents récupérés :
- ils sont en libre accès ?
- ils sont libres de droits ?
- ils datent de quand ?
- ils sont dans quel pays ?
- leur auteur est identifié ?
- possible de demander autorisation selon usage ?
...
Du côté usage :
- les sources seront citées ?
- usage pro ou privé ?
- utilisation dans quel pays ?
...
Le droit d’auteur est très protégé en France.
Ne prenez pas trop de risques.Cordialement, - HMG - hmg_71@yahoo.fr Expert comptable - Paris - www.hmgec.com Pensez à regarder le contexte et la date des réponses. Elles ne s'appliquent pas toujours à tous les cas. -
Spiralis
Nombre de posts : 329Nombre de likes : 193Inscrit : 12 septembre 2019
Vous voulez parler sûrement de scraping et pas de scaffolding 🙂Amazigh21 a écrit : Bonjour,
Je suis entrain de dev un petit outil pour qu'il récupère quelques contenus sur des sites.
Donc je le demande est ce que c'est légale de faire ça ?
Il existe bien des comparateurs de prix des vols, hébergement...
Donc je me dis que, non, ce n'est pas illégale .
Mais j'aimerais bien avoir votre expértise.
Merci pour votre réponse. -
Amazigh21
Nombre de posts : 29Nombre de likes : 1Inscrit : 19 juin 2019
Oui ce que je récupère c'est totalement libre, genre un prix d'un produit ou une prestation ...hmg a écrit : Bonjour,
Tout dépend.
Du côté documents récupérés :
- ils sont en libre accès ?
- ils sont libres de droits ?
- ils datent de quand ?
- ils sont dans quel pays ?
- leur auteur est identifié ?
- possible de demander autorisation selon usage ?
...
Du côté usage :
- les sources seront citées ?
- usage pro ou privé ?
- utilisation dans quel pays ?
...
Le droit d’auteur est très protégé en France.
Ne prenez pas trop de risques.
Pour l'utilisation c'est un outil que je vais finir par partagé au grand public,
Les sites en question sont en france.
Merci pour votre réponse. -
Amazigh21
Nombre de posts : 29Nombre de likes : 1Inscrit : 19 juin 2019
Effectivement,je voulais parler du scraping.spiralis a écrit : Vous voulez parler sûrement de scraping et pas de scaffolding :)
Merci pour la correction. -
DidierH
Nombre de posts : 58Nombre de likes : 0Inscrit : 13 octobre 2008Bonjour, c'est très très rarement légal.
Certains gros sites indiquent d'ailleurs des mises en garde dans leur fichier robots.txt
exemple chez Leboncoin : https://www.leboncoin.fr/robots.txt
## It's forbidden to use search robots or other automatic methods to access Leboncoin.fr.
## Access is only permitted with special permission from Leboncoin.fr.
exemple chez ebay : https://www.ebay.com/robots.txt
# The use of robots or other automated means to access the eBay site
# without the express permission of eBay is strictly prohibited.
# Notwithstanding the foregoing, eBay may permit automated access to
# access certain eBay pages but soley for the limited purpose of
# including content in publicly available search engines. Any other
# use of robots or failure to obey the robots exclusion standards set
# forth at <https> is strictly
# prohibited. -
fullstack_obliged
Nombre de posts : 110Nombre de likes : 10Inscrit : 1 juin 2020DidierH a écrit : Bonjour, c'est très très rarement légal.
Certains gros sites indiquent d'ailleurs des mises en garde dans leur fichier robots.txt
exemple chez Leboncoin : https://www.leboncoin.fr/robots.txt
## It's forbidden to use search robots or other automatic methods to access Leboncoin.fr.
## Access is only permitted with special permission from Leboncoin.fr.
exemple chez ebay : https://www.ebay.com/robots.txt
# The use of robots or other automated means to access the eBay site
# without the express permission of eBay is strictly prohibited.
# Notwithstanding the foregoing, eBay may permit automated access to
# access certain eBay pages but soley for the limited purpose of
# including content in publicly available search engines. Any other
# use of robots or failure to obey the robots exclusion standards set
# forth at <https> is strictly
# prohibited.
C'est quoi la raison pour laquelle ca pose un probleme d'utiliser de tel procede pour browser le site ?
Par ailleurs, les bots de google permettent d'aider au referencement non ? -
Amarlot
Nombre de posts : 5Nombre de likes : 0Inscrit : 20 juin 2018Ca ne respecte peut-être pas les conditions générales d'utilisation du site mais j'ai du mal à voir le risque.
Beaucoup de sociétés font du scrapping de site. Il y a plusieurs sociétés française d'ailleurs.
De l'autre coté il y a des sociétés qui essaient de bloquer ce traffic non légitime comme datadome, cloudflare, netacea sur les différents sites.
C'est le jeu du chat et de la souris ! Les scrappers essayent de nouvelles techniques que les solutions bloquent quelques jours plus tard et ainsi de suite ! -
DidierH
Nombre de posts : 58Nombre de likes : 0Inscrit : 13 octobre 2008Les bases de données sont spécifiquement protégées par la Loi. Je vous invite à jeter un oeil à la loi n° 98-536 du 1er juillet 1998, portant transposition dans le Code de la propriété intellectuelle de la directive 96/9/CE du 11 mars 1996, concernant la protection juridique des bases de données.
Certains producteurs de données placent parfois des honeypots (faux profil, faux produit, faux numéro de téléphone, fausse référence, etc), et là cela devient très facile d'identifier les contrevenants qui ont extrait et rediffusé la data -
Amarlot
Nombre de posts : 5Nombre de likes : 0Inscrit : 20 juin 2018Merci pour l'information. Souvent c'est pour récupérer des informations de prix des produits ou alors de la disponibilité produit.
Je ne sais pas s'il y a souvent des poursuites