Ce tutoriel est une introduction au scraping avec Scrapy, un module Python.
Le scraping, plus précisément le web scraping, est, selon Wikipédia : une technique d'extraction du contenu de sites Web, via un script ou un programme, dans le but de le transformer pour permettre son utilisation dans un autre contexte comme l'enrichissement de bases de données, le référencement ou l'exploration de données.
Pour faire simple, le scraping est un procédé d’extraction de données de sites webs. En guise d’exemple, les robots des moteurs de recherche font du scraping sur internet, puisqu’ils récoltent, entre autres, les URLs des sites sur la toile pour faire avec ce que bon leur semble.
Partager