Bonjour,
J'essaye de m'initier au langage python et donc je suis quelque petit tutoriel sur le net. J'ai parmi un de celui-ci été confronter a utilisation d'un scraper afin de récolter des information sur une page web mais il semble que j'ai problème de syntaxe quand j'essaye de lancer la commande de scrape dans la console spyder.
Le site de scrapy indique cette commande : "scrapy runspider myspider.py", bien sur je remplace myspider.py par le nom de mon programme :
=> scrapy runspider characters_scraper.py
A ce moment la j'ai la console ne reconnais pas le commande et m'affiche :
J'ai pourtant suivi les directive du site scrapy, et instaler la librairi scrapy avec cette commande "conda install -c conda-forge scrapy"
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5 scrapy runspider characters_scraper.py File "<ipython-input-8-2c3db17e8517>", line 1 scrapy runspider characters_scraper.py ^ SyntaxError: invalid syntax
Quand je tape import scrapy pour importer la librairi, ça fonctionne, puis quand je tape scrapy.runspider voici la réponse :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7 scrapy.runspider Traceback (most recent call last): File "<ipython-input-27-751bf7ab5038>", line 1, in <module> scrapy.runspider AttributeError: module 'scrapy' has no attribute 'runspider'
Voici mon code:
Le but est d'extraire le nom de personnage ayant pour balise 'div#mw-pages div.mw-content-ltr li'.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11 # -*- coding: utf-8 -*- import scrapy class BlogSpider(scrapy.Spider): name = 'characterspider' start_urls = ['https://fr.wikipedia.org/wiki/Cat%C3%A9gorie:Personnage_d\'animation'] def parse(self, response): for link in response.css('div#mw-pages div.mw-content-ltr li'): yield {'character': link.css('a ::text').extract_first()}
Cordialement,
LarleKain
Partager