IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Réseau/Web Python Discussion :

probleme avec SCrapy


Sujet :

Réseau/Web Python

  1. #1
    Membre à l'essai
    Inscrit en
    Mars 2010
    Messages
    20
    Détails du profil
    Informations forums :
    Inscription : Mars 2010
    Messages : 20
    Points : 21
    Points
    21
    Par défaut probleme avec SCrapy
    Bonjour ,

    je suis nouveau en python et scrapy ,j ai extracte les donnes dans ma base de donne de différents sites informatique pour faire un site web pour comparer les prix des smart phones .

    J ai rencontre un probleme, les references des smart phones n ont pas les meme structure par exemple :
    GALAXYS4 est F-GALAXYS4

    refs = hxs.select('//*[@id="produit_liste_img"]/a/span/text()').extract()

    mon but est de faire une reference unique dans ma base de donne .

    Merci pour votre aide.

  2. #2
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 277
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 277
    Points : 36 762
    Points
    36 762
    Par défaut
    Salut,

    GALAXYS4 ou "GALAXY S4" ou F-GALAXYS4 sont des noms commerciaux.
    Normalement, Samsung doit avoir un EAN ou un UPC (un identifiant "unique") qui est un truc aussi illisible qu'un code barre mais que le site Web devrait avoir aussi référencé quelque part.
    Ceci dit, côté programmation Python, quelle est la question?

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Membre à l'essai
    Inscrit en
    Mars 2010
    Messages
    20
    Détails du profil
    Informations forums :
    Inscription : Mars 2010
    Messages : 20
    Points : 21
    Points
    21
    Par défaut
    Salut ,

    Cote programmation ,je veux faire un site de web comparateur de prix :l utilisateur peut chercher un produit a partir de son référence et la ou se pose le problème , il ya des site qui n ont pas référence ou marque il y a que le titre de produit. comment je peut faire pour extracter la marque et la refrernce dans ma base de donne.
    exemple :samsung galaxy S4

    marque :samsung
    reference :S4

  4. #4
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 277
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 277
    Points : 36 762
    Points
    36 762
    Par défaut
    Salut,

    Il faut vous résoudre à appliquer des traitements particuliers à chaque site Web ou groupe de site Web.
    i.e. si l'information est structurée en:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    marque :samsung
    reference :S4
    il faut écrire le code qui sache le mettre en correspondance avec une "clé unique" que vous créez comme par exemple "SAMSUNG/GALAXY/S4" ou l'identifiant produit du constructeur (ENA ou UPC).

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  5. #5
    Membre à l'essai
    Inscrit en
    Mars 2010
    Messages
    20
    Détails du profil
    Informations forums :
    Inscription : Mars 2010
    Messages : 20
    Points : 21
    Points
    21
    Par défaut
    marks = hxs.select('//*[@id="produit_liste_marque"]/a/img/@src').extract()

    je n arrive pas a extracte le texte (marque) de l image
    comment faire s il vous plait

  6. #6
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 277
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 277
    Points : 36 762
    Points
    36 762
    Par défaut
    Salut,

    Citation Envoyé par fezzani Voir le message
    marks = hxs.select('//*[@id="produit_liste_marque"]/a/img/@src').extract()

    je n arrive pas a extracte le texte (marque) de l image
    comment faire s il vous plait
    Impossible d'inventer ce que retourne votre "hxs.select(...).extract()" et quoi en faire si tant est que les informations cherchées y soient.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

Discussions similaires

  1. Probleme avec la copie des surfaces
    Par Black_Daimond dans le forum DirectX
    Réponses: 3
    Dernier message: 09/01/2003, 10h33
  2. Problèmes avec le filtrage des ip
    Par berry dans le forum Réseau
    Réponses: 9
    Dernier message: 30/12/2002, 07h51
  3. probleme avec la touche F10
    Par b.grellee dans le forum Langage
    Réponses: 2
    Dernier message: 15/09/2002, 22h04
  4. Probleme avec fseek
    Par Bjorn dans le forum C
    Réponses: 5
    Dernier message: 04/08/2002, 07h17
  5. [Kylix] probleme avec un imagelist
    Par NicoLinux dans le forum EDI
    Réponses: 4
    Dernier message: 08/06/2002, 23h06

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo