IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Conception Web Discussion :

Choix d'une méthode pour extraire des données web


Sujet :

Conception Web

  1. #1
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    3
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 3
    Points : 0
    Points
    0
    Par défaut Choix d'une méthode pour extraire des données web
    Bonjour à tous,

    Mon problème concerne le choix d'une méthode pour récupérer des données sur un autre site web.
    L'idée du projet est de réaliser (en gros) un agrégateur de petites annonces immobilières, donc il faut être capable de récupérer les annonces sur des sites immobiliers.
    Je vois plusieurs solutions possibles, mais ne sait pas du tout laquelle est la plus intéressante en termes de difficulté, performances, etc..

    Les solutions que j'envisage sont:
    _ soit récupérer les données des annonces sur les sites de manière régulière - effectuer un crawl une fois par jour par exemple - et les stocker dans une bdd interne. Les données étant alors accessibles plus facilement.
    _ soit faire une sorte de "méta-moteur" où une recherche sur le site lancerait des requêtes sur chacun des sites immobiliers, et les résultats seraient alors traités à la volée pour les afficher correctement.
    _ soit intégrer un flux rss/xml/csv - mis à jour par les sites - et stocker les annonces en dur dans une base de données.

    Voilà les 3 solutions qui me viennent à l'esprit, j'imagine qu'il doit en exister d'autres, donc je suis ouvert à toute idée ou proposition et bien sûr à tout avis sur ces 3 solutions.

    Alors.. qu'en pensez-vous ?

    Merci d'avance pour vos réponses !

  2. #2
    Rédacteur

    Avatar de Bovino
    Homme Profil pro
    Développeur Web
    Inscrit en
    Juin 2008
    Messages
    23 647
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Développeur Web
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2008
    Messages : 23 647
    Points : 91 220
    Points
    91 220
    Billets dans le blog
    20
    Par défaut
    La première question à se poser est surtout : les sites en question t'autorisent-ils à récupérer leurs données, parce que sinon, c'est pas très légal ton truc...
    Pas de question technique par MP !
    Tout le monde peut participer à developpez.com, vous avez une idée, contactez-moi !
    Mes formations video2brain : La formation complète sur JavaScriptJavaScript et le DOM par la pratiquePHP 5 et MySQL : les fondamentaux
    Mon livre sur jQuery
    Module Firefox / Chrome d'intégration de JSFiddle et CodePen sur le forum

  3. #3
    Membre chevronné
    Avatar de Pelote2012
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mars 2008
    Messages
    925
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Haute Vienne (Limousin)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Mars 2008
    Messages : 925
    Points : 1 839
    Points
    1 839
    Billets dans le blog
    2
    Par défaut
    Perso, je préfère la 1ere, car tu peux décider du traitement et faire un tri sur ce que tu veux et le mettre en forme de manière unique. Je ne pense pas que les annonces immobilières fluctuent tellement qu'une mise à jour en temps réelle soit nécessaire (au pire tu peux en faire une à 12H00).
    Par contre, ça demande plus de boulot...
    Si débugger est l'art d'enlever les bugs ... alors programmer est l'art de les créer

  4. #4
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    3
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 3
    Points : 0
    Points
    0
    Par défaut
    @Bovino: Oui l'aspect légal est important ici, mais ces extractions de données se feraient avec l'accord de leurs propriétaires

    @BROWNY: Oui je trouve aussi que la première solution laisse plus de flexibilité quand au traitement des données. Après elle est plus compliquée..
    Une de mes grandes interrogations, c'était aussi au niveau des perfs (rapidité de chargement du résultat) dans le cas le 2e cas (méta-moteur) si l'on imagine par exemple qu'il y ait une centaine de sites auxquels envoyer des requêtes.
    Je n'ai vraiment aucune idée de ce que ça peut donner..

    Et sinon pas d'autres solutions ?
    En tout cas merci des réponses rapides !

  5. #5
    Rédacteur

    Avatar de Bovino
    Homme Profil pro
    Développeur Web
    Inscrit en
    Juin 2008
    Messages
    23 647
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Développeur Web
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2008
    Messages : 23 647
    Points : 91 220
    Points
    91 220
    Billets dans le blog
    20
    Par défaut
    Dans ce cas, tu ne peux pas voir avec eux pour qu'ils te fournissent un web service ?
    Ce serait quand même plus pratique, et s'ils ont déjà des flux RSS, ça devrait pas être trop compliqué.
    Pas de question technique par MP !
    Tout le monde peut participer à developpez.com, vous avez une idée, contactez-moi !
    Mes formations video2brain : La formation complète sur JavaScriptJavaScript et le DOM par la pratiquePHP 5 et MySQL : les fondamentaux
    Mon livre sur jQuery
    Module Firefox / Chrome d'intégration de JSFiddle et CodePen sur le forum

  6. #6
    Membre chevronné
    Avatar de Pelote2012
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mars 2008
    Messages
    925
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Haute Vienne (Limousin)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Mars 2008
    Messages : 925
    Points : 1 839
    Points
    1 839
    Billets dans le blog
    2
    Par défaut
    interroger les autres sites en direct, qu'est-ce qui se passe si t'as un site qui met 3 plombes à répondre...
    Pour la slution 1 pas de pb, car si t'a pas mis à jour, tu as quand même des info récente à présenter.

    Sinon, j'utilise le SSIS pour récupérer des données chez des fournisseurs, peut-être une piste. C'est assez simple d'utilisation et efficasse. T'as plein de module du genre traitement sur XML, envoi mail, FTP,traitement sur fichier plat... et des liaisons faciles avec une BDD à faire de manière graphique
    Si débugger est l'art d'enlever les bugs ... alors programmer est l'art de les créer

  7. #7
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    3
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 3
    Points : 0
    Points
    0
    Par défaut
    @Bovino: Oui s'ils ont un flux rss, c'est sûr que ça serait plus simple, mais j'imagine que c'est loin d'être le cas pour tous !

    @BROWNY: Merci pour le SSIS, je vais me renseigner un peu plus, mais il faut un accès direct dans leur bases de données du coup ?

Discussions similaires

  1. Réponses: 1
    Dernier message: 23/03/2015, 14h12
  2. Réponses: 1
    Dernier message: 04/01/2013, 21h13
  3. Besoin d'aide pour extraire des données d'une feuille à l'autre
    Par fransky dans le forum Macros et VBA Excel
    Réponses: 2
    Dernier message: 18/11/2010, 15h03
  4. Réponses: 2
    Dernier message: 25/06/2009, 08h23
  5. Réponses: 6
    Dernier message: 05/05/2008, 15h19

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo