IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Aspirer une page complète


Sujet :

Langage PHP

  1. #1
    Membre éclairé Avatar de sami_c
    Homme Profil pro
    Directeur des systèmes d'information
    Inscrit en
    Mai 2002
    Messages
    770
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Directeur des systèmes d'information

    Informations forums :
    Inscription : Mai 2002
    Messages : 770
    Par défaut Aspirer une page complète
    Bonjour,
    Je voudrais créer un script php qui permet d'aspirer une PAGE (et non pas un site) avec toutes ses images.
    Merci

  2. #2
    Expert confirmé Avatar de Mr N.
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    5 418
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 5 418
    Par défaut
    commence déjà par par récupérer une page sans images
    file, fopen, file_get_contents, sockets, curl, ...

  3. #3
    Membre éclairé Avatar de sami_c
    Homme Profil pro
    Directeur des systèmes d'information
    Inscrit en
    Mai 2002
    Messages
    770
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Directeur des systèmes d'information

    Informations forums :
    Inscription : Mai 2002
    Messages : 770
    Par défaut
    c'est fait, avec fopen et fgets
    ensuite c'est la récup des fichiers qui me préoccupe, je pense qu'il faudrait utilise les expressions régulière...que est pour moi un casse tête

  4. #4
    Expert confirmé Avatar de Mr N.
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    5 418
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 5 418
    Par défaut
    preg_match_all, après etre faire un tour là dessus =>
    http://www.expreg.com

    Il te reste plus qu'à capturer les images (relatives !) qui sont dans img src="XXX", + d'autres comme dans les feuilles de styles

  5. #5
    Membre émérite
    Avatar de Kioob
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    550
    Détails du profil
    Informations personnelles :
    Âge : 46
    Localisation : France, Rhône (Rhône Alpes)

    Informations forums :
    Inscription : Septembre 2004
    Messages : 550
    Par défaut
    et pourquoi donc "aspirer" une page ?

    Je rappel en passant que le vol de contenu, c'est mal (tm).

    S'il s'agit d'un truc réellement fait pour (news par exemple), vaut mieux demander un flux XML : ça évitera de foutre à terre le serveur visé...

  6. #6
    Membre éclairé Avatar de sami_c
    Homme Profil pro
    Directeur des systèmes d'information
    Inscrit en
    Mai 2002
    Messages
    770
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Directeur des systèmes d'information

    Informations forums :
    Inscription : Mai 2002
    Messages : 770
    Par défaut
    ce n'est pas pour le vol, en fait là je suis dans un pays qui censure des sites, alors je crée un aspirateur que je vais heberger sur un hebergeur non censuré et qui me permettra de récupérer les pages censurée...c'est donc pour une bonne cause

  7. #7
    Membre émérite
    Avatar de Kioob
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    550
    Détails du profil
    Informations personnelles :
    Âge : 46
    Localisation : France, Rhône (Rhône Alpes)

    Informations forums :
    Inscription : Septembre 2004
    Messages : 550
    Par défaut
    Dans ce cas c'est un proxy que tu dois mettre en place...

  8. #8
    Membre éclairé Avatar de sami_c
    Homme Profil pro
    Directeur des systèmes d'information
    Inscrit en
    Mai 2002
    Messages
    770
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Directeur des systèmes d'information

    Informations forums :
    Inscription : Mai 2002
    Messages : 770
    Par défaut
    les proxy seront détecté et censuré eux aussi ...

  9. #9
    Rédacteur
    Avatar de marcha
    Homme Profil pro
    Développeur Web
    Inscrit en
    Décembre 2003
    Messages
    1 571
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : Suisse

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Décembre 2003
    Messages : 1 571
    Par défaut
    Test avec ça si tu peux récupérer les urls des images

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    	function getUrls($string, $strict=true) {
    		$types = array("href", "src", "url");
    		while(list(,$type) = each($types)) {
    			$innerT = $strict?'[a-z0-9:?=&@/._-]+?':'.+?';
    			preg_match_all ("|$type\=([\"'`])(".$innerT.")\\1|i", $string, &$matches);
    			$ret[$type] = $matches[2];
    		}	
    		return $ret;
    	}

Discussions similaires

  1. Aspirer une page PHP
    Par ProgVal dans le forum Langage
    Réponses: 8
    Dernier message: 01/05/2008, 12h46
  2. formulalocal pour une page complète ?
    Par melodyyy dans le forum Macros et VBA Excel
    Réponses: 11
    Dernier message: 11/11/2007, 17h11
  3. Réponses: 6
    Dernier message: 05/07/2006, 17h13
  4. Une image sur une page complète
    Par progfou dans le forum Tableaux - Graphiques - Images - Flottants
    Réponses: 6
    Dernier message: 27/04/2006, 17h18
  5. [HTML]Affichage d'une page complète dans une cadre.
    Par cach dans le forum Balisage (X)HTML et validation W3C
    Réponses: 2
    Dernier message: 28/02/2006, 18h11

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo