IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Services Discussion :

Pages différentes pour une même url.


Sujet :

Services

  1. #1
    Expert éminent

    Homme Profil pro
    Inscrit en
    Octobre 2008
    Messages
    4 300
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Octobre 2008
    Messages : 4 300
    Points : 6 780
    Points
    6 780
    Par défaut Pages différentes pour une même url.
    Salut,

    Lorsque j'ouvre cette page http://www.arte.tv/guide/fr/plus7/to...ideos?date=j-1 avec un navigateur et que je charge le code source de cette page j'obtiens quelque chose de différent qu'avec wget.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    $ wget http://www.arte.tv/guide/fr/plus7/toutes-les-videos?date=j-1
    Des éléments visibles dans le navigateur n'existe pas dans la deuxième page.

    Dans le code affiché dans le navigateur (ligne 165)
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    <script type="text/javascript">
        (function() {
            var element = React.createElement(CollectionPage, {
                returnURL: 'http://www.arte.tv/guide/fr/plus7/',
                videoSet: {"total_count":20,"has_more":false,"videos":[
    {"id":"046119-003-A","title":"Les lignes de Wellington (3\/3)",...},
    {"id":"046119-002-A","title":"Les lignes de Wellington (2\/3)",...},
    {"id":"046119-001-A","title":"Les lignes de Wellington (1\/3)",...},
    etc
    La page chargée avec wget (ligne 165):
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    <script type="text/javascript">
        (function() {
            var element = React.createElement(CollectionPage, {
                returnURL: 'http://www.arte.tv/guide/fr/plus7/',
                videoSet: {"total_count":9,"has_more":false,"videos":[
    {"id":"064094-200-A","title":"ARTE Journal",...},
    {"id":"064317-019-A","title":"Catherine Deneuve lit la mode...",
    etc
    Il manque les six premières vidéos.

    En réalité, je n'ai pas besoin de charger ces pages avec wget mais plutôt avec une application.

    Le site d'arte retourne peut-être une page réduite aux robots mais mon appli définit un user-agent et, d'après moi, ne devrait donc pas être vue comme un robot.

    À toutes fins utiles ceci est le code qui charge les pages:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
            user_agent = 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:49.0) Gecko/20100101 Firefox/49.0'
            req = urllib.request.Request(url, data=None, 
                                         headers={"User-Agent": user_agent})
            try:
                content = urllib.request.urlopen(req)
                return str(content.read().decode('utf-8', 'replace'))
            except Exception as why:
                logger.info('urllib error: %s, %s' % (url, why))
                return False
    Ici il s'agit de python, mais cela ne change rien, bien sur.

    Si quelqu'un a une idée, d'avance merci.

  2. #2
    Expert éminent

    Homme Profil pro
    Inscrit en
    Octobre 2008
    Messages
    4 300
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Octobre 2008
    Messages : 4 300
    Points : 6 780
    Points
    6 780
    Par défaut
    En général, il suffit que l'on pose question pour trouver soi-même.

    Il suffit d'ajouter une donnée pays à l'url.
    http://www.arte.tv/guide/fr/plus7/to...j-1&country=FR

    Mais donc cela confirme-t-il bien que des pages différentes peuvent être retournées selon certains critères appliqués aux visiteurs ?

Discussions similaires

  1. Réponses: 17
    Dernier message: 09/02/2010, 16h22
  2. espace colonne différente pour une même feuille
    Par stéphanie123 dans le forum Excel
    Réponses: 4
    Dernier message: 05/12/2009, 09h58
  3. <meta content="charset=xx"> différent pour une même page de code
    Par laurentSc dans le forum Balisage (X)HTML et validation W3C
    Réponses: 11
    Dernier message: 19/03/2009, 08h13
  4. Temps d'exécution différent pour une même tâche
    Par franculo_caoulene dans le forum Général Dotnet
    Réponses: 2
    Dernier message: 26/03/2008, 08h41
  5. Icone différente pour une même extention ?!
    Par NicolasJolet dans le forum Autres Logiciels
    Réponses: 2
    Dernier message: 09/03/2006, 10h24

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo