IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

récupérer le lien vers des documents uniquement [RegEx]


Sujet :

Langage PHP

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Mars 2010
    Messages
    48
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2010
    Messages : 48
    Par défaut récupérer le lien vers des documents uniquement
    bonjour,
    à partir d'un texte html en entrée (que je recupere dans une variable $texte) je souhaite grace a une regex recuperer la liste des documents de types (pdf,doc,xls,txt,ppt,odt,csv) qui sont sous forme de liens html, mais il ne faut pas qu'il recupere les liens vers des pages html.

    les documents en questions sont des liens dans un dossier du www.

    j'ai essayé ce masque mais sans succès:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $masque='#href=\"\/(.*)\/(.[pdf|doc|xls|odt|txt|ppt|csv])\"#';
    merci beaucoup

  2. #2
    Modérateur
    Avatar de sabotage
    Homme Profil pro
    Inscrit en
    Juillet 2005
    Messages
    29 208
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Juillet 2005
    Messages : 29 208
    Par défaut
    comme ça ?
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $masque='#href="(.+\.(?:pdf|doc|xls|odt|txt|ppt|csv))"#';
    ne me demande pas pourquoi ca ne marche pas avec les crochets.
    N'oubliez pas de consulter les FAQ PHP et les cours et tutoriels PHP

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Mars 2010
    Messages
    48
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2010
    Messages : 48
    Par défaut
    merci mais ca ne marche pas dès lors qu'il y'a un href qui contient un lien vers html , il recupere du debut du lien html jusqu'a .pdf par exemple:

    /http://www.............html> ............href=fichier.pdf

  4. #4
    Modérateur
    Avatar de sabotage
    Homme Profil pro
    Inscrit en
    Juillet 2005
    Messages
    29 208
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Juillet 2005
    Messages : 29 208
    Par défaut
    Je crois que je tombe dans le bricolage un peu :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $masque='#href="([^"]+\.(?:pdf|doc|xls|odt|txt|ppt|csv))"#U';
    N'oubliez pas de consulter les FAQ PHP et les cours et tutoriels PHP

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Mars 2010
    Messages
    48
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2010
    Messages : 48
    Par défaut
    merci beaucoup ca a marché !

  6. #6
    Rédacteur/Modérateur

    Avatar de SpaceFrog
    Homme Profil pro
    Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Bidouilleur SharePoint
    Inscrit en
    Mars 2002
    Messages
    39 659
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 75
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Développeur Web Php Mysql Html Javascript CSS Apache - Intégrateur - Bidouilleur SharePoint
    Secteur : Industrie

    Informations forums :
    Inscription : Mars 2002
    Messages : 39 659
    Billets dans le blog
    1
    Par défaut
    ne me demande pas pourquoi ca ne marche pas avec les crochets.
    tout simplement parceque les crochets délimitent un ensemble de caractères et ceci de façon littérale

    ex [ab] indique que a et be sont autorisés
    [ab]{3} matcherait
    aaa
    bbb
    aab
    abb
    aba
    bab
    bba
    baa

    le ? les : et le | sont pris en tant que caractères

    [a|b]{3} ne veut pas dire trois fois a ou b mais matche de la même façon
    aaa
    |||
    bbb
    a|b
    etc...

    [] = classe de cacratères
    Ma page Developpez - Mon Blog Developpez
    Président du CCMPTP (Comité Contre le Mot "Problème" dans les Titres de Posts)
    Deux règles du succès: 1) Ne communiquez jamais à quelqu'un tout votre savoir...
    Votre post est résolu ? Alors n'oubliez pas le Tag

    Venez sur le Chat de Développez !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Lien sur des documents
    Par bidson dans le forum XMLRAD
    Réponses: 1
    Dernier message: 08/02/2006, 13h36
  2. Liens vers de documents
    Par decour dans le forum Access
    Réponses: 2
    Dernier message: 23/01/2006, 10h35
  3. |VB6] Comment Lister les liens vers des fichiers d'une page web
    Par Mayti4 dans le forum VB 6 et antérieur
    Réponses: 8
    Dernier message: 18/01/2005, 18h17

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo