IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Requêtes MySQL Discussion :

Select avec REGEXP


Sujet :

Requêtes MySQL

  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Août 2008
    Messages
    34
    Détails du profil
    Informations personnelles :
    Localisation : France, Nord (Nord Pas de Calais)

    Informations forums :
    Inscription : Août 2008
    Messages : 34
    Par défaut Select avec REGEXP
    Hello

    J'ai un petit soucis avec un regex dans une requête select

    En gros, j'ai une liste de fichiers avec leurs arborescences
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    nom de la table : `media`
    id   fichier
    1   /rep1/rep2/rep3/toto.txt
    2   /rep1/rep2/rep4/tata.txt
    3   /rep1/rep2/titi.txt
    4   /rep1/tyty.txt
    et je dois sortir la liste des fichiers contenus dans un répertoire, sans les sous répertoires de celui-ci ...

    Impossible d'utiliser like '/rep1/rep2/*' , ça me sort les sous répertoires, donc j'ai pensé utiliser un REGEXP avec quelque chose du genre :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    SELECT `id` FROM `media` WHERE 'fichier' REGEXP '(/rep1/rep2/)+([a-zA-Z0-9\.-]*)'
    Mais je n'arrive pas à formuler correctement le REGEX, après avoir interrogé mon pote google, j'ai trouvé des exemples de regex pour les adresses mails, codes postaux ... mais je n'arrive pas à les adapter pour mon besoin ...

    Donc, si quelqu'un pouvait me donner un petit coup de main pour le regex, ou pour toute autre solution ... "S'ré achement coole "

  2. #2
    Expert éminent
    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 818
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 62
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 818
    Billets dans le blog
    14
    Par défaut
    J'utiliserais plutôt une combinaison de fonctions texte pour localiser la position du dernier slash et prendre la fin de la chaîne à partir de cette position + 1.

    Voilà un truc qui semble fonctionner :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    SELECT RIGHT(fichier, POSITION('/' IN REVERSE(fichier)) - 1)
    FROM media
    WHERE fichier LIKE '/rep1/rep2%'
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole, en retraite... mais toujours Autoentrepreneur à l'occasion.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Août 2008
    Messages
    34
    Détails du profil
    Informations personnelles :
    Localisation : France, Nord (Nord Pas de Calais)

    Informations forums :
    Inscription : Août 2008
    Messages : 34
    Par défaut
    Merci mais le problème des sous répertoires se pose toujours (il me retourne les fichiers des sous répertoires de /rep1/rep2/, c'est lié à l'utilisation de :/

  4. #4
    Expert éminent
    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 818
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 62
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 818
    Billets dans le blog
    14
    Par défaut
    J'avais cru comprendre que vous vouliez tous les fichiers de /rep1/rep2, y compris ceux des sous-répertoires mais en affichant que le nom du fichier sans le sous-répertoire.

    Vous pouvez reformuler votre besoin avec un exemple ?
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole, en retraite... mais toujours Autoentrepreneur à l'occasion.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Août 2008
    Messages
    34
    Détails du profil
    Informations personnelles :
    Localisation : France, Nord (Nord Pas de Calais)

    Informations forums :
    Inscription : Août 2008
    Messages : 34
    Par défaut
    Mea culpa si j'ai mal exprimé mon problème

    Pour la table `media` :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
    id   fichier
    1   /rep1/rep2/rep3/toto.txt
    2   /rep1/rep2/rep4/tata.txt
    3   /rep1/rep2/titi.txt
    4   /rep1/tyty.txt
    La requête (SELECT ...) doit lister les 'id' correspondant a 'fichier' ('fichier' symbolisant l'emplacement d'un fichier) dont le contenu du répertoire correspond aux critères de recherches sans listé le contenu des sous répertoires.

    J'ai essayé avec :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
     
    $repertoire = '/rep1/rep2/';
     
    SELECT id 
    FROM media 
    WHERE fichier = '$repertoire%'
    // liste le répertoire mais aussi les sous dossiers et leurs contenus
     
     
    // avec un regex
    SELECT `id` 
    FROM `media` 
    WHERE 'fichier' REGEXP '($repertoire)+([a-zA-Z0-9\.-]*)'
    // Je pense que la solution est dans le REGEXP, mais je n'arrive pas à fournir la syntaxe correcte
    Je ne voudrais que l'id #3 (3 /rep1/rep2/titi.txt) dans cet exemple

    En espérant être plus clair

  6. #6
    Expert éminent
    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 818
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 62
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 818
    Billets dans le blog
    14
    Par défaut
    J'ai donné la requête qui extrait le nom du fichier.
    Il suffit de tester que le reste de la chaîne de caractères constitue seulement le chemin que l'on cherche ('/rep1/rep2/') et pas un truc plus long (les sous-répertoires de '/rep1/rep2/').

    Il se fait tard pour développer ça maintenant mais c'est l'idée vers laquelle je me tournerais.
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole, en retraite... mais toujours Autoentrepreneur à l'occasion.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  7. #7
    Membre averti
    Profil pro
    Inscrit en
    Août 2008
    Messages
    34
    Détails du profil
    Informations personnelles :
    Localisation : France, Nord (Nord Pas de Calais)

    Informations forums :
    Inscription : Août 2008
    Messages : 34
    Par défaut
    J'avais pensé faire la même chose, réduire l'extraction de la base de données en utilisant LIKE et affiner les résultats par php, mais bon, actuellement la table compte plus de 9 000 lignes et quand je teste un SELECT depuis la racine (/), cela me retourne l'intégralité de la table alors qu'en traitant le regex directement dans la requête mysql je tombe à 140 résultats (au maximum)...

    Merci quand même pour le coup de main, je me penche demain sur cette requête en espérant trouver la syntaxe du regex qui conviendrait (je posterais le regex ici si personne ne la pose avant moi).

  8. #8
    Expert éminent
    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 818
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 62
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 818
    Billets dans le blog
    14
    Par défaut
    Je ne parlais pas de faire ça en PHP mais de rester dans une requête SQL en continuant de jouer avec les fonctions de chaînes de caratères.

    On cherche donc les fichiers contenus dans le répertoire '/rep1/rep2'.

    Que contient ce répertoire (fichiers et sous-répertoires) ?
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    SELECT id, fichier
    FROM media
    WHERE fichier LIKE '/rep1/rep2/%'
    Ajoutons la longueur de ces 'fichier' :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    SELECT id, fichier, 
      LENGTH(fichier) AS longueur_fichier_rep
    FROM media
    WHERE fichier LIKE '/rep1/rep2/%'
    Ajoutons la position du dernier slash dans ces 'fichier' :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    SELECT id, fichier, 
      LENGTH(fichier) AS longueur_fichier_rep, 
      POSITION('/' IN REVERSE(fichier)) AS Position_dernier_slash
    FROM media
    WHERE fichier LIKE '/rep1/rep2/%'
    Ajoutons le nom du fichier sans le répertoire :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    SELECT id, fichier, 
      LENGTH(fichier) AS longueur_fichier_rep, 
      POSITION('/' IN REVERSE(fichier)) AS Position_dernier_slash,
      RIGHT(fichier, POSITION('/' IN REVERSE(fichier)) - 1) AS Nom_fichier
    FROM media
    WHERE fichier LIKE '/rep1/rep2/%'
    Ajoutons la longueur du nom du fichier :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    SELECT id, fichier, 
      LENGTH(fichier) AS longueur_fichier_rep, 
      POSITION('/' IN REVERSE(fichier)) AS Position_dernier_slash,
      RIGHT(fichier, POSITION('/' IN REVERSE(fichier)) - 1) AS Nom_fichier,
      LENGTH(RIGHT(fichier, POSITION('/' IN REVERSE(fichier)) - 1)) AS Longueur_nom_fichier
    FROM media
    WHERE fichier LIKE '/rep1/rep2/%'
    Faisons la différence entre les deux longueurs. Ca devrait nous donner la longueur de la partie répertoire dans 'fichier' :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    SELECT id, fichier, 
      LENGTH(fichier) AS longueur_fichier_rep, 
      POSITION('/' IN REVERSE(fichier)) AS Position_dernier_slash,
      RIGHT(fichier, POSITION('/' IN REVERSE(fichier)) - 1) AS Nom_fichier,
      LENGTH(RIGHT(fichier, POSITION('/' IN REVERSE(fichier)) - 1)) AS Longueur_nom_fichier
      LENGTH(fichier) - LENGTH(RIGHT(fichier, POSITION('/' IN REVERSE(fichier)) - 1)) AS Longueur_répertoire
    FROM media
    WHERE fichier LIKE '/rep1/rep2/%'
    Il suffit maintenant d'ajouter dans le WHERE la condition stipulant que la longueur de la partie répertoire soit égale à la longueur du répertoire cherché :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    SELECT id, fichier, 
      LENGTH(fichier) AS longueur_fichier_rep, 
      POSITION('/' IN REVERSE(fichier)) AS Position_dernier_slash,
      RIGHT(fichier, POSITION('/' IN REVERSE(fichier)) - 1) AS Nom_fichier,
      LENGTH(RIGHT(fichier, POSITION('/' IN REVERSE(fichier)) - 1)) AS Longueur_nom_fichier
      LENGTH(fichier) - LENGTH(RIGHT(fichier, POSITION('/' IN REVERSE(fichier)) - 1)) AS Longueur_répertoire
    FROM media
    WHERE fichier LIKE '/rep1/rep2/%'
      AND LENGTH('/rep1/rep2/') = LENGTH(fichier) - LENGTH(RIGHT(fichier, POSITION('/' IN REVERSE(fichier)) - 1))
    Il est possible qu'il faille ajuster + 1 ou - 1 caractères dans certaines formules.
    C'est à tester avec des vraies données.
    Ensuite tu supprimes de la requête les étapes intermédiaires figurant dans le SELECT et tu as ta requête complète.
    Avec 9000 lignes dans la tables, ça devrait prendre moins d'une seconde s'il y a un index sur la colonne 'fichier'.
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole, en retraite... mais toujours Autoentrepreneur à l'occasion.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  9. #9
    Membre averti
    Profil pro
    Inscrit en
    Août 2008
    Messages
    34
    Détails du profil
    Informations personnelles :
    Localisation : France, Nord (Nord Pas de Calais)

    Informations forums :
    Inscription : Août 2008
    Messages : 34
    Par défaut
    J'ai testé en local avec une table contenant 30 000 lignes et aucun soucis !
    Point de vue performances ça reste très correct '0.0264 s' (pour sortir 2 000 lignes correspondant à la racine des dossiers). N'ayant pas eu le temps de chercher la syntaxe de la REGEX, j'adopte ta solution !

    Donc un grand merci à CinePhil !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. SELECT avec REPLACE et REGEXP
    Par bronon dans le forum Requêtes
    Réponses: 7
    Dernier message: 08/09/2014, 12h32
  2. Réponses: 6
    Dernier message: 08/06/2004, 14h51
  3. requete select avec AS remplacement de valeur
    Par pi3141563 dans le forum Requêtes
    Réponses: 3
    Dernier message: 17/04/2004, 22h15
  4. pb de select avec size avec choix multiple
    Par La_picolle dans le forum ASP
    Réponses: 10
    Dernier message: 28/08/2003, 15h21
  5. requete SELECT avec un nombre constant
    Par gurumeditation dans le forum Requêtes
    Réponses: 3
    Dernier message: 04/07/2003, 20h04

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo