IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

PHP & Base de données Discussion :

Recherche des villes dans une phrase [MySQL]


Sujet :

PHP & Base de données

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    181
    Détails du profil
    Informations personnelles :
    Localisation : France, Marne (Champagne Ardenne)

    Informations forums :
    Inscription : Juin 2006
    Messages : 181
    Points : 114
    Points
    114
    Par défaut Recherche des villes dans une phrase
    Bonjour,

    Je possède une base mysql de 36 000 noms de villes, je souhaiterai faire un script afin de détecter un nom de ville (présent dans ma base) dans des phrases.

    Je ne vois pas comment procéder, sans faire quelque chose de lourd, pourriez-vous m'aider ?

    Merci d'avance
    nico

  2. #2
    Modératrice
    Avatar de Celira
    Femme Profil pro
    Développeuse PHP/Java
    Inscrit en
    Avril 2007
    Messages
    8 633
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 39
    Localisation : France

    Informations professionnelles :
    Activité : Développeuse PHP/Java
    Secteur : Industrie

    Informations forums :
    Inscription : Avril 2007
    Messages : 8 633
    Points : 16 372
    Points
    16 372
    Par défaut
    J'ai pas vraiment compris : tu veux vérifier si ton texte contient au moins une fois le nom d'une ville en particulier ? le nom de n'importe laquelle des villes ?
    Modératrice PHP
    Aucun navigateur ne propose d'extension boule-de-cristal : postez votre code et vos messages d'erreurs. (Rappel : "ça ne marche pas" n'est pas un message d'erreur)
    Cherchez un peu avant poser votre question : Cours et Tutoriels PHP - FAQ PHP - PDO une soupe et au lit !.

    Affichez votre code en couleurs : [CODE=php][/CODE] (bouton # de l'éditeur) et [C=php][/C]

  3. #3
    Membre actif
    Homme Profil pro
    Développeur Web
    Inscrit en
    Mai 2012
    Messages
    131
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Maroc

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Mai 2012
    Messages : 131
    Points : 242
    Points
    242
    Par défaut
    Salut,

    1- recuperer les mots presentes dans tes phrase (mot dont la taille est > 2 lettres par exp)
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    $phrases = 'Cras suscipit eleifend enim id tristique. Donec rhoncus facilisis euismod';
    preg_match_all('/([^\s]{2,})/i', $phrases, $mots);
    $villes = $mots[1];
    2- requete
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    select * from villes where ville in (1)

  4. #4
    Membre confirmé
    Avatar de Deuzz
    Homme Profil pro
    curieux
    Inscrit en
    Septembre 2014
    Messages
    148
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : curieux
    Secteur : Industrie

    Informations forums :
    Inscription : Septembre 2014
    Messages : 148
    Points : 521
    Points
    521
    Par défaut
    Bonjour

    Mieux vaut espérer que les noms de villes dans tes phrases commencent par une majuscule sinon la commune de Y, et de manière générale toutes celles dont le nom est un mot de la langue française(Bouée, Champs,Charmes, Gland,La bouteille,Le sourd, Perles, Pont, Puits, Vue,...) vont te poser problème.
    De plus, il est insuffisant de comparer chaque mot de ta phrase à ta liste puisque certaines communes sont composées de deux mots : Le Pellerin.

  5. #5
    Modératrice
    Avatar de Celira
    Femme Profil pro
    Développeuse PHP/Java
    Inscrit en
    Avril 2007
    Messages
    8 633
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 39
    Localisation : France

    Informations professionnelles :
    Activité : Développeuse PHP/Java
    Secteur : Industrie

    Informations forums :
    Inscription : Avril 2007
    Messages : 8 633
    Points : 16 372
    Points
    16 372
    Par défaut
    @Deuzz : à considérer aussi : tous les noms de la forme "Machin sur Truc" ou "Saint Bidule", et ceux qui sont théoriquement reliés par des traits d'union et qui en pratique sont souvent écrits sans les traits d'union... (sans compter Saint-Remy-en-Bouzemont-Saint-Genest-et-Isson, plus long nom de ville française d'après M. Wikipédia )
    Modératrice PHP
    Aucun navigateur ne propose d'extension boule-de-cristal : postez votre code et vos messages d'erreurs. (Rappel : "ça ne marche pas" n'est pas un message d'erreur)
    Cherchez un peu avant poser votre question : Cours et Tutoriels PHP - FAQ PHP - PDO une soupe et au lit !.

    Affichez votre code en couleurs : [CODE=php][/CODE] (bouton # de l'éditeur) et [C=php][/C]

  6. #6
    Modérateur

    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 799
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 799
    Points : 34 031
    Points
    34 031
    Billets dans le blog
    14
    Par défaut
    1- recuperer les mots presentes dans tes phrase (mot dont la taille est > 2 lettres par exp)
    Je connais au moins une commune française dont le nom ne contient que deux lettres : Eu
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole. Autoentrepreneur.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  7. #7
    Rédacteur

    Avatar de Bovino
    Homme Profil pro
    Développeur Web
    Inscrit en
    Juin 2008
    Messages
    23 647
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Développeur Web
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2008
    Messages : 23 647
    Points : 91 220
    Points
    91 220
    Billets dans le blog
    20
    Par défaut
    Citation Envoyé par nicoreims
    sans faire quelque chose de lourd
    J'imagine qu'avec ces réponses (mais d'autres écueils peuvent être évoqués au besoin), tu te rends compte que cette condition ne sera jamais remplie.
    Pas de question technique par MP !
    Tout le monde peut participer à developpez.com, vous avez une idée, contactez-moi !
    Mes formations video2brain : La formation complète sur JavaScriptJavaScript et le DOM par la pratiquePHP 5 et MySQL : les fondamentaux
    Mon livre sur jQuery
    Module Firefox / Chrome d'intégration de JSFiddle et CodePen sur le forum

  8. #8
    Modérateur

    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 799
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 799
    Points : 34 031
    Points
    34 031
    Billets dans le blog
    14
    Par défaut
    Quelle est la justification de ce besoin ?

    Est-ce à faire en interactif avec réponse rapide à l'utilisateur ?
    Est-ce au contraire pour repérer des données potentiellement intéressantes, ce travail pouvant être long et même sans interaction directe avec l'utilisateur ?
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole. Autoentrepreneur.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  9. #9
    Membre régulier
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    181
    Détails du profil
    Informations personnelles :
    Localisation : France, Marne (Champagne Ardenne)

    Informations forums :
    Inscription : Juin 2006
    Messages : 181
    Points : 114
    Points
    114
    Par défaut
    Bonsoir à tous, merci beaucoup pour vos réponses.

    En gros mes visiteurs vont parler de leur ville dans une phrase, et si la personne écris par exemple "à nice il fait beau" , que je puisse détecter "nice" pour le passer en hastag #nice
    Donc je pense mettre mes villes à détecter dans un tableau ? et faire une boucle le soir pour tester toutes les phrases.

    Alors effectivement les 36000 villes de ma base, je vais éviter, je vais faire comme pour mon nuage de villes, resortir uniquement les 25 ou 50 plus grandes.

  10. #10
    Rédacteur

    Avatar de Bovino
    Homme Profil pro
    Développeur Web
    Inscrit en
    Juin 2008
    Messages
    23 647
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Développeur Web
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2008
    Messages : 23 647
    Points : 91 220
    Points
    91 220
    Billets dans le blog
    20
    Par défaut
    Le plus simple, plutôt que de vouloir détecter la ville à leur place, ce serait pas de leur demander directement de quelle ville ils parlent au moment de soumettre leur commentaire.
    Pas de question technique par MP !
    Tout le monde peut participer à developpez.com, vous avez une idée, contactez-moi !
    Mes formations video2brain : La formation complète sur JavaScriptJavaScript et le DOM par la pratiquePHP 5 et MySQL : les fondamentaux
    Mon livre sur jQuery
    Module Firefox / Chrome d'intégration de JSFiddle et CodePen sur le forum

  11. #11
    Membre régulier
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    181
    Détails du profil
    Informations personnelles :
    Localisation : France, Marne (Champagne Ardenne)

    Informations forums :
    Inscription : Juin 2006
    Messages : 181
    Points : 114
    Points
    114
    Par défaut
    ;-)

    ...en fait cette partie c'est quand je récupère des tweets twitter à partir d'un hashtag qui varie...

    Donc je vais me retrouver avec 100 ou 200 lignes dans ma base, que je devrai traiter.

  12. #12
    Modérateur

    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 799
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 799
    Points : 34 031
    Points
    34 031
    Billets dans le blog
    14
    Par défaut
    Donc je pense mettre mes villes à détecter dans un tableau ? et faire une boucle le soir pour tester toutes les phrases.
    Alors puisque c'est un travail décalé sans interaction avec l'utilisateur, tu peux, pour chaque phrase, essayer cette requête :
    Code SQL : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    SELECT p.phr_id, p.phr_texte,
    	v.vil_id, v.vil_nom
    FROM te_phrase_phr p
    INNER JOIN te_ville_vil v ON p.phr_texte LIKE CONCAT('%', v.vil_nom, '%')

    Nota : Aucun index ne sera utilisé par cette requête et le SGBD devra donc balayer les 36000 villes pour chaque phrase.

    Si tu insères le résultat dans une table temporaire, tu pourras ensuite regarder les résultats et éliminer manuellement les mauvaises détections. Par exemple, ma requête va détecter la ville d'Eu, déjà évoquée, dans la phrase suivante : "J'ai eu 20 à mon partiel de bio cel !!! Trop content ! ".

    Pour insérer, inutile bien sûr de passer par une boucle en PHP sur le résultat de la requête ; il suffit de faire ceci :
    Code SQL : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    INSERT INTO te_ville_detectee_vdt(vdt_id_phrase, vdt_id_ville)
    SELECT p.phr_id, v.vil_id
    FROM te_phrase_phr p
    INNER JOIN te_ville_vil v ON p.phr_texte LIKE CONCAT('%', v.vil_nom, '%')

    Puis tu fais une vue pour rassembler les morceaux afin d'analyser les villes détectées :
    Code SQL : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    CREATE VIEW v_villes_detectees AS
    SELECT v.vil_id, v.vil_nom,
    	p.phr_id, p.phr_texte
    FROM te_ville_detectee vd
    INNER JOIN te_ville_vil v ON v.vil_id = vd.vil_id
    INNER JOIN te_phrase_phr p ON p.phr_id = vd.phr_id

    Là, par contre, la table te_ville_detectee_vdt peut très bien être indexée (c'est même conseillé) et les index seront utilisés par la vue qui sera donc exécutée très rapidement.

    À partir de ça, tu peux faire une interface d'administration qui affiche les villes détectées avec une case à cocher pour sélectionner les pertinentes qui méritent un tag puis la suite du processus pour affecter le tag ou les tags à la phrase.
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole. Autoentrepreneur.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  13. #13
    Membre régulier
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    181
    Détails du profil
    Informations personnelles :
    Localisation : France, Marne (Champagne Ardenne)

    Informations forums :
    Inscription : Juin 2006
    Messages : 181
    Points : 114
    Points
    114
    Par défaut
    Merci beaucoup CinePhil, je vais étudier cela, et réviser les requêtes mysql par la même occasion

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. recherche des doublons dans une hash
    Par Jasmine80 dans le forum Langage
    Réponses: 4
    Dernier message: 29/01/2007, 11h51
  2. recherche par mots dans une phrase ou titre
    Par pierrot67 dans le forum Bases de données
    Réponses: 3
    Dernier message: 11/09/2006, 09h29
  3. Recherche des symboles dans une lib c++
    Par firens dans le forum MFC
    Réponses: 4
    Dernier message: 31/03/2006, 14h56
  4. Affichage des chiffres dans une phrases arabe
    Par omda dans le forum Oracle
    Réponses: 4
    Dernier message: 30/09/2005, 13h36

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo