IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

probleme avec regex extraire deux phrases autour d'un keyword.


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2014
    Messages
    36
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2014
    Messages : 36
    Par défaut probleme avec regex extraire deux phrases autour d'un keyword.
    Bonjour à tous.
    Je débute sur Python et je suis confronté à un problème. Prenons nl'extrait suivant :

    BLALBLABLA. Le mot qui suit est très important. Il s'agit du keyword qui voici. Nous allons en parler. blablabla
    Dans mon exemple, j'aimerais extraire la phrase dans laquelle se trouve le keyword et aussi celle qui précède et celle qui suit.
    Pour la phrase cible, j'ai trouvé :
    ([^.!?]*[\b\s]keyword[\b\s][^.!?]*)

    Comment faire pour les phrases autour de la phrase cible ? Je n'y arrive pas.

    Merci d'avance

  2. #2
    Membre Expert
    Avatar de MPython Alaplancha
    Homme Profil pro
    Paysan à 3 francs six sous
    Inscrit en
    Juin 2018
    Messages
    923
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Paysan à 3 francs six sous
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Juin 2018
    Messages : 923
    Billets dans le blog
    8
    Par défaut
    Bonjour,
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    >>> pattern = "\.?(.+keyword.+\.)"
    >>> match = re.findall(pattern, s)
    >>> print(match)
    [" Le mot qui suit est très important. Il s'agit du keyword qui voici. Nous allons en parler."]
    édit : ajout du ? ...

  3. #3
    Expert confirmé
    Avatar de jurassic pork
    Homme Profil pro
    Bidouilleur
    Inscrit en
    Décembre 2008
    Messages
    4 217
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Bidouilleur
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2008
    Messages : 4 217
    Par défaut
    hello,
    cela m'étonnerait que le motif d'hominidé fonctionne dans tous les cas de figures (ex : plus d'1 phrase devant et derrière la phrase qui contient le mot-clé)
    Si l'utilisation d'un regex n'est pas obligatoire dans le cas présent , on peut s'en sortir en "éclatant" les phrases dans une liste, comme ceci par exemple :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    s = "Phrase1. Phrase2. Le mot qui suit est très important. Il s'agit du keyword qui voici. Nous allons en parler. Dernière phrase."
    listePhrases = s.split('.')
    indiceKeyword = [i for i, s in enumerate(listePhrases) if 'keyword' in s]
    ikw = indiceKeyword[0]
    if (ikw > 0) and (len(listePhrases) > ikw+1):
        solution = listePhrases[ikw-1:ikw+2]
        print(solution)
    Résultat :
    [Python3.8]
    >>> [' Le mot qui suit est très important', " Il s'agit du keyword qui voici", ' Nous allons en parler']
    Pour les cas particuliers (ex: pas de phrase devant, pas de phrase derrière, le mot clé présent dans plusieurs phrases), il faudra rajouter des conditions.

    Ami calmant, J.P

  4. #4
    Membre Expert
    Avatar de MPython Alaplancha
    Homme Profil pro
    Paysan à 3 francs six sous
    Inscrit en
    Juin 2018
    Messages
    923
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Paysan à 3 francs six sous
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Juin 2018
    Messages : 923
    Billets dans le blog
    8
    Par défaut
    Citation Envoyé par jurassic pork Voir le message
    hello,
    cela m'étonnerait que le motif d'hominidé fonctionne dans tous les cas de figures (ex : plus d'1 phrase devant et derrière la phrase qui contient le mot-clé)
    Bonjour @jurassic pork,
    Bien vu.
    Peut être alors comme ceci:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    pattern=r".*([A-Z].+\..+keyword.+?\..+?\.)
    "
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    >>> import re
    >>> s = "Phrase1. Phrase2. Le mot qui suit est très important. Il s'agit du keyword qui voici. Nous allons en parler. Dernière phrase."
    >>> pattern = r".*([A-Z].+\..+keyword.+?\..+?\.)"
    >>> match = re.findall(pattern, s)
    >>> print(match)
    ["Le mot qui suit est très important. Il s'agit du keyword qui voici. Nous allons en parler."]

Discussions similaires

  1. Problem avec relation entre deux feuiles
    Par eeyan.18 dans le forum Macros et VBA Excel
    Réponses: 2
    Dernier message: 16/04/2015, 11h42
  2. Probleme avec regex multiline
    Par GruZloR dans le forum Général VBA
    Réponses: 0
    Dernier message: 08/04/2012, 04h55
  3. Probleme avec regex pour une soustraction de charactére
    Par Sioul88 dans le forum Collection et Stream
    Réponses: 2
    Dernier message: 05/06/2008, 14h45
  4. Probleme avec REGEX sous IE
    Par Death83 dans le forum Général JavaScript
    Réponses: 17
    Dernier message: 18/07/2006, 20h02
  5. Problem avec un REGEX
    Par Death83 dans le forum Langage
    Réponses: 1
    Dernier message: 23/12/2005, 22h36

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo