IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Annotation d'URIs dans un texte segmenté


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Nouveau candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2016
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2016
    Messages : 1
    Par défaut Annotation d'URIs dans un texte segmenté
    Bonjour,

    Je code un petit programme qui (entre autre), à partir de mots présents dans un lexique reprenant le mot et son uri, repère chaque phrase d'un texte segmenté qui contient le mot de ce lexique. Chacune de ces phrases doivent s'ajouter à une nouvelle liste (ci-dessous "new_list").

    Voici un exemple simplifié:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
     
    sents = ['Bonjour, vous allez bien?', 'Au revoir' , 'bye bye' , 'Merci. A ce soir!'] 
    lexic = [('Bonjour', 'http://bonjour.com') , ('bien', 'http://bien.com') , ('bye', 'http://bye.com')] 
    new_list = []
     
    for s in sents:
    	for l in lexic:
    		if l[0] in s:
    			s = s + " <" + l[1] + ">"      #J'ajoute l'uri du mot présent dans le lexique à la fin de la phrase.
    			new_list.append(s)
     
    print(new_list)
    J'aimerais comme résultat dans "new_list" : ['Bonjour, vous allez bien? <http://bonjour.com> <http://bien.com>' , ...]. Or il ajoute à new_list deux fois la phrase ; une fois pour chaque occurence : ['Bonjour, vous allez bien? <http://bonjour.com>', 'Bonjour, vous allez bien? <http://bonjour.com><http://bien.com>', ...].
    Et c'est très logique d'ailleurs si on analyse le fonctionnement de la boucle... Seulement je suis un peu à court d'idées, je suis pourtant sûr qu'il doit exister une parade très simple :/

    Merci d'avance ! (J'espère que c'est plus ou moins clair :p)

  2. #2
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 738
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 738
    Par défaut
    Salut,

    Citation Envoyé par heydgee Voir le message
    J'aimerais comme résultat dans "new_list" : ['Bonjour, vous allez bien? <http://bonjour.com> <http://bien.com>' , ...]. Or il ajoute à new_list deux fois la phrase ; une fois pour chaque occurence : ['Bonjour, vous allez bien? <http://bonjour.com>', 'Bonjour, vous allez bien? <http://bonjour.com><http://bien.com>', ...].
    Et c'est très logique d'ailleurs si on analyse le fonctionnement de la boucle... Seulement je suis un peu à court d'idées, je suis pourtant sûr qu'il doit exister une parade très simple :/
    Je dirais que dès l'URL trouvée, vous vous empressez de l'ajouter à la phrase en créant une nouvelle phrase. S'il y a deux ajouts, vous ajoutez 2 fois... logique!
    Dans la boucle qui trouve les mots de la phrase présents dans le lexique, contentez vous de construire la chaine de caractère à ajouter.
    En sortie de boucle, vous fabriquez la chaine de caractères qui sera ajoutée à new_list à partir de la phrase et de ce qui a été construit dans la boucle précédente.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

Discussions similaires

  1. Utilisation de replace dans champs text
    Par cdelamarre dans le forum PostgreSQL
    Réponses: 5
    Dernier message: 01/12/2004, 17h26
  2. [ Vector Fichier ] Vector dans fichier texte
    Par geegee dans le forum Langage
    Réponses: 5
    Dernier message: 21/05/2004, 13h56
  3. Insertion dans fichier texte + rapide que TStringList ?
    Par benj63 dans le forum C++Builder
    Réponses: 8
    Dernier message: 26/02/2004, 11h34
  4. Que privilégier : %like% dans champs texte, ou plain text ?
    Par Dimitri01 dans le forum Langage SQL
    Réponses: 4
    Dernier message: 31/01/2004, 11h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo