IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

segmentation d'un document en section


Sujet :

Langage Perl

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    39
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2006
    Messages : 39
    Par défaut segmentation d'un document en section
    Bonjour,

    est-il possible de baliser un texte en section mais automatiquement avec un script Perl.
    par exemple si je prend un article composé d'une intro, de 4 titre et d'une conclusion, je veux le baliser en paragraphes avec comme balise into, titre 1.. conclusion.

    Mes salutations.

  2. #2
    Membre confirmé
    Profil pro
    Inscrit en
    Février 2006
    Messages
    38
    Détails du profil
    Informations personnelles :
    Âge : 41
    Localisation : France

    Informations forums :
    Inscription : Février 2006
    Messages : 38
    Par défaut
    Salut.
    Je te poserais juste une petite question :
    Les titres sont-ils parfaitement identifiables?
    Par exemple :
    1]Titre 1
    1.1]Sous-Titre1
    etc...
    Si c'est le cas tu prend le pattern d'un titre et tu crée une expression régulière qui repère chaque titre et ajoute une balise.
    Dans l'exemple que je t'ai donné cela ferais un truc du genre :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
     
    #$texte contient le texte de ton fichier.
    $texte=GetText;
    #Si tu veux remplacer le titre par la balise
    $texte=~s/\](.*)\n/<$1>/g;
    #Si tu veux l'ajouter
    $texte=~s/(\](.*)\n)/$1<$2>\n/g;

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    39
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2006
    Messages : 39
    Par défaut nn
    Citation Envoyé par knarf87 Voir le message
    Salut.
    Je te poserais juste une petite question :
    Les titres sont-ils parfaitement identifiables?
    Par exemple :
    1]Titre 1
    1.1]Sous-Titre1
    etc...
    Si c'est le cas tu prend le pattern d'un titre et tu crée une expression régulière qui repère chaque titre et ajoute une balise.
    Dans l'exemple que je t'ai donné cela ferais un truc du genre :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
     
    #$texte contient le texte de ton fichier.
    $texte=GetText;
    #Si tu veux remplacer le titre par la balise
    $texte=~s/\](.*)\n/<$1>/g;
    #Si tu veux l'ajouter
    $texte=~s/(\](.*)\n)/$1<$2>\n/g;

    je travaille sur des textes qui respectent aucune logique, comme le TEI, c'est un peu compliqué

  4. #4
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    Si tu veux écrire un script perl, il faudrait que tu identifies les informations te permettant de définir la section dans laquelle tu te trouves. Cela pourrait-être certains caractères comme les tabulations. Si tu n'as vraiment pas de cohérence, je pense que ce n'est pas possible.

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    39
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2006
    Messages : 39
    Par défaut
    Citation Envoyé par Jasmine80 Voir le message
    Si tu veux écrire un script perl, il faudrait que tu identifies les informations te permettant de définir la section dans laquelle tu te trouves. Cela pourrait-être certains caractères comme les tabulations. Si tu n'as vraiment pas de cohérence, je pense que ce n'est pas possible.
    moi aussi je vois pas que c 'est possible, car je reçois des textes qui sont pas identiques, tous ce que j'ai pu faire c'est le balisage des mots , ensuite je ferai la recherche sur les mots, et je garde les textes brut pour les extraire après.

    Merci

  6. #6
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    tous ce que j'ai pu faire c'est le balisage des mots , ensuite je ferai la recherche sur les mots, et je garde les textes brut pour les extraire après.
    Avec perl? Sur quelles bases balises-tu tes mots? Les recherches de mots en perl sont très puissantes grâce aux expressions régulières.
    Si tu as d'autres questions, n'hésite pas. Sinon indique que ce sujet est résolu.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [WD-2007] comment numéroter un document avec sections ?
    Par siempre dans le forum Word
    Réponses: 10
    Dernier message: 21/06/2010, 22h21
  2. [WD-2007] Numérotation de document ET de section
    Par DanTesS dans le forum Word
    Réponses: 1
    Dernier message: 28/08/2009, 17h10
  3. Enlever des notes stylo sur un document par segmentation ?
    Par fredo0877 dans le forum Traitement d'images
    Réponses: 4
    Dernier message: 17/07/2009, 10h13
  4. Réponses: 21
    Dernier message: 07/09/2007, 10h38

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo