IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

Mise en majuscule


Sujet :

Langage Perl

  1. #1
    Futur Membre du Club
    Femme Profil pro
    Inscrit en
    Décembre 2012
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Femme

    Informations forums :
    Inscription : Décembre 2012
    Messages : 4
    Points : 5
    Points
    5
    Par défaut Mise en majuscule
    Bonjour,

    Je débute en programmation Perl. J'ai à ma disposition un texte dont chaque phrase ne débute pas par une majuscule. Je souhaite faire un script qui permette de réafficher ce texte avec les débuts de phrases en majuscule.

    Auriez-vous une idée de la démarche à suivre, un pseudocode ?

    Merci.

  2. #2
    Rédacteur/Modérateur

    Avatar de Lolo78
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Mai 2012
    Messages
    3 612
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2012
    Messages : 3 612
    Points : 12 469
    Points
    12 469
    Billets dans le blog
    1
    Par défaut
    La difficulté est d'identifier le début d'une phrase.

    Si je considère que le point suivi d'un ou plusieurs espace(s) puis d'une lettre quelconque délimite un début de phrase, je peux faire quelque chose comme ceci:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    my $c = "toto. titi. tutu. tata.";
    $c =~ s/(\.\s+\w)/uc($1)/ge;
    print $c, "\n";
    Ce qui m'affiche:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    toto. Titi. Tutu. Tata.
    Comme on peut le voir, cette méthode simpliste marche, sauf pour la première phrase qui n'est évidemment pas précédée d'un point.

    En modifiant l'expression régulière:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $c =~ s/(\w)(\w+\.)/uc($1).$2/ge
    j'obtiens un progrès:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    Toto. Titi. Tutu. Tata.
    Mais pas sûr que ça marche dans des cas plus compliqués...

  3. #3
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    Plusieurs choses :
    - dans la liste des points qui nécessitent d'utiliser une majuscule, il y a également le point d'interrogation et d'exclamation.
    - une chaine pourra sans doute comporter des retours à la ligne, il faudra donc penser à utiliser le modificateur /s si on utilise .
    - la fonction uc met tout le mot en majuscule, il convient plutôt d'utiliser la fonction ucfirst qui ne met que le premier caractère en majuscule.

    Pour prendre en compte ces éléments, voici peut-être une solution :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    my $s = "toto est malade. il n ira pas\nà l école. faut-il appeler le médecin ?\nc est fort probable";
    $s =~ s/(?:^|[\.\?!]\s*)\K(\w+)/ucfirst($1)/ges;
    Plus j'apprends, et plus je mesure mon ignorance (philou67430)
    Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book)
    Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé
    Si c'est utile, say

  4. #4
    Rédacteur/Modérateur

    Avatar de Lolo78
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Mai 2012
    Messages
    3 612
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2012
    Messages : 3 612
    Points : 12 469
    Points
    12 469
    Billets dans le blog
    1
    Par défaut
    Ben oui, comme je l'ai dit, tout le problème est d'identifier le début d'une phrase.

    En fait, sur ce genre de questions, il faut au minimum un échantillon des données en entrée pour évaluer ce qu'il y a à faire. Mon post ne visait qu'à donner une idée de ce qui peut être fait, certainement pas à donner une solution.

    @titoupet: poste un échantillon du texte que tu veux retraiter, ainsi que de ce que tu as essayé de coder (avec ou sans l'aide de ce que Philou et moi avons proposé).

  5. #5
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    Salut lolo, je n'avais pas vu quand dans ta regexp, tu avais isolé la première lettre du mot, et donc utilisé uc pour celle-ci, ce qui ne nécessite évidemment pas d'utiliser ucfirst comme dans ma regexp qui elle, prend en compte un mot complet.

    Sinon, nos deux regexp ont un fonctionnement différent :
    - dans la tienne, tu matches d'abord le premier caractère d'une phrase, et tu "manges" le reste de la phrase jusqu'à la fin de phrase (terminé par un point). Dans ce contexte, il faut définir toutes les caractères possible d'une phrase (genre s/(\w)([^\.\?\!]+[\.\?\!]+)/uc($1).$2/ges) ; pour faire fonctionner cette regexp avec ma chaine il ne faut pas oublier d'ajouter une marque de fin de phrase à la dernière phrase ;
    - dans la mienne, je matches d'abord une fin de phrase (ou un début de chaine), que je laisse inchangé à l'aide de \K et je modifie le mot qui suit (j'aurais aussi pu ne modifier que le premier caractère, comme ceci s/(?:^|[\.\?!]\s*)\K(\w)/uc($1)/ges).
    Plus j'apprends, et plus je mesure mon ignorance (philou67430)
    Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book)
    Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé
    Si c'est utile, say

Discussions similaires

  1. [XL-2007] Cellule saisie mise en majuscule après validation
    Par NEC14 dans le forum Macros et VBA Excel
    Réponses: 10
    Dernier message: 23/07/2010, 18h45
  2. Mise en majuscules
    Par epoc.01 dans le forum Langage
    Réponses: 1
    Dernier message: 30/07/2009, 18h40
  3. Réponses: 1
    Dernier message: 09/10/2008, 15h17
  4. Mise en majuscule de données
    Par khristof17 dans le forum MS SQL Server
    Réponses: 1
    Dernier message: 14/12/2007, 13h20
  5. Suppression des accents et mise en Majuscules
    Par mlzim dans le forum Contribuez
    Réponses: 4
    Dernier message: 07/11/2007, 12h07

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo