IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Java Discussion :

Patrons pour extraire les titres


Sujet :

Java

  1. #1
    Nouveau membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Décembre 2011
    Messages
    57
    Détails du profil
    Informations personnelles :
    Sexe : Femme

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Décembre 2011
    Messages : 57
    Points : 25
    Points
    25
    Par défaut Patrons pour extraire les titres
    Bonjour,



    j'ai besoin d'un programme java permettant d'extraire les titres et les sous titres d'un fichier texte. J'ai eu l'idée de construire des patrons pour les numérotation et les chiffres romains mais j'ai pas reçu quelqu'un peux m'aider ou me proposer une autre idée permettant de détecter les titres des différentes sections de mon texte.

  2. #2
    Expert éminent sénior
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 481
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 481
    Points : 48 806
    Points
    48 806
    Par défaut
    Tu n'a pas reçu quoi?

    Quel type de fichier texte?
    Il y a quoi là dedans.

    Extraire les titres, c'est vague.

  3. #3
    Modérateur
    Avatar de wax78
    Homme Profil pro
    Chef programmeur
    Inscrit en
    Août 2006
    Messages
    4 074
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : Belgique

    Informations professionnelles :
    Activité : Chef programmeur
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Août 2006
    Messages : 4 074
    Points : 7 978
    Points
    7 978
    Par défaut
    Faudrait donner quelques exemples concret et exhaustifs du genre de texte peut être pour pouvoir t'aiguiller vers quelques choses du genre des regexp par exemple.
    (Les "ça ne marche pas", même écrits sans faute(s), vous porteront discrédit ad vitam æternam et malheur pendant 7 ans)

    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  4. #4
    Membre éclairé Avatar de Ceddoc
    Homme Profil pro
    Développeur Java
    Inscrit en
    Janvier 2009
    Messages
    493
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Développeur Java
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Janvier 2009
    Messages : 493
    Points : 698
    Points
    698
    Par défaut
    Ton pattern commencera sûrement par quelque chose du genre pour dire que la chaîne commence par des caractères romains. Ensuite il faut dire que tu attends n'importe quel caractère ou espace.

    J'ai trouvé Cette page qui est sympa pour tester rapidement ses regex.

  5. #5
    Nouveau membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Décembre 2011
    Messages
    57
    Détails du profil
    Informations personnelles :
    Sexe : Femme

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Décembre 2011
    Messages : 57
    Points : 25
    Points
    25
    Par défaut
    Merci pour vos réponses
    j'ai essayé l'expression que vous m'avez proposé elle marche bien pour les chiffres romains merci beaucoup Ceddoc

    Citation Envoyé par tchize_ Voir le message
    Tu n'a pas reçu quoi?

    Quel type de fichier texte?
    Il y a quoi là dedans.

    Extraire les titres, c'est vague.
    En fait, il s'agit des cours en format pdf dont je fais la conversion pour les transformer en fichier texte. Ces cours sont divisés en sections ou sous section je voulais détecter les numéros de ces sections ( des chiffres ou des chiffres romains) pour extraire la liste des titres se trouvant dans chaque fichier.

  6. #6
    Expert éminent sénior
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 481
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 481
    Points : 48 806
    Points
    48 806
    Par défaut
    Vu que c'est un PDF, pourquoi tu ne te base simplement pas sur le Style du texte? Je suppose que les polices des sections / sous sections ne sont pas les même que pour le contenu....

  7. #7
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 551
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 551
    Points : 21 607
    Points
    21 607
    Par défaut
    Citation Envoyé par mimihh Voir le message
    j'ai essayé l'expression que vous m'avez proposé elle marche bien pour les chiffres romains merci beaucoup Ceddoc
    Bien sûr elle marche aussi pour tout ce qui commence par un I, V, X, C ou M
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  8. #8
    Nouveau membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Décembre 2011
    Messages
    57
    Détails du profil
    Informations personnelles :
    Sexe : Femme

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Décembre 2011
    Messages : 57
    Points : 25
    Points
    25
    Par défaut
    En utilisant cette expression les titres commençant par des chiffres romains sont extraits mais j'obtient aussi d'autres lignes qui ne contiennent pas ces chiffres je sais pas pourquoi?

    Citation Envoyé par tchize_ Voir le message
    Vu que c'est un PDF, pourquoi tu ne te base simplement pas sur le Style du texte? Je suppose que les polices des sections / sous sections ne sont pas les même que pour le contenu....
    Et comment pourrais-je faire ça stp??

  9. #9
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 551
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 551
    Points : 21 607
    Points
    21 607
    Par défaut
    Citation Envoyé par mimihh Voir le message
    En utilisant cette expression les titres commençant par des chiffres romains sont extraits mais j'obtient aussi d'autres lignes qui ne contiennent pas ces chiffres je sais pas pourquoi?
    Bah je viens de le dire, juste au-dessus.
    Cette expression prend tout ce qui commence par un I, V, X, C ou M.

    Citation Envoyé par mimihh Voir le message
    Citation Envoyé par tchize_ Voir le message
    Vu que c'est un PDF, pourquoi tu ne te base simplement pas sur le Style du texte? Je suppose que les polices des sections / sous sections ne sont pas les même que pour le contenu....
    Et comment pourrais-je faire ça stp??
    Avec une bibliothèque genre iText, et du travail.

    Personnellement je suis pas convaincu que ce soit plus simple. Mais c'est plus sûr.
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  10. #10
    Nouveau membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Décembre 2011
    Messages
    57
    Détails du profil
    Informations personnelles :
    Sexe : Femme

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Décembre 2011
    Messages : 57
    Points : 25
    Points
    25
    Par défaut
    En fait dans mon code je teste sur les lignes commençant par un chiffre romains suivi d'un "." ou un "-" ou un "/" ou une ")" mais ce programme me donne en output toutes les lignes commençant par un chiffre romain et celles qui commencent par un "-" je sais pas pourquoi

  11. #11
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 551
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 551
    Points : 21 607
    Points
    21 607
    Par défaut
    Ok, dans ce cas il aurait fallu mettre un + au lieu d'une *
    Le * autorise aussi "zéro chiffre romain." Le + exige "au moins un chiffre romain, et autant qu'on veut derrière."
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  12. #12
    Nouveau membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Décembre 2011
    Messages
    57
    Détails du profil
    Informations personnelles :
    Sexe : Femme

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Décembre 2011
    Messages : 57
    Points : 25
    Points
    25
    Par défaut
    Super ça fonctionne bien merci beaucoup

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 2
    Dernier message: 11/04/2009, 11h04
  2. SQL syntax pour extraire les multiples
    Par olibara dans le forum Requêtes
    Réponses: 1
    Dernier message: 17/06/2008, 09h32
  3. TAB pour hiérarchiser les titres ne fonctionne plus
    Par romanokiss dans le forum Word
    Réponses: 3
    Dernier message: 09/01/2008, 20h05
  4. Réponses: 0
    Dernier message: 15/03/2007, 13h45
  5. Pour extraire les données d'un fichier texte
    Par Floch dans le forum Access
    Réponses: 2
    Dernier message: 02/05/2006, 15h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo