IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Java Discussion :

Extraire du texte en regex


Sujet :

Langage Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé Avatar de Emplyst
    Inscrit en
    Mars 2006
    Messages
    152
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 152
    Par défaut Extraire du texte en regex
    Bonjour!

    Voila, je sais que vous m'avez deja entendu chialer apres les regex mais la je crois que ca sagit d'un situation pour les utiliser ;p

    Enfin je me trouve a devoir extraire des informations d'une table acces plantee donc j'ai penser a pratiquer mon java ainsi.

    Donc en gros je me demandais si il etait possible d'extaire dans un tableau ou je sais pas quoi les informations que je cherche. Par exemple : String.format("%c%c[a-zA-Z]%c%c[a-zA-Z]%c%c", 0xff, 0xfe, 0x11, 0x12, 0x66, 0xff)
    afin d'extraire les deux sous chaines, en gros si vous pourriez me donner une explication rapide du fonctionnement ce serait apprecier

  2. #2
    Membre Expert
    Avatar de ®om
    Profil pro
    Inscrit en
    Janvier 2005
    Messages
    2 815
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2005
    Messages : 2 815
    Par défaut
    Citation Envoyé par Emplyst
    Bonjour!

    Voila, je sais que vous m'avez deja entendu chialer apres les regex mais la je crois que ca sagit d'un situation pour les utiliser ;p

    Enfin je me trouve a devoir extraire des informations d'une table acces plantee donc j'ai penser a pratiquer mon java ainsi.

    Donc en gros je me demandais si il etait possible d'extaire dans un tableau ou je sais pas quoi les informations que je cherche. Par exemple : String.format("%c%c[a-zA-Z]%c%c[a-zA-Z]%c%c", 0xff, 0xfe, 0x11, 0x12, 0x66, 0xff)
    afin d'extraire les deux sous chaines, en gros si vous pourriez me donner une explication rapide du fonctionnement ce serait apprecier
    Pour extraire un groupe, il suffit de le mettre entre parenthèses, et d'utiliser la classe Pattern et la méthode .matches()...

  3. #3
    Expert confirmé
    Avatar de le y@m's
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2005
    Messages
    2 636
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Février 2005
    Messages : 2 636
    Par défaut
    Citation Envoyé par ®om
    Pour extraire un groupe, il suffit de le mettre entre parenthèses, et d'utiliser la classe Pattern et la méthode .matches()...
    pour extraire un groupe il faut utiliser les méthodes find() et group() de la classe Matcher, la méthode matches() vérifie que la chaine, dans son intégralité, correspond au pattern spécifié.
    Je ne répondrai à aucune question technique par MP.

    Pensez aux Tutoriels et aux FAQs avant de poster ;) (pour le java il y a aussi JavaSearch), n'oubliez pas non plus la fonction Rechercher.
    Enfin, quand une solution a été trouvée à votre problème
    pensez au tag :resolu:

    Cours Dvp : http://ydisanto.developpez.com
    Blog : http://yann-disanto.blogspot.com/
    Page perso : http://yann-disanto.fr

  4. #4
    Membre confirmé Avatar de Emplyst
    Inscrit en
    Mars 2006
    Messages
    152
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 152
    Par défaut
    Bon la j'avoue que j'ai de la difficulte...
    Dison que j'ai une chaine de caractere qui se compose ainsi :
    ¤0204&Albert DupontA!v!o!c!a!t!1!P!E!R!S!0!&MASCULIN

    j'aimerais sortir d'un coups cans les differents groupes
    0204
    Albert Dupont
    Avocat
    1
    PERS
    0
    MASCULIN

    soustraire 0204 c'est deja simple (\\d){4} mais si je veux extraire Albert Dupond dans l'autre groupe en meme temps ca ne marche pas

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
     
    import java.util.regex.*;
     
    public class RegexTest
    {
    	public static void main(String[] args)
    	{
    		String data = "¤0204&Albert DupontA!v!o!c!a!t!1!P!E!R!S!0!&MASCULIN";
    		String filter = "(\\d){4}&(\\p{ASCII})*?!";
    		Pattern pattern = Pattern.compile(filter);
    		Matcher matcher = pattern.matcher(data);
     
    		while (matcher.find())
    		{
    			System.out.println(matcher.group());
    		}
    	}
    }
    Cela me retourne : 0204&Albert DupontA! et non :
    0204
    Albert DupontA

    Comment puis-je proceder?

  5. #5
    Membre Expert
    Avatar de ®om
    Profil pro
    Inscrit en
    Janvier 2005
    Messages
    2 815
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2005
    Messages : 2 815
    Par défaut
    Citation Envoyé par le y@m's
    pour extraire un groupe il faut utiliser les méthodes find() et group() de la classe Matcher, la méthode matches() vérifie que la chaine, dans son intégralité, correspond au pattern spécifié.
    Oui, exact, en fait c'est parce que la dernière fois que je l'ai utilisé, c'était avec la classe Scanner, ce qui donne:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    MatchResult mr = null;
    Scanner scanner = new Scanner(s);
    scanner.findInLine(pattern);
    try {
         mr = scanner.match();
    } catch(IllegalStateException e) {}
    scanner.close();

  6. #6
    Expert confirmé
    Avatar de le y@m's
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2005
    Messages
    2 636
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Février 2005
    Messages : 2 636
    Par défaut
    Bon, voila un code qui, à priori, fonctionne mais fait attention car si le format de la chaine de départ est différent cela risque de ne plus marcher (enfin tu adapte à ton besoin).
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
     
                Integer int1 = null;
                Integer int2 = null;
                Integer int3 = null;
                String string1 = null;
                String string2 = null;
                String string3 = null;
                String string4 = null;
     
                String data = "¤0204&Albert DupontA!v!o!c!a!t!1!P!E!R!S!0!&MASCULIN";
     
                Matcher matcher = Pattern.compile("\\d+").matcher(data);
                if(matcher.find()) {
                    int1 = Integer.parseInt(matcher.group());
                }
                matcher = Pattern.compile("[a-zA-Z]+$").matcher(data);
                if(matcher.find()) {
                    string4 = matcher.group();
                    data = data.replaceAll("[a-zA-Z]$", "");
                }
     
                matcher = Pattern.compile("(\\w!)+").matcher(data);
                if(matcher.find()) {
                    String temp = matcher.group().replaceAll("!", "");
                    matcher = Pattern.compile("[a-zA-Z]+").matcher(temp);
                    if(matcher.find()) {
                        string2 = matcher.group();
                        if(matcher.find()) {
                            string3 = matcher.group();
                        }
                    }
                    matcher = Pattern.compile("\\d").matcher(temp);
                    if(matcher.find()) {
                        int2 = Integer.parseInt(matcher.group());
                        if(matcher.find()) {
                            int3 = Integer.parseInt(matcher.group());
                        }
                    }
                    data = data.replaceAll("(\\w!)+", "");
                }
                matcher = Pattern.compile("[a-zA-Z ]+").matcher(data);
                if(matcher.find()) {
                    string1 = matcher.group();
                }
     
                System.out.println("int1 (0204 -> 204) : " + int1);
                System.out.println("string1 (Albert Dupont) : " + string1);
                System.out.println("string2 (Avocat) : " + string2);
                System.out.println("int2 (1) : " + int2);
                System.out.println("string3 (PERS) : " + string3);
                System.out.println("int3 (0) : " + int3);
                System.out.println("string4 (MASCULIN) : " + string4);
    Je ne répondrai à aucune question technique par MP.

    Pensez aux Tutoriels et aux FAQs avant de poster ;) (pour le java il y a aussi JavaSearch), n'oubliez pas non plus la fonction Rechercher.
    Enfin, quand une solution a été trouvée à votre problème
    pensez au tag :resolu:

    Cours Dvp : http://ydisanto.developpez.com
    Blog : http://yann-disanto.blogspot.com/
    Page perso : http://yann-disanto.fr

  7. #7
    Membre confirmé Avatar de Emplyst
    Inscrit en
    Mars 2006
    Messages
    152
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 152
    Par défaut
    Okay moi je pensais qu'on pouvait faire ca d'un coups comme par magie dommage

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [FPDF] Extraire le texte d'un fichier PDF
    Par brune38 dans le forum Bibliothèques et frameworks
    Réponses: 3
    Dernier message: 13/10/2009, 10h26
  2. Réponses: 3
    Dernier message: 21/05/2008, 18h24
  3. [COM] Extraire le texte d'un fichier "word" (.doc) avec
    Par ptikiwi dans le forum Bibliothèques et frameworks
    Réponses: 6
    Dernier message: 09/06/2006, 17h06
  4. EXTRAIRE DU TEXTE
    Par chekibperl dans le forum Langage
    Réponses: 5
    Dernier message: 21/10/2005, 18h23
  5. Extraire du texte et réafficher la suite
    Par freud dans le forum ASP
    Réponses: 4
    Dernier message: 20/06/2005, 09h06

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo