IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Java Discussion :

Regex : Extraire les numéro compris dans une chaine


Sujet :

Java

  1. #1
    Membre à l'essai
    Homme Profil pro
    Développeur Java
    Inscrit en
    juin 2022
    Messages
    33
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : juin 2022
    Messages : 33
    Points : 14
    Points
    14
    Par défaut Regex : Extraire les numéro compris dans une chaine
    Bonjour les expert regex,

    J'aimerai mettre les enregistrements provenant d'un ArrayList les uns à la suite des autres pour chaque L1, L2, L3 etc...

    Exemple:
    L1_C1, L1_C2, L1_C3, ..;L1_C122,
    L2_C1, L2_C2, L2_C3, ...;L2_C80,
    L3_C1, L1_C50,
    L4_

    Actuellement, j'ai cela comme affichage et c'est pas ce que je souhaite faire :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    L1_C1_0
    L1_C2_"11299"
    L1_C3_"CHK_CASHING_CHECK_CREDITED_20210329_11299_EUR_S"
    L1_C22_"FR80753886092"
    L2_C1_0
    L2_C2_"11299"
    L2_C3_"CHK_CASHING_CHECK_IN_PROGRESS_20210329_11299_EUR_S"
    L2_C22_"FR80753886092"
    L3_C1_0
    L3_C2_"11299"
    L3_C3_"FRAUD_REGUL_LOSS_20210329_11299_EUR_S"
    L3_C22_"FR80753886092"
    L4_C1_0
    L4_C2_"11299"
    L4_C3_"SEIZURE_SEIZURE_20210329_11299_EUR_S"
    L4_C22_"FR80753886092"
    Avec ce code :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    int m, n
    		//List al1 = new ArrayList()
    		try{
    			FileWriter writer = new FileWriter(path+file3)
    			writer.append(result1)
    			writer.append('\n')
    			writer.append("1BIS ----- NB ligne 1er fichier: ("+file1+") "+numLigneA)
    			writer.append('\n')
    			writer.append("1BIS ----- NB ligne 2eme fichier: ("+file2+") "+numLigneB)
    			writer.append('\n')
    			for(m = 0 ; m < al1.size(); m++){
    				writer.append(""+al1.get(m))
    				/*if (al1.contains("L1")){
    					println("L1")
    				}*/
    				println("2 ----- Différence constaté = "+al1.get(m))
    				writer.append('\n')
    			}
    			writer.flush()
    			writer.close()
    			//println("------------------------------------------------------------------ FIN DERNIER TRAITEMENT ------------------------------------------------------------------");
    
    		}catch(IOException e){
    			e.printStackTrace()
    		}
    		println("^^^^^^^^^^^^^^^^^^^^^^^^^^^FIN^^^^^^^^^^^^^^^^^^^^^^^^^^^")// pour mettre en avant la FIN du programme (meilleure de lisibilité)
    		println("")
    	}
    Je sais qu'il faut utiliser les Regex mais je ne sais pas comment m'y prendre sachant que cela fait trés longtemps que je n'ai plus fait de Java.

    Quelqu'un pourrait-il m'aider à réaliser mon rêve ?

    Merci pour votre retour

  2. #2
    Modérateur

    Profil pro
    Inscrit en
    septembre 2004
    Messages
    12 410
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : septembre 2004
    Messages : 12 410
    Points : 21 007
    Points
    21 007
    Par défaut
    Hello,

    l'exemple est mauvais, on ne peut pas comprendre ce que tu veux faire.

    Il faut des exemples avec lesquels on comprendrait ce que tu veux faire.
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  3. #3
    Membre à l'essai
    Homme Profil pro
    Développeur Java
    Inscrit en
    juin 2022
    Messages
    33
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : juin 2022
    Messages : 33
    Points : 14
    Points
    14
    Par défaut
    C'est pourtant simple à comprendre et c'est ce que l'on m'a demandé de faire
    Qu'est-ce qui est mauvais ?

    Il y'a moyen de faire un truc avec les substrings pour si retrouver mais je peine...

  4. #4
    Membre émérite Avatar de tsuji
    Inscrit en
    octobre 2011
    Messages
    1 558
    Détails du profil
    Informations forums :
    Inscription : octobre 2011
    Messages : 1 558
    Points : 2 734
    Points
    2 734
    Par défaut
    Moi non plus, je ne comprends ce que c'est le but du code montré ...

    Pourtant, je peux vous montrer comment transformer les données originelles en forme de ArrayList à la forme désirée (si je comprends bien à cet égard). Je prends 4 groupes d'entrées comme demo et les fais transformés ...
    Code java : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
        List<String> donnees=new ArrayList<String>();
        List<String> transformees=new ArrayList<String>();
     
        donnees.add("L1_C1_0");
        donnees.add("L1_C2_\"11299\"");        
        donnees.add("L1_C3_\"CHK_CASHING_CHECK_CREDITED_20210329_11299_EUR_S\"");
        donnees.add("L1_C22_\"FR80753886092\"");
        donnees.add("L2_C1_0");
        donnees.add("L2_C2_\"11299\"");
        donnees.add("L2_C3_\"CHK_CASHING_CHECK_IN_PROGRESS_20210329_11299_EUR_S\"");
        donnees.add("L2_C22_\"FR80753886092\"");
        donnees.add("L3_C1_0");
        donnees.add("L3_C2_\"11299\"");
        donnees.add("L3_C3_\"FRAUD_REGUL_LOSS_20210329_11299_EUR_S\"");
        donnees.add("L3_C22_\"FR80753886092\"");
        donnees.add("L4_C1_0");
        donnees.add("L4_C2_\"11299\"");
        donnees.add("L4_C3_\"SEIZURE_SEIZURE_20210329_11299_EUR_S\"");
        donnees.add("L4_C22_\"FR80753886092\"");
     
        String sdonnees=String.join(",",donnees);
        String spattern="(L(\\d)_C\\d_\\d.*?L\\2_C\\d{2}_\".*?\"(?:,?$?))(?!L\\2_)";
        Pattern p=Pattern.compile(spattern);
     
        Matcher m=p.matcher(sdonnees);
     
        int count=0;
        while(m.find()) {
            count++;
            System.out.println("Match no "+count);
            System.out.println(sdonnees.substring(m.start(),m.end()));
            transformees.add(sdonnees.substring(m.start(),m.end()));
        }
     
        System.out.printf("\ntransformee size(): %d\n", transformees.size());

    Je prends une décision rapide d'équilbre de bien usage tout en ne pas mettre le pattern de regex trop compliqué. Le pattern n'est certainement pas unique. Vous pouvez le modifier comme vous souhaitez pour refléter la structure plus fine des données réelles.

  5. #5
    Membre à l'essai
    Homme Profil pro
    Développeur Java
    Inscrit en
    juin 2022
    Messages
    33
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : juin 2022
    Messages : 33
    Points : 14
    Points
    14
    Par défaut
    Je ne peux pas executer ton code.

    Il y'a une erreur rouge de ce type :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    illegal string body character after dollar sign; solution: either escape a literal dollar sign "\$5" or bracket the value expression "${5}" @ line 41, column 63.
    sur cette ligne :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    String spattern="(L(\\d)_C\\d_\\d.*?L\\2_C\\d{2}_\".*?\"(?:,?$?))(?!L\\2_)";

  6. #6
    Membre émérite Avatar de tsuji
    Inscrit en
    octobre 2011
    Messages
    1 558
    Détails du profil
    Informations forums :
    Inscription : octobre 2011
    Messages : 1 558
    Points : 2 734
    Points
    2 734
    Par défaut
    illegal string body character after dollar sign; solution: either escape a literal dollar sign "\$5"...
    Pourquoi le message d'erreur s'écrit $5 avec 5 après $ ? Erreur ou pas, c'est $? dollar sign puis point d'interrogation.

    Je viens de faire exécuter le code en jdk 8, 11, 17, Amazon Coretto 18 sans aucun problème - ce qui est attendu.

    Fait copier et coller du code exact et refait le test si tu veut. A mon coté, je n'ai rien à dire de plus.

  7. #7
    Membre à l'essai
    Homme Profil pro
    Développeur Java
    Inscrit en
    juin 2022
    Messages
    33
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : juin 2022
    Messages : 33
    Points : 14
    Points
    14
    Par défaut
    Je suis en Groovy dsl, pas en Java.

    C'est une Erreur Groovy :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    Groovy:illegal string body character after dollar sign;
    Du coup, obligé de laissé l'anti-slash comme cela:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    String spattern="(L(\\d)_C\\d_\\d.*?L\\2_C\\d{2}_\".*?\"(?:,?\$?))(?!L\\2_)";
    Du coup, ta solution cela fonctionne jusqu'au 9ème Enregistrement.

    Il ne me prend pas la "L10_..."

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    sdonnees: L1_C1_0,L1_C2_"11299",L1_C3_"CHK_CASHING_CHECK_CREDITED_20210329_11299_EUR_S",L1_C22_"FR80753886092",L2_C1_0,L2_C2_"11299",L2_C3_"CHK_CASHING_CHECK_IN_PROGRESS_20210329_11299_EUR_S",L2_C22_"FR80753886092",L3_C1_0,L3_C2_"11299",L3_C3_"FRAUD_REGUL_LOSS_20210329_11299_EUR_S",L3_C22_"FR80753886092",L4_C1_0,L4_C2_"11299",L4_C3_"SEIZURE_SEIZURE_20210329_11299_EUR_S",L4_C22_"FR80753886092",L5_C1_1,L5_C2_"11299",L5_C3_"CHK_CASHING_CHECK_CREDITED_20210329_11299_EUR_S",L5_C10_"000019596000000005",L5_C16_"00100.365623000.00000.00000.00000.00000.00000.00000",L5_C59_"11299.FR.ISIE.AUTRES.ZXIH.SALES.zip",L5_C62_"000019597000000001",L5_C117_"19596000000005",L6_C1_1,L6_C2_"11299",L6_C3_"CHK_CASHING_CHECK_CREDITED_20210329_11299_EUR_S",L6_C10_"000019596000000006",L6_C16_"00100.365623000.00000.00000.00000.00000.00000.00000",L6_C59_"11299.FR.ISIE.AUTRES.ZXIH.SALES.zip",L6_C62_"000019597000000001",L6_C117_"19596000000006",L7_C1_1,L7_C2_"11299",L7_C3_"CHK_CASHING_CHECK_IN_PROGRESS_20210329_11299_EUR_S",L7_C10_"000019596000000007",L7_C59_"11299.FR.ISIE.AUTRES.ZXIH.SALES.zip",L7_C62_"000019597000000001",L7_C117_"19596000000007",L8_C1_1,L8_C2_"11299",L8_C3_"CHK_CASHING_CHECK_IN_PROGRESS_20210329_11299_EUR_S",L8_C10_"000019596000000008",L8_C17_"00100.365623000.00000.00000.00000.00000.00000.00000",L8_C59_"11299.FR.ISIE.AUTRES.ZXIH.SALES.zip",L8_C62_"000019597000000001",L8_C117_"19596000000008",L9_C1_1,L9_C2_"11299",L9_C3_"FRAUD_REGUL_LOSS_20210329_11299_EUR_S",L9_C10_"000019596000000009",L9_C59_"11299.FR.ISIE.AUTRES.ZXIH.SALES.zip",L9_C62_"000019597000000001",L9_C117_"19596000000009",L10_C1_1,L10_C2_"11299",L10_C3_"SEIZURE_SEIZURE_20210329_11299_EUR_S",L10_C10_"000019596000000010",L10_C59_"11299.FR.ISIE.AUTRES.ZXIH.SALES.zip",L10_C62_"000019597000000001",L10_C117_"19596000000010"
    match.start() : 0
    Match no 0
    4 ----- Différence constaté = L1_C1_0,L1_C2_"11299",L1_C3_"CHK_CASHING_CHECK_CREDITED_20210329_11299_EUR_S",L1_C22_"FR80753886092",
    match.start() : 101
    Match no 1
    4 ----- Différence constaté = L2_C1_0,L2_C2_"11299",L2_C3_"CHK_CASHING_CHECK_IN_PROGRESS_20210329_11299_EUR_S",L2_C22_"FR80753886092",
    match.start() : 205
    Match no 2
    4 ----- Différence constaté = L3_C1_0,L3_C2_"11299",L3_C3_"FRAUD_REGUL_LOSS_20210329_11299_EUR_S",L3_C22_"FR80753886092",
    match.start() : 296
    Match no 3
    4 ----- Différence constaté = L4_C1_0,L4_C2_"11299",L4_C3_"SEIZURE_SEIZURE_20210329_11299_EUR_S",L4_C22_"FR80753886092",
    match.start() : 386
    Match no 4
    4 ----- Différence constaté = L5_C1_1,L5_C2_"11299",L5_C3_"CHK_CASHING_CHECK_CREDITED_20210329_11299_EUR_S",L5_C10_"000019596000000005"
    match.start() : 651
    Match no 5
    4 ----- Différence constaté = L6_C1_1,L6_C2_"11299",L6_C3_"CHK_CASHING_CHECK_CREDITED_20210329_11299_EUR_S",L6_C10_"000019596000000006"
    match.start() : 916
    Match no 6
    4 ----- Différence constaté = L7_C1_1,L7_C2_"11299",L7_C3_"CHK_CASHING_CHECK_IN_PROGRESS_20210329_11299_EUR_S",L7_C10_"000019596000000007"
    match.start() : 1123
    Match no 7
    4 ----- Différence constaté = L8_C1_1,L8_C2_"11299",L8_C3_"CHK_CASHING_CHECK_IN_PROGRESS_20210329_11299_EUR_S",L8_C10_"000019596000000008"
    match.start() : 1391
    Match no 8
    4 ----- Différence constaté = L9_C1_1,L9_C2_"11299",L9_C3_"FRAUD_REGUL_LOSS_20210329_11299_EUR_S",L9_C10_"000019596000000009"
    Que faut-il passer en paramêtre de la regex pour se faire please ?

    Je te remercie vivement pour ton aide.

  8. #8
    Membre à l'essai
    Homme Profil pro
    Développeur Java
    Inscrit en
    juin 2022
    Messages
    33
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : juin 2022
    Messages : 33
    Points : 14
    Points
    14
    Par défaut
    Youhou !! J'ai réussi !!

    J'ai fait cela :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    String spattern="(L(([1-9]?[0-9])|100)_C\\d_\\d.*?L\\2_C\\d{2}_\".*?\"(?:,?\$?))(?!L\\2_)";
    au lieu de cela :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    String spattern="(L(\\d)_C\\d_\\d.*?L\\2_C\\d{2}_\".*?\"(?:,?\$?))(?!L\\2_)";
    Merci du fond du coeur tsuji !

    Je veux être ton ami maintenant j'habite Orly, t ou toi ?

    En tout cas un grand merci vraiment.

    J'ai mon point de cet apm, ma mission devrait normalement se prolonger avec cela.

    Merci, merci, merci...

  9. #9
    Membre à l'essai
    Homme Profil pro
    Développeur Java
    Inscrit en
    juin 2022
    Messages
    33
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : juin 2022
    Messages : 33
    Points : 14
    Points
    14
    Par défaut
    Finalement, ce n'est pas résolu tsuji.

    Quand j'ai cette valeur par exemple avec le "_KO" en bout de chaîne, cela ne match pas.

    L1_C1_"0"_KO

    avec la même expression régulière :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    String spattern = "(L(([1-9]?[0-9])|100)_C\\d_\\d.*?L\\2_C\\d{2}_\".*?\"(?:,?\$?))(?!L\\2_)";
    mon code complet :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    //println("------------------------------------------------------------------ DEB DERNIER TRAITEMENT (écriture dans le fichier de sortie) ------------------------------------------------------------------");
    
    		String sdonnees=String.join(",",al1);//ancienne 
    		String sdonneesL3=String.join(",",L3);
    		println("sdonneesal1: "+sdonnees) // va jusqu'à 10 ici
    		println("sdonneesL3: "+sdonneesL3)
    		//spattern REGEX qui permet de scinder ligne par ligne et de pouvoir retrouver le fichier original
    		String spattern = "(L(([1-9]?[0-9])|100)_C\\d_\\d.*?L\\2_C\\d{2}_\".*?\"(?:,?\$?))(?!L\\2_)";
    		Pattern p = Pattern.compile(spattern);
    		Matcher match = p.matcher(sdonnees);
    
    		/*int count1=0;
    		 System.out.println("4 ----- Ecarts constaté = ")
    		 while(match.find()){
    		 //println("match.start() : "+match.start())
    		 //System.out.println("Match no "+count1);
    		 System.out.println("4 ----- "+sdonnees.substring(match.start(),match.end()));
    		 //transformees.add(sdonnees.substring(match.start(),match.end()));
    		 count1++;
    		 }*/
    
    		//println("------------------------------------------------------------------ DEB DERNIER TRAITEMENT (écriture dans le fichier de sortie) ------------------------------------------------------------------");
    		int n
    		//List al1 = new ArrayList()
    		try{
    			FileWriter writer = new FileWriter(path+filec)
    			writer.append(result)
    			writer.append('\n')
    			writer.append("2 ----- NB ligne 1er fichier: ("+filea+") "+numLigneA)
    			writer.append('\n')
    			writer.append("3 ----- NB ligne 2eme fichier: ("+fileb+") "+numLigneB)
    			writer.append('\n')
    			writer.append("4 ----- Ecarts constatés : ")
    			writer.append('\n')
    			System.out.println("4 ----- Ecarts constaté : ")
    			//for(m = 0 ; m < al1.size(); m++){
    			int count=0;
    			while(match.find()){
    				//System.out.println("Match no "+count);
    				writer.append(sdonnees.substring(match.start(),match.end()))
    				//writer.append(""+al1.get(m))
    				/*if (al1.contains("L1")){
    				 println("L1")
    				 }*/
    				println(sdonnees.substring(match.start(),match.end()))
    				writer.append('\n')
    				//transformees.add(sdonnees.substring(match.start(),match.end()));
    				count++;
    			}
    			writer.flush()
    			writer.close()
    			//println("------------------------------------------------------------------ FIN DERNIER TRAITEMENT ------------------------------------------------------------------");
    
    		}catch(IOException e){
    			e.printStackTrace()
    		}
    		println("^^^^^^^^^^^^^^^^^^^^^^^^^^^FIN^^^^^^^^^^^^^^^^^^^^^^^^^^^")
    		println("")
    Je ne sais pas comment faire pour prendre en compte le "_KO"

  10. #10
    Membre à l'essai
    Homme Profil pro
    Développeur Java
    Inscrit en
    juin 2022
    Messages
    33
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : juin 2022
    Messages : 33
    Points : 14
    Points
    14
    Par défaut
    Résolu en mettant le W :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    String spattern = "(L(([1-9]?[0-9])|100)_C\\d_\\W.*?L\\2_C\\d{3}_\".*?\"(?:,?\$?))";

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 22
    Dernier message: 13/11/2011, 19h05
  2. comment extraire les enregistrement doublés dans une table
    Par z_ahlam dans le forum PHP & Base de données
    Réponses: 9
    Dernier message: 17/09/2009, 10h20
  3. Remplacer les caractères accentués dans une chaine
    Par shaun_the_sheep dans le forum Général Java
    Réponses: 5
    Dernier message: 07/05/2008, 10h41
  4. Remplacer les " par des \" dans une chaine
    Par jojodu31 dans le forum Débuter avec Java
    Réponses: 9
    Dernier message: 18/04/2008, 14h14
  5. [PostgreSQL] [PostGreSQL] Trouver les ' et les remplacer par \' dans une chaine
    Par bossLINDROS dans le forum PHP & Base de données
    Réponses: 3
    Dernier message: 03/05/2007, 10h31

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo