IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Java Discussion :

[Débutant][Token] découper une chaine


Sujet :

Langage Java

  1. #1
    Membre du Club
    Inscrit en
    Avril 2004
    Messages
    101
    Détails du profil
    Informations forums :
    Inscription : Avril 2004
    Messages : 101
    Points : 58
    Points
    58
    Par défaut [Débutant][Token] découper une chaine
    Bonjour,

    je cherche à découper le contenu d'un fichier texte. Le découpage doit se faire avec un séparateur de 2 caractères (ex: "µ¤").

    Je travail avec JDK1.3, donc pas de Split, et en ce qui concerne StringTokenizer apparement ça fonctionne uniquement avec un caractère et pas avec une chaîne !?

    Qqu à une idée ?

  2. #2
    Membre confirmé
    Avatar de Glob
    Homme Profil pro
    Architecte de système d'information
    Inscrit en
    Avril 2002
    Messages
    428
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : Suisse

    Informations professionnelles :
    Activité : Architecte de système d'information

    Informations forums :
    Inscription : Avril 2002
    Messages : 428
    Points : 630
    Points
    630
    Par défaut
    Mmmh... je dois avouer ne jamais avoir été confronté au problème, donc j'ignore si l'API fourni ce genre de service.

    Cependant, tu peux te créer un MultiCharStringTokeniser qui fait ce boulot. En jouant avec les méthodes String.indexOf(String), y'a moyen d'avoir rapidement quelque chose de fonctionnel.
    Glob
    What would you do if you were not afraid?

    Cours et tutoriels pour apprendre Java , FAQ Java, et Forum Java

  3. #3
    Membre éprouvé

    Profil pro
    Inscrit en
    Juin 2004
    Messages
    882
    Détails du profil
    Informations personnelles :
    Localisation : Suisse

    Informations forums :
    Inscription : Juin 2004
    Messages : 882
    Points : 948
    Points
    948
    Par défaut
    Non non ça marche

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     
    StringTokenizer st = new StringTokenizer(taChaineaParser, "µ¤");
    String firstToken = st.nextToken();
    Je travaille avec la jsdk 1.4

    Sun Certified Business Component Developer
    Sun Certified Java Programmer
    --
    The definitive toolbox for GWT applications: gwt-toolbox
    My blog about Java and JEE: Benjamin's Blog

  4. #4
    Membre éprouvé

    Profil pro
    Inscrit en
    Juin 2004
    Messages
    882
    Détails du profil
    Informations personnelles :
    Localisation : Suisse

    Informations forums :
    Inscription : Juin 2004
    Messages : 882
    Points : 948
    Points
    948
    Par défaut
    Et n'oublie pas la gestion des pointeurs null

    Sun Certified Business Component Developer
    Sun Certified Java Programmer
    --
    The definitive toolbox for GWT applications: gwt-toolbox
    My blog about Java and JEE: Benjamin's Blog

  5. #5
    duj
    duj est déconnecté
    Membre confirmé

    Profil pro
    Inscrit en
    Juillet 2003
    Messages
    141
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Juillet 2003
    Messages : 141
    Points : 474
    Points
    474
    Par défaut
    Salut,

    seul petit détail : en fait, il tokenize en considérant les 2 caractères séparément. Ce qui veut dire que si tu a un seul caractère à certaines endroits, et que tu ne veux pas l'enlever, ben c'est foutu !

    donc, une chaine comme ceci

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    StringTokenizer st = new StringTokenizer(taChaineaParser, "µ¤"); 
    String firstToken = st.nextToken();
    appliquée à
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    abcµ¤defµghi¤jkl
    donnera

    et pas

    Parfois, Google fait des miracles

  6. #6
    Membre du Club
    Inscrit en
    Avril 2004
    Messages
    101
    Détails du profil
    Informations forums :
    Inscription : Avril 2004
    Messages : 101
    Points : 58
    Points
    58
    Par défaut
    content de voir qu'il y a du monde à l'écoute, merci.

    Duj a raison, le problème est que le test ne se fait pas avec la chaîne mais avec les caractères un à un...

    Sinon je ne connais pas "MultiCharStringTokeniser" et "String.indexOf(String)", je vais voir ce que je trouve la dessus.

  7. #7
    duj
    duj est déconnecté
    Membre confirmé

    Profil pro
    Inscrit en
    Juillet 2003
    Messages
    141
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Juillet 2003
    Messages : 141
    Points : 474
    Points
    474
    Par défaut
    Si j'ai bien lu, MultiCharStringTokenizer, c'est une classe que tu devrais écrire toi même,...

    J'ai quelquepart un programme qui faisait exactement ce que tu veux, mais je n'ai pas le temps de chercher maintenant. Si tu n'as rien trouvé à 13Hr, je mettrai le code (que je suis pratiquement certain de retrouver )
    Parfois, Google fait des miracles

  8. #8
    Membre du Club
    Inscrit en
    Avril 2004
    Messages
    101
    Détails du profil
    Informations forums :
    Inscription : Avril 2004
    Messages : 101
    Points : 58
    Points
    58
    Par défaut
    ce serait parfait...

  9. #9
    Membre confirmé
    Avatar de Glob
    Homme Profil pro
    Architecte de système d'information
    Inscrit en
    Avril 2002
    Messages
    428
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : Suisse

    Informations professionnelles :
    Activité : Architecte de système d'information

    Informations forums :
    Inscription : Avril 2002
    Messages : 428
    Points : 630
    Points
    630
    Par défaut
    Citation Envoyé par duj
    Si j'ai bien lu, MultiCharStringTokenizer, c'est une classe que tu devrais écrire toi même,...
    Effectivement.
    Glob
    What would you do if you were not afraid?

    Cours et tutoriels pour apprendre Java , FAQ Java, et Forum Java

  10. #10
    Membre éprouvé

    Profil pro
    Inscrit en
    Juin 2004
    Messages
    882
    Détails du profil
    Informations personnelles :
    Localisation : Suisse

    Informations forums :
    Inscription : Juin 2004
    Messages : 882
    Points : 948
    Points
    948
    Par défaut
    Je ne pensais pas que StrinkTokenizer utilisait les deux caracteres separement dans mon cas mon delimiter ne comportait toujours qu une string d une longueur egale a un.

    desole

    Sun Certified Business Component Developer
    Sun Certified Java Programmer
    --
    The definitive toolbox for GWT applications: gwt-toolbox
    My blog about Java and JEE: Benjamin's Blog

  11. #11
    Membre éprouvé
    Profil pro
    Architecte technique
    Inscrit en
    Mars 2002
    Messages
    966
    Détails du profil
    Informations personnelles :
    Âge : 51
    Localisation : France

    Informations professionnelles :
    Activité : Architecte technique

    Informations forums :
    Inscription : Mars 2002
    Messages : 966
    Points : 1 085
    Points
    1 085
    Par défaut
    C'est quelquechose du genre :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
     
    // true pour récupérer le délimiteur comme un token
    StringTokenizer parser = new StringTokenizer(taChaineaParser, "µ¤", true);
     
    ArrayList result = new ArrayList();
     
    while (parser.hasMoreTokens()) {
      String token = parser.nextToken();
      if (!"µ".equals(token) && ! "¤".equals(token)) {
        result.add(token);
      }
      else if ("µ".equals(token)) {
         String nextToken = parser.nextToken();
         if (!"¤".equals(nextToken)) {
           result.add(token);
           result.add(nextToken);
         }
      }
      else {
        result.add(token);
      }
    }

  12. #12
    duj
    duj est déconnecté
    Membre confirmé

    Profil pro
    Inscrit en
    Juillet 2003
    Messages
    141
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Juillet 2003
    Messages : 141
    Points : 474
    Points
    474
    Par défaut
    Ou sinon, voici un programme qui fait ça.
    Il est sensé fonctionner correctement puisque j'ai un jour du le prouver.

    J'ai laissé les spécifications formelles et l'invariant de boucle.

    pour l'utiliser, regarder la méthode main, la methode tokenize retourne une liste de String


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    import java.util.ArrayList;
    import java.util.*;
     
    /**
     * @author duj
     */
    public class Tokenizer {
     
        public static void main(String[] args) {
    		String s= "AB123A456AB789CAB";
    		String pattern= "AB";
    		System.out.println(tokenize(s, pattern));
    		s= "AB123ABC456AB789CAB";
    		pattern= "ABC";
    		System.out.println(tokenize(s, pattern));
            s= "AB123ABC456AB789CABC";
                    pattern= "ABC";
                    System.out.println(tokenize(s, pattern));
    	}
     
     
    	/**
             * But: tokenize str selon  pattern 
             * pre: str != null && pattern != null
             */
    	public static List tokenize(String str, String pattern) {
    		return tokenize(str.toCharArray(), pattern.toCharArray());
    	}
     
    	/**
             * But: tokenize tab selon un pattern p
             * @pre:tab != null && p != null
             * @post: return List l qui contient les sous-chaines l[1]...l[n] de tab tel que:
             *    pour tout t app à  l : t ne contient pas p et t.length>0
             *    tab == p? l[0] p l[1] p ..... l[n] p?
             */
    	private static List tokenize(char[] tab, char[] p) {
    		List l= new ArrayList();
    		int i= 0;
    		int j= 0;
    		int k= 0;
    		/*pre:   l.length==0 && i==0 && j==0  && k==0
    		 *post : i==tab.length && la post de tokenize
    		 */
    		/*
    		 *INV: 1. 0<=j+k<=tab.length
    		 *     2. 0<=i<=j
    		 *     3. 0<=k<=p.length
    		 *     2. tab[i-p.length i[==p[0 p.length[
    		 *     4. l  contient les sous-chaines l[1]...l[n] de tab[0 i[ tel que:
    		 *              pour tout t app à  l : t ne contient pas p et t.length>0
    		 *              tab == p? l[0] p l[1] p ..... l[n] p?
    		 */
    		while (j + k != tab.length) {
    			if (k == p.length) {
    				if (i != j) {
    					l.add(substring(tab, i, j));
    				}
    				j= j + k;
    				k= 0;
    				i= j;
    			} else if (tab[j + k] == p[k]) {
    				k++;
    			} else {
    				k= 0;
    				j++;
    			}
    		}
    		if (i != j) {
    			if (k == p.length) {
    				l.add(substring(tab, i, j));
    			} else {
    				l.add(substring(tab, i, j + k));
    			}
    		}
    		return l;
     
    	}
     
    	/**
             * @pre:tab!=null
             *       0<=i<=i<=tab.lenght
             * @post:
             *      return  un string representant tab[i j[ 
             */
    	private static String substring(char[] tab, int i, int j) {
    		int length= j - i;
    		char[] str= new char[length];
    		arrayCopy(tab, str, i, length);
    		return new String(str);
    	}
     
    	/**
             * @pre: src !=null src est un array dest != null dest est un array
             * @post: dest[0:length[=src[i:i+length[
             */
    	private static void arrayCopy(Object src, Object dest, int i, int length) {
    		System.arraycopy(src, i, dest, 0, length);
    	}
     
    	}
    Parfois, Google fait des miracles

  13. #13
    Membre du Club
    Inscrit en
    Avril 2004
    Messages
    101
    Détails du profil
    Informations forums :
    Inscription : Avril 2004
    Messages : 101
    Points : 58
    Points
    58
    Par défaut
    Ok merci, le prog de Duj fonctionne, par contre celui de Thibaut ne fonctionne pas mais
    C'est quelquechose du genre

  14. #14
    Membre du Club
    Inscrit en
    Avril 2004
    Messages
    101
    Détails du profil
    Informations forums :
    Inscription : Avril 2004
    Messages : 101
    Points : 58
    Points
    58
    Par défaut
    Ok merci, le prog de Duj fonctionne, par contre celui de Thibaut ne fonctionne pas mais
    C'est quelquechose du genre

  15. #15
    Membre éprouvé
    Profil pro
    Architecte technique
    Inscrit en
    Mars 2002
    Messages
    966
    Détails du profil
    Informations personnelles :
    Âge : 51
    Localisation : France

    Informations professionnelles :
    Activité : Architecte technique

    Informations forums :
    Inscription : Mars 2002
    Messages : 966
    Points : 1 085
    Points
    1 085
    Par défaut
    Correction

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
            StringTokenizer parser = new StringTokenizer(chaine, "µ¤", true);
            ArrayList result = new ArrayList();
            StringBuffer temp = new StringBuffer();
     
            while (parser.hasMoreTokens()) {
                String token = parser.nextToken();
                if (!"µ".equals(token) && !"¤".equals(token)) {
                    temp.append(token);
                }
                else if ("µ".equals(token)) {
                    String nextToken = parser.nextToken();
                    if (!"¤".equals(nextToken)) {
                        temp.append(token);
                        temp.append(nextToken);
                    }
                    else {
    			        if (temp.length() >0) {
    			        	result.add(temp);
    			        }
                    	temp = new StringBuffer();
                    }
                }
                else {
                    temp.append(token);
                }
            }
     
            if (temp.length() >0) {
            	result.add(temp);
            }

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Bash - Découper une chaine de caractères
    Par nicolas.pissard dans le forum Shell et commandes GNU
    Réponses: 13
    Dernier message: 16/12/2014, 13h18
  2. [VB6] Découper une chaine sans délimiteur
    Par dbozec dans le forum VB 6 et antérieur
    Réponses: 11
    Dernier message: 13/04/2006, 19h26
  3. découper une chaine
    Par R@IZER dans le forum Langage
    Réponses: 5
    Dernier message: 09/11/2005, 17h04
  4. [StringTokenizer] Découper une chaine de caractere
    Par nehan dans le forum Collection et Stream
    Réponses: 14
    Dernier message: 10/05/2005, 23h41
  5. [Débutant]Encodage d'une chaine de caractères
    Par Crazyblinkgirl dans le forum Entrée/Sortie
    Réponses: 3
    Dernier message: 03/08/2004, 16h47

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo