Bonjour,
Je reçois par mail des pièces jointes au format texte.
Elles consistent en une chaine de caractères et sont de longueur variable de
700/800 caractères pour les petites et jusqu'à 500 000/600 000 caractères
ou plus.
Reviennent de façon aléatoire des marqueurs/séparateurs de sous-chaines
sur 4 caractères au sein de la chaine.
Pour l'instant j'ai une boucle for qui parcourt la chaine et récupère la position
du marqueur courant. Je procède ensuite à une extraction du début de la chaine
jusqu'au marqueur et vais chercher le marqueur suivant, ceci jusqu'à traitement
de l'ensemble des caractères de la chaine.
Cette méthode nécessite 19secondes pour traiter env. 2600 caractères.Bref,
c'est lent !
Quelqu'un aurait-il une idée pour réaliser cette opération ?
Synthétiquement on pourrait représenter la chaine ainsi
xxxxxxxxxxxxMMMMxxxxxxxxxxxxxxxxxxxxxxxxxxxxMMMMxxxxxxxxxx
avec x les caractères quelconques et MMMM le marqueur.
J'ai fait quelques essais avec sed mais en fait je ne veux pas
chercher/remplacer mais récuperer la position de chaque 1er caractère
du marqueur.
Merci
Partager