IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

decoupage de fichier en ligne


Sujet :

Langage Perl

  1. #1
    Membre du Club
    Inscrit en
    Mars 2006
    Messages
    624
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 624
    Points : 69
    Points
    69
    Par défaut decoupage de fichier en ligne
    Bonjour,

    J'ai un fichier qui ne possède pas de retour chariot (il est sur une seule ligne).

    Or je voudrai tous les 160 caractères faire un retour chariot et passés à la ligne suivante afin de recréer mon fichier avec des sauts de lignes.

    Or je ne sais pas comment récupérer les caractères 161 à ...... et ainsi de suite !!

    J'ai fait cela :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
     
     
    my $Ligne;
    my UneLigne;
    my @TableauLigne;
    my $FicEntree;
    	open (FIC, "<$FicEntree") || die "Ouverture impossible du fichier $FicEntree: $!";	
     
    				while ($Ligne = <FIC> ) 
       				{  						
    						@TableauLigne = split '', ${Ligne} ;
    						$UneLigne = join '',@TableauLigne[1..159];
     
    						print ">$UneLigne<\n";	
    				} 
    	close (FIC);
    Merci pour votre aide

  2. #2
    Rédacteur/Modérateur

    Avatar de Lolo78
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Mai 2012
    Messages
    3 612
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2012
    Messages : 3 612
    Points : 12 469
    Points
    12 469
    Billets dans le blog
    1
    Par défaut
    S'il n'y a pas de saut de lignes, autant ne pas utiliser une fonction qui en dépend. Essaie quelque chose comme ceci:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    open my $IN, "<", $FicEntree or die "Ouverture impossible du fichier $FicEntree: $!";
    while (read $IN, my $line, 160) {
         print $line, "\n";
    }
    Ou sinon, tu lis ta ligne unique dans une variable scalaire et la tronçonnes ensuite en morceaux de 160 caractères, par exemple avec une expression régulière, la fonction substr ou unpack (cette dernière solution sera la plus rapide si ton fichier est très volumineux).

  3. #3
    Membre du Club
    Inscrit en
    Mars 2006
    Messages
    624
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 624
    Points : 69
    Points
    69
    Par défaut
    et comment puis je m'y prendre avec un substr ou unpack ?


    Comment tester que que le nombre de caractére de ma ligne est supérieur à 160 ? pour savoir si je dois lancer mon découpage ligne par ligne.

    Merci pour ta réponses.

  4. #4
    Membre du Club
    Inscrit en
    Mars 2006
    Messages
    624
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 624
    Points : 69
    Points
    69
    Par défaut
    j'ai écris ça :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
     
    open (FIC, "<$FicEntree") || die "Ouverture impossible du fichier $FicEntree: $!";	
     
    				my $Ligne1 = <FIC> ;
    				$Longueur=length($Ligne1) ;
     
    				if ( $Longueur>162 ) { 
    					print ">>>>On traite\n";
    									}
    				else 
    				{while (read FIC, my $Ligne, 160) 
    					{
    						print $Ligne, "\n";
    					}	
     
    					exit ;
    				}
     
    close (FIC);
    Mais la partie ci-dessous ne s'exécute pas :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
     
    while (read FIC, my $Ligne, 160) 
    {
    	print $Ligne, "\n";
    }

  5. #5
    Rédacteur/Modérateur

    Avatar de Lolo78
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Mai 2012
    Messages
    3 612
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2012
    Messages : 3 612
    Points : 12 469
    Points
    12 469
    Billets dans le blog
    1
    Par défaut
    Le code que je t'ai montré ne lit pas des lignes, mais lit directement des blocs de 160 caractères, ajoute un saut de ligne et imprime cela.

    Tu ne peux pas mélanger ce code avec des lectures de lignes, cela rend la logique du programme foireuse.

    Si tu veux lire ligne par ligne et découper en tronçons si ta ligne dépasse 160 caractères, tu peux essayer ceci (non testé):

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    open my $IN, "<", $FicEntree or die "Ouverture impossible du fichier $FicEntree: $!";
    while (my $ligne = <$IN>) {
         print and next if length($ligne) <= 160;
         my @liste_de_lignes =  unpack '(A160)*', $ligne;
         print join "\n", @liste_de_lignes ;
    }
    Sinon, tu peux remplacer la ligne de code avec le unpack par une expression régulière:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    my @liste_de_lignes = $ligne =~ /.{160}/g;
    ou par un appel à la fonction split:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    my @liste_de_lignes =  split /.{160}\K/, $ligne;
    Tu peux aussi appeler la fonction substr dans une boucle:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    while (my $ligne = <$IN>) {
         print and next if length($ligne) <= 160;
         for ( my $i = 0 ; $i < length $string ; $i += 160 ) {
             print (substr $string, $i, 160), "\n";
    }
    ou encore peut-être:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    while (my $ligne = <$IN>) {
         print and next if length($ligne) <= 160;
         my $max = (length $sligne)/160 -1;
         print  join "\n", substr $ligne, $_*160, 160  for (0..$max);
    }
    Si ton texte est très volumineux, alors la version avec read que j'ai donnée hier est plus sûre parce qu'elle ne met à aucun moment l'ensemble du texte en mémoire et ne risque donc pas de saturer celle-ci (contrairement à toutes les versions ci-dessus). C'est sans doute aussi la plus rapide. Si tu préfères quand même les versions ci-dessus avec une lecture ligne par ligne, sache que la version avec unpack sera sans doute la plus rapide, suivie d'assez près des deux versions avec substr (la seconde étant un peu plus rapide que la première), suivie de celle avec split, l'expression régulière étant assez nettement plus lente (mais cela n'a d'importance que si ton fichier est très gros).

    PS: prends note de la façon dont j'ouvre un fichier (avec un "filehandle" lexical et trois arguments), elle est plus moderne et est considérée comme meilleure que la syntaxe plus ancienne que tu emploies.

  6. #6
    Membre du Club
    Inscrit en
    Mars 2006
    Messages
    624
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 624
    Points : 69
    Points
    69
    Par défaut
    Merci pour tes explications.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. decoupage fichier multi-ligne avec Sed
    Par archivage-services dans le forum Shell et commandes GNU
    Réponses: 1
    Dernier message: 04/02/2010, 18h44
  2. [HTTP] Connaître la taille d'un fichier en ligne
    Par MiJack dans le forum Entrée/Sortie
    Réponses: 4
    Dernier message: 21/09/2006, 01h35
  3. Les 128 derniers bits d'un fichier en ligne avec Python ?
    Par ecocentric dans le forum Réseau/Web
    Réponses: 7
    Dernier message: 26/09/2005, 13h40
  4. Lecture de fichier - dernière ligne non prise en compte
    Par JulienPles dans le forum Algorithmes et structures de données
    Réponses: 3
    Dernier message: 16/03/2005, 12h57
  5. Réponses: 2
    Dernier message: 26/09/2003, 15h51

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo