Précédent   Forum des professionnels en informatique > Logiciels > Autres Logiciels
Autres Logiciels Bureautique, navigateurs, clients mails, traitements de textes, tableurs, multimédia, logiciels divers, etc...
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 02/01/2007, 11h48   #1
Invité de passage
 
Inscription : février 2005
Messages : 10
Détails du profil
Informations personnelles :
Âge : 32

Informations forums :
Inscription : février 2005
Messages : 10
Points : 3
Points : 3
Envoyer un message via ICQ à DrakkoFR Envoyer un message via AIM à DrakkoFR Envoyer un message via Skype™ à DrakkoFR
Par défaut Découpeur de fichier txt

Bonjour,

je récupère de la base de donnée brute en format txt.

Les fichiers font plusieurs centaines de Mo et seul GBEpad est capable des les ouvrir.

Je cherche un outil qui me permettrait de découper un fichie texte suivant les n premiers caractères.
par exemple, si j'ai :
Code :
1
2
3
4
5
6
7
8
9
10
11
12
540395 AE 001 blablablabla etc etc etc
540395 AE 001 blablablabla etc etc etc
540395 AE 001 blablablabla etc etc etc
540395 AE 002 blablablabla etc etc etc
540395 AE 002 blablablabla etc etc etc
540395 AE 002 blablablabla etc etc etc
540395 AE 003 blablablabla etc etc etc
540395 AE 003 blablablabla etc etc etc
540395 AE 004 blablablabla etc etc etc
540395 AE 004 blablablabla etc etc etc
540395 AE 004 blablablabla etc etc etc
540395 AE 004 blablablabla etc etc etc
je voudrais obtenir par déocupage sur les 13 premiers caractères :

Code :
1
2
3
540395 AE 001 blablablabla etc etc etc
540395 AE 001 blablablabla etc etc etc
540395 AE 001 blablablabla etc etc etc
dans le premier fichier

Code :
1
2
3
540395 AE 002 blablablabla etc etc etc
540395 AE 002 blablablabla etc etc etc
540395 AE 002 blablablabla etc etc etc
dans le deuxième fichier

Code :
1
2
540395 AE 003 blablablabla etc etc etc
540395 AE 003 blablablabla etc etc etc
dans le troisième fichier

Code :
1
2
3
4
540395 AE 004 blablablabla etc etc etc
540395 AE 004 blablablabla etc etc etc
540395 AE 004 blablablabla etc etc etc
540395 AE 004 blablablabla etc etc etc
dans le quatrième fichier
DrakkoFR est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/01/2007, 14h18   #2
Rédacteur/Modérateur
 
Avatar de pseudocode
 
Homme Xavier Philippeau
Architecte système
Inscription : décembre 2006
Messages : 9 423
Détails du profil
Informations personnelles :
Nom : Homme Xavier Philippeau
Âge : 39
Localisation : France, Hérault (Languedoc Roussillon)

Informations professionnelles :
Activité : Architecte système
Secteur : Industrie

Informations forums :
Inscription : décembre 2006
Messages : 9 423
Points : 14 131
Points : 14 131
Ca doit pouvoir se faire avec 4 ou 5 lignes de AWK.

Si aucun gourou de awk n'est dans les parages pour pondre le script de tete, je veux bien ressortir mon manuel
pseudocode est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/01/2007, 14h23   #3
Invité de passage
 
Inscription : février 2005
Messages : 10
Détails du profil
Informations personnelles :
Âge : 32

Informations forums :
Inscription : février 2005
Messages : 10
Points : 3
Points : 3
Envoyer un message via ICQ à DrakkoFR Envoyer un message via AIM à DrakkoFR Envoyer un message via Skype™ à DrakkoFR
Citation:
Envoyé par pseudocode
Ca doit pouvoir se faire avec 4 ou 5 lignes de AWK.

Si aucun gourou de awk n'est dans les parages pour pondre le script de tete, je veux bien ressortir mon manuel
Merci, mais je ne connais pas du tout Gawk... J'ai tors ?
DrakkoFR est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/01/2007, 14h27   #4
Rédacteur/Modérateur
 
Avatar de pseudocode
 
Homme Xavier Philippeau
Architecte système
Inscription : décembre 2006
Messages : 9 423
Détails du profil
Informations personnelles :
Nom : Homme Xavier Philippeau
Âge : 39
Localisation : France, Hérault (Languedoc Roussillon)

Informations professionnelles :
Activité : Architecte système
Secteur : Industrie

Informations forums :
Inscription : décembre 2006
Messages : 9 423
Points : 14 131
Points : 14 131
Citation:
Envoyé par DrakkoFR
Merci, mais je ne connais pas du tout Gawk... J'ai tors ?
Arf. trop jeune

1. Telecharger gawk (dispo pour unix, windows, ...)

2. creer un fichier script "split.awk" d'une complexité rare, contenant:
Code :
1
2
3
4
{
	print $0 >> substr($0, 1, 13) ".txt"
}
3. executer la commande: gawk -f split.awk monfichierinitial.txt

et voila
pseudocode est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/01/2007, 16h41   #5
Expert Confirmé Sénior
 
Inscription : décembre 2004
Messages : 19 671
Détails du profil
Informations forums :
Inscription : décembre 2004
Messages : 19 671
Points : 17 664
Points : 17 664
De toute façon, cela peut être réalisé simplement dans n'importe quel langage informatique
Jannus est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/01/2007, 16h42   #6
Invité de passage
 
Inscription : février 2005
Messages : 10
Détails du profil
Informations personnelles :
Âge : 32

Informations forums :
Inscription : février 2005
Messages : 10
Points : 3
Points : 3
Envoyer un message via ICQ à DrakkoFR Envoyer un message via AIM à DrakkoFR Envoyer un message via Skype™ à DrakkoFR
Citation:
Envoyé par Guardian
De toute façon, cela peut être réalisé simplement dans n'importe quel langage informatique
Là n'est pas exactement le problème... Il sagit de découper des fichiers allant jusqu'à 900 Mo... La plupart des éditeurs n'arrivent pas à l'ouvrir...

J'ai réussi à booster un apache avec php pour ouvrir ces fameux fichiers et les découper... Mais c'est pas le plus simple
DrakkoFR est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/01/2007, 16h45   #7
Expert Confirmé Sénior
 
Inscription : décembre 2004
Messages : 19 671
Détails du profil
Informations forums :
Inscription : décembre 2004
Messages : 19 671
Points : 17 664
Points : 17 664
Il n'est obligatoire d'ouvrir le fichier d'un bloc.
Puisque c'est un fichier texte, il y a forcément une fin de ligne. Il suffit de lire/traiter/écrire ligne par ligne.
Jannus est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/01/2007, 16h46   #8
Rédacteur/Modérateur
 
Avatar de pseudocode
 
Homme Xavier Philippeau
Architecte système
Inscription : décembre 2006
Messages : 9 423
Détails du profil
Informations personnelles :
Nom : Homme Xavier Philippeau
Âge : 39
Localisation : France, Hérault (Languedoc Roussillon)

Informations professionnelles :
Activité : Architecte système
Secteur : Industrie

Informations forums :
Inscription : décembre 2006
Messages : 9 423
Points : 14 131
Points : 14 131
C'est pour ca que j'ai pensé a AWK. Il travaille sur un flux et non pas sur une representation en mémoire. Donc pas de pb de taille des fichiers.
pseudocode est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 07h33.


 
 
 
 
Partenaires

Hébergement Web