IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

captage d'un message d'erreur


Sujet :

Langage Perl

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Août 2010
    Messages
    7
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 7
    Par défaut captage d'un message d'erreur
    Bonjour,
    comment intercepter dans une variable un message d'erreur donné (lors d'un while <F>) 'utf8 "\xB6" does not map etc.' ou 'Malformed UTF-8 etc." de façon à interrompre un traitement d'un fichier non codé en utf-8 (et détecter dans une grande quantité de .txt d'Europe de l'est ceux qui ne sont pas en utf8 et les transcoder sans les ouvrir un à un [NB un test par num. de code ne marche pas, étant transformé en celui de la grille utf8]) ?
    J'ai repris Perl après une assez longue interruption. Quelqu'un peut m'aider ou m'indiquer où trouver précisément le renseignement ?
    Merci d'avance.

  2. #2
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Août 2010
    Messages
    7
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 7
    Par défaut capter (bis)
    dois me contenter provisoirement du test if ord(car) = 0, en espérant que le comportement constaté sur exemples est général ; oui, lire la doc... j'y pense.
    while (<F>) {
    map {$bad=1 if ord($_)==0} split //;
    if ($bad) {push @non_utf, $nomfich ; last}
    }

  3. #3
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 822
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 822
    Par défaut
    Peux tu nous montrer un code un peu plus complet ?

  4. #4
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Août 2010
    Messages
    7
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 7
    Par défaut
    Hello Djibril,
    merci d'avoir jeté un coup d'oeil. Avant de poursuivre, me suis lancé dans quelques nouveaux tests (il y a pourtant sans doute une super doc sur le sujet, mais je sature déjà avec d'autres perltut et autres). Pour simplifier la vie avec des codages hétérogènes. Suite à bientôt sans doute...

  5. #5
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Août 2010
    Messages
    7
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 7
    Par défaut
    La question : comment transformer sans les ouvrir à la main des fichiers .txt d'origine diverse en .utf.
    - les fichiers à traiter sont suffixés .asc .iso2 .cp .utf .txt (et .htm .mht .docx etc.).Laissons les derniers (autre approche) et les .utf.
    Pour les extensions explicites, aucun problème, ouverture selon codage (cp1250, ISO-8859-2) et réécriture utf8. Pour les .asc, rien ne leur redonnera leurs diacritiques, ils peuvent donc aussi être transformés directement (leur particularité sera notée dans la double extension .asc.utf)
    Restent les nombreux .txt (=asc?=cp? =iso2 =utf?). Le but : un test permettant de détecter automatiquement (avec un nombre raisonnable d'erreurs) leur encodage. Les asc n'ont que des codes < 128. Le BOM intial des utf, présent ou non, visible ou non, ne mène pas très loin. Quant à cp et iso2 (en gros), ils ont en commun de provoquer, ouverts en utf8, une erreur (pour leurs codes "asc. étendu" (128-255), codés sur un seul octet, dont le '1' en 1e position ne respecte pas le formalisme utf-8... ou le respecte par hasard et aboutit à des aberrations).
    J'avais pensé intercepter à la volée le message d'avertissement ou d'erreur, si c'était possible ; ou vérifier si les codes fautifs génèrenttous un code 0. La 1e sol. : sais pas comment faire sans la lourdeur d'un fichier d'erreurs. La 2e, après tests plus précis, ça pose problème (refus parfois muets d'écriture).
    En parcourant la doc, nouvelle solution, simple, mais dont je ne sais pas si elle doit s'accompagner de précautions (la doc de base n'est pas trop claire) : ça a l'air de marcher (sur échantillons réels) en permettant de tester sur octets (mais : choisir 'read' ou 'binmode' ? pièges ? ...) :

  6. #6
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Août 2010
    Messages
    7
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 7
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    foreach (@fich) {
    	...
    	open $fh, "<$fich" or die " >>>> pb : $!";
    	...
    	read ($fh, $car,1) ; if (ord($car)==239) {$ext=".u_f" ;  close $fh ; next}	#   vs ZWNBS ; u_f2utf
    	while (!$ext) {
    		my $nb=read ($fh, $car, 1); last if $nb==0;
    		ord($car)=~/(195|196|197)|(156|159)|(177|182)/ ;
    		if ($1) {$ext=".utf"; last}				# ou u_f : u_f2utf
    		if ($2) {$ext=".cp"; last}				# cp2utf
    		if ($3) {$ext=".iso2"; last}				# iso2utf
    	}
    	if (!$ext) { print "$fich à vérifier\n"}				# queltype2
    	close $fh;
    }

Discussions similaires

  1. [TSocket] Message d'erreur
    Par rgz dans le forum Web & réseau
    Réponses: 6
    Dernier message: 04/07/2003, 09h16
  2. Surcharger le message d'erreur après un OnException
    Par Tirlibibi dans le forum XMLRAD
    Réponses: 2
    Dernier message: 24/04/2003, 11h42
  3. Réponses: 4
    Dernier message: 04/03/2003, 01h05
  4. [CR] Message d'erreur
    Par nono1 dans le forum SAP Crystal Reports
    Réponses: 2
    Dernier message: 11/09/2002, 14h54
  5. Réponses: 2
    Dernier message: 27/05/2002, 19h46

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo