IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Réécrire un HTML encodage inconnu en PHP UTF-8


Sujet :

Langage PHP

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Invité
    Invité(e)
    Par défaut Réécrire un HTML encodage inconnu en PHP UTF-8
    Bonjour,
    Si j'avais trouvé un forum ultra débutant j'aurais posté là
    Voici en effet ma question:
    Je possèdes un nombre très important de fichiers txt html xml etc.. dont je ne connait pas exactement l'encodage,
    J'ais un "moteur" php (écrit par moi) qui va cherché tout ce dont il a besoins puis réécrit un php

    les éléments déterminants sont a mon avis
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
     
    <?PHP 
    header('Content-Type: text/html; charset=utf-8'); 
    /* -------puis par exemple------------- */
    $work=file("zzz/monfichier.txt");
    $nbli=count($work)-1;
    $C=0;
          for($z=0;$z<=$nbli;$z++)
           {
             $work[$z] = preg_replace('~\A\xef\xbb\xbf~', '', $work[$z]);
             $LaSuite[$C]=$work[$zx];
             $C=$C+1;
         }
     
     
    /* ------autres traitement avec des manipulations de chaînes de caractères ------------ */
     
    /* -----puis réécriture ainsi  --------------------------------------- */
    $LeFichier=fopen("unphpdivers.php","w+");
          for($compt=0;$compt<$C;$compt++)
           {
            $LeTexte=$LaSuite[$compt];
            fputs($LeFichier,$LeTexte."");    
           }
          fclose($LeFichier);
     
    ?>
    Je ne sais pas si je dois employer utf8_encode(string)

    MA QUESTION: est-ce que ainsi je suis certain d'étre en UTF-8 sans BOM ??????

    Mille mercis de vos conseils et avis

  2. #2
    Membre Expert
    Avatar de laurentSc
    Homme Profil pro
    Webmaster débutant perpétuel !
    Inscrit en
    Octobre 2006
    Messages
    10 493
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Webmaster débutant perpétuel !
    Secteur : Industrie

    Informations forums :
    Inscription : Octobre 2006
    Messages : 10 493
    Billets dans le blog
    1
    Par défaut
    Réponse rapide qu'on m'a déjà faite N fois : fais l'essai (sur plusieurs fichiers, pas en UTF-8 au départ...)

  3. #3
    Invité
    Invité(e)
    Par défaut
    Merci de ta réponse, donc tu ne sais pas
    dommage car je ne comprends pas ce qui détermine avec ou sans bom dans mon code et encore moins si utf8_encode(string) est util

  4. #4
    Membre Expert
    Avatar de laurentSc
    Homme Profil pro
    Webmaster débutant perpétuel !
    Inscrit en
    Octobre 2006
    Messages
    10 493
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Webmaster débutant perpétuel !
    Secteur : Industrie

    Informations forums :
    Inscription : Octobre 2006
    Messages : 10 493
    Billets dans le blog
    1
    Par défaut
    Je suppose qu'il est inutile de te le conseiller, mais pour connaître l'utilité de utf8_encode, ne suffit-il pas de le tester en partant sur des fichiers non utf-8 ?

  5. #5
    Invité
    Invité(e)
    Par défaut
    Oui je te comprends et te reçoit 5/5,
    juste les forums ont cette force magique d'apporter a tout problème une réponse parfois
    inattendue , et souvent loin des codes compliquer que nous trouvons en faisant des testes dans notre coin.

    Pour reprendre mon problème il se peut que cela marche mais en fait soit inutile, de plus BOM ou pas BOM c'est tellement galère !
    J' espères que pour ta part tu aura compris pourquoi un gus qui à écrit ici plusieurs techniques, poses pareil question.

    Bien à toi et merci encore d'avoir pris le temps de me lire.

  6. #6
    Invité
    Invité(e)
    Par défaut
    Bonjour,

    en cherchant un peu, je suis tomber surune discussion intéressante.

    Voulant tester et aller plus loin (comme au bon vieux temps ), j'ai modifié le script proposé, et l'ai couplé à un script d'exploration de dossier/fichier.

    Voilà ce que ça donne :
    ATTENTION : A TESTER d'abord !! (mes tests semblent concluants, mais bon... 2 précautions valent mieux qu'une)
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    <?php
    header('Content-type:text/html; charset=UTF-8');	// encodage UTF-8
    error_reporting(E_ALL); 	// en TEST !!
    // -----------------------------------------------
    // Vérification/Conversion d'un fichier en UTF-8
    function toUTF8($file) {
    	if(!file_exists($file)) return false; // le fichier n'existe pas
     
    	// IMPORTANT : liste des extensions autorisées pour les fichiers à tester/encoder
    	$file_Extension_OK = array('php','htm','html','xml','txt','css');
    	$file_Extension = strtolower(pathinfo($file,PATHINFO_EXTENSION));
    	if(!in_array($file_Extension, $file_Extension_OK)) return false; // extension pas ok
     
    	$contents = file_get_contents($file);
    	$contentsbefore = $contents;
    	$contents = html_entity_decode($contents);
    	if(mb_check_encoding($contents, 'UTF-8')){
    		if($contentsbefore !== $contents){
    			file_put_contents($file, $contents);
    //			return true;
    			return 'html_entity_decode : '.$file;
    		} else {
    //			return false; // c'est déjà UTF-8
    			return 'ok : '.$file;
    		}
    	}
    	file_put_contents($file, utf8_encode($contents));
    //	return true;
    	return 'utf8_encode : '.$file;
    };
    // -----------------------------------------------
    // Explorateur de dossier (récursif)
    //function explore_dir_scan_html($dir, $niv=0, $id=0)
    function dir_convert_toUTF8($dir, $niv=0, $id=0) // fonction modifiée
    {
    	$html = null;
    	$html_dirs = null;
    	$html_fils = null;
    	if ($handle = opendir($dir)) {
    		while (false !== ($entry = readdir($handle))) {
    			$id++;
    			if(is_dir($dir."/".$entry)) // dossier
    			{
    				if($entry!='..' && $entry!='.')
    				{
    				 $html_dirs .= str_repeat("\t",$niv+1)."<li class='dir' id='div_".$id."'>".$entry."\n";
    				 $html_dirs .= str_repeat("\t",$niv+2)."<ul class='sub_dir' id='sub_".$id."'>\n";
    				 $html_dirs .= dir_convert_toUTF8($dir."/".$entry, $niv+1, $id);
    				}				
    			} else { // fichier
    // ------------
    // partie modifiée
    //				 $html_fils .= str_repeat("\t",$niv+2)."<li class='fil' id='fil_".$id."'><a href='".$dir."/".$entry."' target='_blank'>".$entry."</a></li>\n";
    				$toUTF8 = toUTF8($dir.'/'.$entry);
    				if(!empty($toUTF8)){
    					$html_fils .= str_repeat("\t",$niv+2)."<li class='fil' id='fil_".$id."'>".$toUTF8."</li>\n";
    				}
    // ------------
    			}
    			if(is_dir($dir."/".$entry))
    			{
    				if($entry!='..' && $entry!='.')
    				{
    				 $html_dirs .= str_repeat("\t",$niv+2)."</ul>\n";
    				 $html_dirs .= str_repeat("\t",$niv+1)."</li>\n";
    				}
    			}
    		}
    		closedir($handle);
    		$html .= $html_dirs; // dossiers
    		$html .= $html_fils; // fichiers
    		return $html;
    	}	
    };
    // -----------------------------------------------
    ?>
    <!DOCTYPE html>
    <html>
    <head>
    	<meta charset="utf-8" />
    	<title>Dir Explorer - File Converter to UTF-8</title>
    <!-- Script initialisation jquery -->
    <script type="text/javascript" src="http://code.jquery.com/jquery.min.js"></script>
    <script type="text/javascript">
    $(document).ready(function(){
    	$('#exploreur-dossier').on('click', '.dir', function(event){
    		$(this).find('ul').first().toggle();
    		event.stopPropagation(); /* important */
    	});
    });
    </script>
    <style>
    #exploreur-dossier ul { margin:0; padding:0; list-style:none outside none; }
    #exploreur-dossier .dir { position:relative; padding-left:20px; border:solid 0px #00FF00; }
    #exploreur-dossier .sub_dir { position:relative; padding-left:20px; display:none; border:solid 0px #FF0000; }
    #exploreur-dossier .fil { position:relative; padding-left:20px; }
    #exploreur-dossier .dir:before { cursor:pointer; position:absolute; content:''; display:block; width:16px; height:16px; top:2px; left:0; background:url(images/folder.png) no-repeat; }
    #exploreur-dossier .fil:before { position:absolute; content:''; display:block; width:16px; height:16px; top:2px; left:0; background:url(images/file.png) no-repeat; }
    </style>
     
    </head>
    <body>
    <?php $dossier_a_explorer = "./dossier_a_explorer"; ?>
    <h3>Exploration de dossier / Conversion des fichiers en UTF-8</h3>
    <h4>Dossier : "<?php echo $dossier_a_explorer; ?>"</h4>
    <nav id="exploreur-dossier">
    <ul>
    <?php echo dir_convert_toUTF8($dossier_a_explorer); // N.B. la fonction étant récursive, on ne peut pas mettre les balises <ul> dedans ?>
    </ul>
    </nav>
     
    </body>
    </html>
    Images dans le dossier "images" :
    • Nom : file.png
Affichages : 188
Taille : 639 octets
    • Nom : folder.png
Affichages : 196
Taille : 632 octets
    Dernière modification par Domi2 ; 06/12/2015 à 13h04.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [HTML] Encodage des accents en UTF-8 (très bizarre)
    Par Aspic dans le forum Balisage (X)HTML et validation W3C
    Réponses: 8
    Dernier message: 02/07/2008, 14h01
  2. [FLASH MX2004] Balises HTML dans mysql et PHP
    Par Garra dans le forum Flash
    Réponses: 3
    Dernier message: 06/04/2006, 11h46
  3. [MySQL] Php / Html Mettres des Variables PHP en Values sur des form
    Par Jimmy_S dans le forum PHP & Base de données
    Réponses: 6
    Dernier message: 22/03/2006, 11h18
  4. [MySQL] generer un fichier html a partir de php en interne sur serve
    Par NoobX dans le forum PHP & Base de données
    Réponses: 4
    Dernier message: 11/10/2005, 14h01
  5. [HTML][Encodage] Problèmes avec les accents...
    Par eraim dans le forum Entrée/Sortie
    Réponses: 4
    Dernier message: 26/05/2004, 10h11

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo