Précédent   Forum des professionnels en informatique > PHP > Langage > Regex
Regex Forum d'entraide sur les expressions rationnelles PHP. Avant de poster -> FAQ regex, Cours de regex et Sources de regex
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 29/04/2008, 09h49   #1
Membre éclairé
 
Avatar de Space Cowboy
 
Inscription : avril 2005
Messages : 495
Détails du profil
Informations forums :
Inscription : avril 2005
Messages : 495
Points : 306
Points : 306
Par défaut UTF8, problème avec preg_replace

Je suis passé en UTF8. J'ai converti les fichiers, les données des fichiers et supprimé le BOM des fichiers.
Par contre pour la base de données, j'ai du utiliser mysql_query("SET NAMES 'utf8'"); faute de pouvoir convertir mes données.

Voila la fonction qui déconne :
Code :
1
2
3
4
5
6
7
8
9
function NomImage($nom='')
{	$patterns=array	(	'/[\'\s]/',		'/([ä])/',		'/([ ])/',		'/([é])/',		'/([ê])/',		'/([è])/',		'/([à])/',	'/([â])/',	'/([û])/',	'/([î])/',	'/([ô])/',	'/([,])/',	'/([-])/',	'/([:])/',	'/([!])/',	'/([\'])/'
						);
	$replac=array		('',				'a',			'',				'e',			'e',			'e',			'a',		'a',		'u',		'i',		'o',		'',			'',			'',			'',			'\''						
						);
 
	$nom=preg_replace($patterns, $replac, $nom);
	return strtolower($nom);
}
echo NomImage('léwàwäwïwBleur'); écrit dans un fichier UTF8 en UT8 me donne : laewawaawa�wbleur

echo NomImage('léwàwäwïwBleur'); venant de la BDD me donne : laewawaawa

L'ajout et l'affichage de léwàwäwïwBleur dans la bdd ne pose aucun soucis, il est enregistré et affiché correctement. C'est seulement cette fonction qui débloque.

Pourquoi ca débloque ? Ce n'est pas l'encodage du fichier qui contient la fonction.
Space Cowboy est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 29/04/2008, 21h22   #2
Rédacteur
 
Avatar de Yogui
 
Homme Guillaume Rossolini
Directeur technique
Inscription : février 2004
Messages : 13 720
Détails du profil
Informations personnelles :
Nom : Homme Guillaume Rossolini
Localisation : France

Informations professionnelles :
Activité : Directeur technique

Informations forums :
Inscription : février 2004
Messages : 13 720
Points : 17 355
Points : 17 355
As-tu essayé avec le modificateur pour Unicode ? Il me semble que c'est "u", à vérifier.
__________________
Mes articles - Zend Certified Engineer (PHP + Zend Framework)
Ressources PHP - Ressources Zend Framework
Yogui est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 30/04/2008, 08h45   #3
Membre éclairé
 
Avatar de Space Cowboy
 
Inscription : avril 2005
Messages : 495
Détails du profil
Informations forums :
Inscription : avril 2005
Messages : 495
Points : 306
Points : 306
Je n'ai pas trouvé d'option -u, il y a bien cette option décrite ici, mais je ne sais pas encore comment l'utiliser.

Mais en cherchant, je suis tombé sur ca puis ca.

Apparament, l'utf8 pose problème à la solution de base
Code :
1
2
$str = strtr($str, 'ÁÀÂÄÃÅÇÉÈÊËÍÏÎÌÑÓÒÔÖÕÚÙÛÜÝ', 'AAAAAACEEEEEIIIINOOOOOUUUUY');
$str = strtr($str, 'áàâäãåçéèêëíìîïñóòôöõúùûüýÿ', 'aaaaaaceeeeiiiinooooouuuuyy');
a cause de l'encodage sur plus de 8bits (On va dire que c'est vrai).
Le gars encode le caractère é en &eacute, puis le passe en e. C'est bourrin, mais ca fontionne.

Code :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
<?php
 
function wd_remove_accents($str, $charset='utf-8')
{
    $str = htmlentities($str, ENT_NOQUOTES, $charset);
 
    $str = preg_replace('#\&([A-za-z])(?:uml|circ|tilde|acute|grave|cedil|ring)\;#', '\1', $str);
    $str = preg_replace('#\&([A-za-z]{2})(?:lig)\;#', '\1', $str); // pour les ligatures e.g. '&oelig;'
    $str = preg_replace('#\&[^;]+\;#', '', $str); // supprime les autres caractères
 
    return $str;
}
 
?>
Le problème avec cette solution, c'est que je ne sais pas comment supprimer les caractère comme : - ' ! ou les espaces.
Avant il suffiait de les ajouter dans le tableau.
Space Cowboy est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 30/04/2008, 10h01   #4
Rédacteur
 
Avatar de Yogui
 
Homme Guillaume Rossolini
Directeur technique
Inscription : février 2004
Messages : 13 720
Détails du profil
Informations personnelles :
Nom : Homme Guillaume Rossolini
Localisation : France

Informations professionnelles :
Activité : Directeur technique

Informations forums :
Inscription : février 2004
Messages : 13 720
Points : 17 355
Points : 17 355
Pour que ton strtr fonctionne, il faut que ton script soit encodé en UTF-8 aussi.

Pour l'option de regex, ce n'est pas -u mais plutôt /.../u
__________________
Mes articles - Zend Certified Engineer (PHP + Zend Framework)
Ressources PHP - Ressources Zend Framework
Yogui est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 30/04/2008, 16h42   #5
Membre éclairé
 
Avatar de Space Cowboy
 
Inscription : avril 2005
Messages : 495
Détails du profil
Informations forums :
Inscription : avril 2005
Messages : 495
Points : 306
Points : 306
J'ai fini pas trouver la syntaxe du u, mais ca ne change rien.
Tout est en UTF8.
Space Cowboy est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 20h09.


 
 
 
 
Partenaires

Hébergement Web