Précédent   Forum des professionnels en informatique > PHP > Langage > Regex
Regex Forum d'entraide sur les expressions rationnelles PHP. Avant de poster -> FAQ regex, Cours de regex et Sources de regex
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 03/08/2007, 02h03   #1
Membre du Club
 
Inscription : juillet 2007
Messages : 238
Détails du profil
Informations forums :
Inscription : juillet 2007
Messages : 238
Points : 46
Points : 46
Par défaut Extraire le nom d'un site dans une URL

Bonjour,

J'aimerais savoir comment faire pour extraire le nom d'un site dans une URL par exemple extraire google dans http://www.google.com

J'ai vraiment du mal à comprendre les fonctions regulieres, j'ai trouvé sa :
$serveur = ereg_replace("(http://[^/]*/)(.*)", "\\1", $url);

Mais sa me permet juste de remplacer http://www.google.com/fr par http://www.google.com par exemple.

et je ne comprend pas le mécanisme des eregs ???
Overstone est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/08/2007, 02h37   #2
Nouveau Membre du Club
 
Inscription : juin 2006
Messages : 39
Détails du profil
Informations forums :
Inscription : juin 2006
Messages : 39
Points : 39
Points : 39
Envoyer un message via ICQ à Dudule-le-poisson
Si tu as du mal avec les regexp, va voir expreg.com, c'est bien expliqué. Remarque, il y a sans doute de bons tutos sur développez.net aussi, n'hésite pas à rechercher.

Pour ton problème, je ferais ceci :
Code :
1
2
3
4
5
$url = 'http://www.google.com/';
if (preg_match('/^http:\/\/(?:www\.)?(.+)\.[a-z]{3}(?:\/)?$/', $url, $tab)) {
    $site = $tab[1];
    echo $site;
}
Explications : L'expression régulière est entre //
  • ^ désigne le début de la chaîne, $ la fin de la chaîne
  • http:\/\/ signifie que la chaîne doit commencer par http:// (les / doivent être échappés en \/)
  • les parenthèses servent à délimiter un groupe qui sera capturé et mis dans $tab. Pour ne pas capturer des éléments inutiles, on utilise (?.
  • (?:www\.)? signifie donc que le groupe non capturé "www." est facultatif (c'est la signification du point d'interrogation)
  • Pareil pour le (?:\/)? à la fin : le / en fin de chaine est facultatif
  • \.[a-z]{3} désigne le top-level domain du site : 3 lettres minuscules
  • Au milieu, il ne reste que : (.+) : au moins un caractère qui sera capturé : c'est le nom du site
Dudule-le-poisson est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/08/2007, 12h44   #3
Membre du Club
 
Inscription : juillet 2007
Messages : 238
Détails du profil
Informations forums :
Inscription : juillet 2007
Messages : 238
Points : 46
Points : 46
Merci pour ton explication trés clair, je vais essayer de m'instruire un peu plus sur les regex maintenant
Overstone est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/08/2007, 13h03   #4
Membre chevronné
 
Avatar de cadoudal56
 
Inscription : février 2005
Messages : 671
Détails du profil
Informations personnelles :
Âge : 40

Informations forums :
Inscription : février 2005
Messages : 671
Points : 646
Points : 646
Hello,

Si tu fais cela, tu n'extrait pas le nom du site mais le nom de domaine.
Pour extraire le nom du site il faut "ouvrir" la page et chercher dans la balise Title.

Mais bon, il faut aussi toucher au regexp (qui veut dire expression reguliere)

@+
cadou
__________________
PHP Competition System
Script de gestion de coupes et championnats
http://phpcompet.free.fr

Mon jeu de foot
cadoudal56 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/08/2007, 15h10   #5
Membre chevronné
 
Avatar de Korko Fain
 
Étudiant
Inscription : août 2005
Messages : 632
Détails du profil
Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : août 2005
Messages : 632
Points : 632
Points : 632
la balise title ce n'est pas le nom du site mais le nom de la page :p
Korko Fain est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 17h21.


 
 
 
 
Partenaires

Hébergement Web