Extraire un domaine, sous domaine et la page d'une URL
Bonjour
J'ai des urls du type :
Code:
1 2 3 4 5
| http://www.patate.com/youpy/page.html
http://coucou.patate.com/tagada/plop/pwet/sboum/pageeee.php
http://yop.yap.yip/patate.com/glurp/pwet/autrepage.com |
J'aimerai les séparer en 3 champs :
les sous-domaines :
Code:
1 2 3
| coucou
yop.yap.yip
mais également www que je voudrai considérer comme un sous domaine. |
les domaines :
Code:
patate.com, patate.fr, hopla.eu ...
les pages :
Code:
1 2 3
| youpy/page.html
tagada/plop/pwet/sboum/pageeee.php
glurp/pwet/autrepage.com |
J'essai avec des regexs, mais je m'arrache les cheveux. En fait le sous domaine c'est entre http:// et .tld/
soit qqch comme http:// ( ce que je veux ) .tld/
le problème c'est que si je lui dit que c'est entre les http et .tld/ il essai de me matcher la string la plus longue possible (donc il va chercher le slash très loin...).
Pour le domaine et la page, j'ai les même problèmes.
Ca fait plusieurs heures que je suis dessus et je ne m'en sort pas.
Auriez vous une idée svp? ou alors une technique plus simple en faisant une sorte de split comme en perl?
Merci pour votre aide.