|
Publicité ' | |||||||||||||||||||||||
|
|
#1 | ||
|
Membre du Club
![]() Inscription : mai 2002 Messages : 526 ![]() |
Bonjour à tous,
Dans le code suivant, j'aimerais récupérer les éléments suivants avec preg_match : h1, div.article_metadata, div#article_body Code :
Merci. |
||
|
|
00
|
|
|
#2 |
![]() ![]() Inscription : septembre 2010 Messages : 7 103 ![]() |
pour parser du HTML c'est DOMDocument
__________________
http://blog.stealth35.com/ |
|
|
10
|
|
|
#3 | |
|
Membre du Club
![]() Inscription : mai 2002 Messages : 526 ![]() |
J'ai déjà utiliser le dom et xpath, mais j'ai un problème de codage.
Parce que dans l'affichage du résultat (il est en arabe), j'ai des caractères bizarre. Citation:
|
|
|
|
00
|
|
|
#4 |
![]() ![]() Inscription : septembre 2010 Messages : 7 103 ![]() |
ton script est bien en utf-8 ?
__________________
http://blog.stealth35.com/ |
|
|
00
|
|
|
#5 | ||
|
Membre du Club
![]() Inscription : mai 2002 Messages : 526 ![]() |
Oui, le fichier est sauvegardé en UTF8 Without BOM.
Code :
|
||
|
|
00
|
|
|
#6 |
![]() ![]() Inscription : septembre 2010 Messages : 7 103 ![]() |
ton file_get_contents_utf8 sert a rien le site est déjà en utf-8
__________________
http://blog.stealth35.com/ |
|
|
00
|
|
|
#7 |
|
Membre du Club
![]() Inscription : mai 2002 Messages : 526 ![]() |
D'où vient le problème à ton avis ?
|
|
|
00
|
|
|
#8 |
![]() ![]() Inscription : septembre 2010 Messages : 7 103 ![]() |
réencode pas en utf-8
__________________
http://blog.stealth35.com/ |
|
|
00
|
|
|
#9 |
|
Membre du Club
![]() Inscription : mai 2002 Messages : 526 ![]() |
Le code php est à nouveau sauvegardé sous encodage ANSI.
Testé. Même problème d'affichage du rendu
|
|
|
00
|
|
|
#10 |
![]() ![]() Inscription : septembre 2010 Messages : 7 103 ![]() |
fallait laisser l'utf-8, mais as tu bien enlever ta fonction file_get_contents_utf8 ?
__________________
http://blog.stealth35.com/ |
|
|
00
|
|
|
#11 |
|
Membre du Club
![]() Inscription : mai 2002 Messages : 526 ![]() |
|
|
|
00
|
|
|
#12 | ||
|
Membre actif
![]() |
Je croix que c'est plus simple parser ce document HTML comme étant un XML, mais si vous voulez utiliser les expressions régulières alors ce code :
Code :
|
||
|
11
|
|
|
#13 |
|
Membre du Club
![]() Inscription : mai 2002 Messages : 526 ![]() |
|
|
|
00
|
|
|
#14 | |||
![]() ![]() Inscription : septembre 2010 Messages : 7 103 ![]() |
Citation:
Code :
par contre les div n'existent pas dans le code source
__________________
http://blog.stealth35.com/ |
|||
|
|
00
|
|
|
#15 |
|
Membre du Club
![]() Inscription : mai 2002 Messages : 526 ![]() |
|
|
|
00
|
|
|
#16 | |
![]() ![]() Inscription : septembre 2010 Messages : 7 103 ![]() |
Citation:
regarde bien , div.article_metadata, div#article_body n'existent pas
__________________
http://blog.stealth35.com/ |
|
|
|
00
|
|
|
#17 |
|
Membre du Club
![]() Inscription : mai 2002 Messages : 526 ![]() |
|
|
|
00
|
|
|
#18 |
![]() ![]() Inscription : septembre 2010 Messages : 7 103 ![]() |
non dans ta page HTML d'origine
__________________
http://blog.stealth35.com/ |
|
|
00
|
|
|
#19 |
|
Membre du Club
![]() Inscription : mai 2002 Messages : 526 ![]() |
Ah oui
Ce lien contient la listes de tout les articles : http://www.echoroukonline.com/ara/ed...l/index.1.html Mais dont je veux récupérer le contenu ce trouve dans le dernier article ajouté (le premier dans la liste), à savoir : http://www.echoroukonline.com/ara/editorial/77456.html |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com