Extraction de données depuis un code HTML
Bonjour tout le monde,
Pour le boulot, je dois créer un "annuaire" de toutes les boutiques qui vendent de l'outillage dans l'état du New South Wales en Australie.
Pour ce faire, je suis parti sur yellow pages pour faire la recherche, qui me ressort 670 boutiques.
J'ai regardé un peu comment fonctionnait le code source de la page, et j'ai trouvé dans le code ou se trouvent les infos que je recherche.
Depuis deux jours j'essai de trouver comment extraires les données depuis ce code source, mais sans résultats...
En gros, sur un code qui ressemble à ça:
Code:
1 2 3 4 5 6 7 8 9 10 11 12
|
data-product-version="3" data-product-id="501059128" data-product-code="YPD04-DC" data-business-name="Lachlan_Steel_Power_Tools_Plus" data-full-name="Lachlan Steel Power Tools Plus" data-result-type="O" data-heading-code="12033" data-heading-name="Tools & Trade Tools" data-suburb="Cowra" data-state="NSW"
<a href="mailto:sales%40lachlansteel.com.au?subject=Enquiry%2C%20sent%20from%20yellowpages.com.au&body=%0A%0A%0A%0A%0A------------------------------------------%0AEnquiry%20via%20yellowpages.com.au%0Ahttps%3A%2F%2Fwww.yellowpages.com.au%2Fnsw%2Fcowra%2Flachlan-steel-power-tools-plus-15470421-listing.html%3FreferredBy%3Dwww.yellowpages.com.au%26context%3DbusinessTypeSearch" rel="nofollow" title="Email sales@lachlansteel.com.au" data-email="sales@lachlansteel.com.au" class="contact contact-main contact-email " >
<a href="tel:0263424188" rel="nofollow" title="Phone" class="click-to-call contact contact-preferred contact-phone " >
<span class='glyph icon-phone border border-dark-blue with-text'></span><span class="contact-text">(02) 6342 4188</span>
</a> |
Je dois donc récupérer toutes les infos en gras dans le code, et les transferer sur un fichier texte..
Quelqu'un a une idée de comment je peux m'y prendre?
Merci d'avance!
Antoine