Rechercher (et extraire) les liens vers la page contact d'un site web
Bonjour
Débutant en python 3.6 et beautifulsoup je suis bloqué dans une fonction ou je passe une URL valide en paramètre.
en gros, j'ouvre la page, je passe les paramètre à beautifulsooup
je créé une liste dans laquelle j'écris tous les URL trouvés dans la page.
ensuite j'e ne sais pas comment retrouver le lien contact dans la liste alors qu'il me l'affiche lorsque j'imprime la liste :(
Ou est mon erreur ?
voici le source :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
| def TestContact(the_uri):
# l'URL du site web est valide, on va chercher s'il existe un lien vers la page contact et retourner ce lien
html_page = urllib.request.urlopen(the_uri)
soup = bs4.BeautifulSoup(html_page, 'html.parser')
LinkList = []
for Link in soup.find_all('a'):
LinkFound=Link.get('href')
LinkList.append(LinkFound)
print ("nombre d'URL : ",len(LinkList))
print (LinkList)
chaine = "-".join(LinkList)
if ("contact" in chaine) :
print ("URL Contact")
return (URL_contact) |