supression des premiers caractères de chaque éléments d'une liste
Bonjour tout le monde,
Je suis coincé sur un petit programme que j'essaye de faire. Dans l'idée le programme sert à récupérer les url d'une page web pour les pings après pour vérifier si ils sont encore actif, cependant je bloque sur le formatage des liens, voici mon code :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
| from requests import get
from bs4 import BeautifulSoup
import html5lib
from pythonping import ping
url = "https://old.reddit.com/r/Piracy/wiki/megathread/movies_and_tv#wiki_.1F4D1_.279C_streaming"
response = get(url)
source = None
source = response.text
if source:
soup = BeautifulSoup(source, "html.parser")
links = [link.get("href") for link in soup("a")]
i = 0
for link in links:
if links[i].startswith("https://"):
if "reddit" in links[i]:
links.remove(links[i])
i+=1
else:
i+=1
else:
links.remove(links[i])
i += 1
print(links)
input() |
Mon problème pour l'instant c'est que j'aimerais pouvoir enlever le "https://" de chaque lien que je récupère pour pouvoir ensuite ping chaque lien un par un mais je n'arrive pas à les supprimer, j'ai essaye le .replace mais ça me renvoi quelque chose comme "no attribute replace for list object" ou quelque chose comme ça. Je n'ai pas trouvé de solution convenante alors merci d'avance de votre aide.
(ps le """if "reddit" in links[i]""" ne fonctionne pas non plus pour supprimer les liens qui renvoit vers reddit donc je suis aussi preneuse d'une solution pour ça aussi <3)