Bonjour tout le monde,
Je suis coincé sur un petit programme que j'essaye de faire. Dans l'idée le programme sert à récupérer les url d'une page web pour les pings après pour vérifier si ils sont encore actif, cependant je bloque sur le formatage des liens, voici mon code :
Mon problème pour l'instant c'est que j'aimerais pouvoir enlever le "https://" de chaque lien que je récupère pour pouvoir ensuite ping chaque lien un par un mais je n'arrive pas à les supprimer, j'ai essaye le .replace mais ça me renvoi quelque chose comme "no attribute replace for list object" ou quelque chose comme ça. Je n'ai pas trouvé de solution convenante alors merci d'avance de votre aide.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36 from requests import get from bs4 import BeautifulSoup import html5lib from pythonping import ping url = "https://old.reddit.com/r/Piracy/wiki/megathread/movies_and_tv#wiki_.1F4D1_.279C_streaming" response = get(url) source = None source = response.text if source: soup = BeautifulSoup(source, "html.parser") links = [link.get("href") for link in soup("a")] i = 0 for link in links: if links[i].startswith("https://"): if "reddit" in links[i]: links.remove(links[i]) i+=1 else: i+=1 else: links.remove(links[i]) i += 1 print(links) input()
(ps le """if "reddit" in links[i]""" ne fonctionne pas non plus pour supprimer les liens qui renvoit vers reddit donc je suis aussi preneuse d'une solution pour ça aussi <3)
Partager