besoin aide - parser HTML - BeautifulSoup
Bonjour,
Je ne saisis pas tout dans la doc de BeautifulSoup...
Je cherche à récupérer une page HTML, qui comporte dedans un texte "New Wallpapers Update :" suivi ensuite d'une date...
Mon but est de récupérer cette date, qui change évidemment de temps en temps...
J'ai pour l'instant fait ça:
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
|
import BeautifulSoup
import urllib
import re
myUrl="http://www.desktopgirls.com/intro.htm"
myPage=urllib.urlopen(myUrl)
myPageBuffer=myPage.read()
mySoup=BeautifulSoup.BeautifulSoup(myPageBuffer)
comment=mySoup.find(text=re.compile("Wallpapers Update"))
print comment
myPage.close() |
Je récupère bien la mention "Wallpapers Update" ... Par contre, je n'ai aucune idée de comment je pourrais récupérer la suite ?
Merci d'avance, je sèche depuis plusieurs jours... :-/