besoin aide - parser HTML - BeautifulSoup

Version imprimable

Bonjour,

Je ne saisis pas tout dans la doc de BeautifulSoup...

Je cherche à récupérer une page HTML, qui comporte dedans un texte "New Wallpapers Update :" suivi ensuite d'une date...
Mon but est de récupérer cette date, qui change évidemment de temps en temps...

J'ai pour l'instant fait ça:
Code:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 import BeautifulSoup import urllib import re myUrl="http://www.desktopgirls.com/intro.htm" myPage=urllib.urlopen(myUrl) myPageBuffer=myPage.read() mySoup=BeautifulSoup.BeautifulSoup(myPageBuffer) comment=mySoup.find(text=re.compile("Wallpapers Update")) print comment myPage.close()
Je récupère bien la mention "Wallpapers Update" ... Par contre, je n'ai aucune idée de comment je pourrais récupérer la suite ?

Merci d'avance, je sèche depuis plusieurs jours... :-/

Il suffit de regarder dans le DOM (sous firefox dans outil) quel est le tag qui entoure le texte recherché et ensuite de chercher le tag approprié

Code:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
 
import BeautifulSoup
import urllib
 
myUrl="http://www.desktopgirls.com/intro.htm"
myPage=urllib.urlopen(myUrl)
myPageBuffer=myPage.read()
 
mySoup=BeautifulSoup.BeautifulSoup(myPageBuffer)
 
all_font=mySoup.findAll(color="#DF8F00")
 
 
for font_en_cours in all_font :
    if font_en_cours.string <> None :
        print font_en_cours.string
myPage.close()

20/07/2007, 14h42
romses2

Merci beaucoup Hélix ! :-)