Bonjour,
Je cherche à récupérer les liens sur des images dans une page de résultats sur http://images.google.fr.
Voici le début de mon code :
A partir de là j'ai le code source de la page Web retournée dans sourcePage.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17 Dim HttpWResponse As HttpWebResponse = Nothing Dim sr As StreamReader = Nothing Dim sourcePage As String Try Dim url As New System.Text.StringBuilder url.Append("http://images.google.fr/images?q=stuff") url.Append("&svnum=10&um=1&hl=fr&imgsz=xxlarge") Dim HttpWRequest As HttpWebRequest = CType(WebRequest.Create(url.ToString), HttpWebRequest) HttpWResponse = CType(HttpWRequest.GetResponse, HttpWebResponse) sr = New StreamReader(HttpWResponse.GetResponseStream) sourcePage = sr.ReadToEnd sr.Close() Catch ex As Exception Console.WriteLine(ex.Message) Return Nothing End Try
Mais je ne sais pas du tout par quel bout prendre le problème pour analyser la chaine et retrouver tous les http://url_de_mon_image.jpg enfouis dans le code HTML.
Quelqu'un aurait-il une suggestion ? Merci !
Partager