bonjour.
Je veux isoler des données dans une page html... la parser en somme.
Voici un extrait de la page :
Je veux isoler les 2 urls ainsi que la section switches. Tout ça tient en une seule ligne.</b></span></span><a href="http://support.microsoft.com/kb/922616/en-us" target="_blank">KB922616</a>
Vulnerability in HTML Help could allow remote code execution<a href="http://www.microsoft.com/downloads/details.aspx?FamilyID=34ebe5d3-40c9-41dc-aaff-64608d3ac7b1&DisplayLang=en" target="_blank">Download</a>
700 KB (August 7, 2006)Switches: KB922616.exe /passive /norestart /quiet<span style="color:red"><span style="font-size:8pt;line-height:100%"><b>*** NEW ***</b></span></span>
Mes possibilités sont sed, awk, perl et sûrement d'autres.
Je les connais et les ai déjà utilisés avec succés mais je ne les maitrise pas.
Réussir à maîtriser un seul de ces outils est long, et j'ai peur de m'embarquer dans une solution et de passer beaucoup de temps pour une solution qui ne serait pas la plus logique/simple.
Merci d'avance pour vos conseils éclairés.
Partager