bonjour,
suite a ce thread dans la rubrique "C", l'idee est apparue d'organiser un petit concours dont l'objet serait le developpement d'un parser HTML.
l'objectif est de realiser un parser rapide et robuste, capable d'extraire correctement les liens d'un flux HTML (pour plus de details, voir le thread en question).
l'interet est double: comparer les differentes approches, et susciter une emulation entre les participants, le tout dans une ambiance plutot decontractee (pas de formalisation a outrance, deadline hyper souple d'autant que certains d'entre nous se sont deja penches sur le probleme, etc..). il ne s'agit pas, bien sur, de reutiliser une libxml quelconque (quoiqu'il pourrait etre intererssant de comparer les resultats), mais bien de se creuser un peu les meninges.
cette experience etant egalement une bonne occasion de "revisiter" un peu les particularites syntaxiques de ce langage, il me semble que la presente annonce n'est pas completement hors sujet dans ce forum. nous invitons donc toutes les personnes qui seraient interessees a nous rejoindre (et a participer ! soit en proposant une implementation de parser, soit en fournissant des "corpus" de test).
merci et.. bon code
-pirus.
Partager