![Citation](https://forum.developpez.be/images/misc/quote_icon.png)
Envoyé par
guiyomh
Avez vous une idée, ou des piste a explorer ?
Heu.. oui. De la détection de motif. ![:aie:](https://www.developpez.net/forums/images/smilies/aie.gif)
Ton document HTML est une sorte d'arbre (racine=BODY).
Le problème est de trouver une structure qui se répete dans ton document HTML, comme par exemple:
<div class="x"><table><tr>...</tr><tr>...</tr></table></div>
qui dans ton arbre se représente sous la forme d'un sous arbre:
1 2 3 4 5 6 7 8 9
|
<div class="x">
|
<table>
__|__
| |
<tr> <tr>
| |
... ... |
Il faut donc chercher des arbres qui se répètent. Il y a des méthodes "brut-force" dans lesquels on cherche tous les arbres possibles à partir de l'arbre de départ. Il y a des méthodes plus sophistiquées avec des graphes d'adjacences.
Partager