Bonjour,
J'ai un petit soucis de compréhension au sujet de l'une de mes regexp.
Je cherche à parser une page HTML pour récupérer le contenu du <body>
J'ai également vu ce topic qui traite de ce sujet:
http://www.developpez.net/forums/d10...body-page-web/
Tout d'abord, pour réaliser cette opération j'ai créé la regexp ci-dessous:
Code : Sélectionner tout - Visualiser dans une fenêtre à part $body = preg_replace('`<body[^>]*>(.*)</body>`isU','$1',$page);
mais il a fallu que je fasse la regexp suivante pour obtenir le bon résultat.
Cependant, je ne comprends pas pourquoi ma première regexp n'était pas valide
Code : Sélectionner tout - Visualiser dans une fenêtre à part $body = preg_replace('`.*<body[^>]*>(.*)</body>.*</html>`isU','$1',$page);
Vous auriez des éléments de réponse ?
Partager