bonjour,
Admettons que j'ai une liste de fichier html (100 fichiers)
cette liste contient une zone de texte commune à toute
comment je peux parser la zone qui m'intérèsse ?
merci encore
bonjour,
Admettons que j'ai une liste de fichier html (100 fichiers)
cette liste contient une zone de texte commune à toute
comment je peux parser la zone qui m'intérèsse ?
merci encore
Tu ouvres les fichiers les uns après les autres et tu fais une requête xpath sur chacun pour trouver la données dont tu as besoin
Mercije débute dans tout ça
j'ai lu l'exemple mais je sais pas lequel utiliser, et ni quoi remplacer
dans mon contexte, le fichier s'appel : fichier1.html
début zone d'extraction :
Fin de zone d'extraction :
Code : Sélectionner tout - Visualiser dans une fenêtre à part <table border="1" class="data-table">
Code : Sélectionner tout - Visualiser dans une fenêtre à part <div class="bottom-block">
Il faut donc apprendre et revenir nous voir avec un peu de code si jamais tu coince![]()
Récupérer le contenu d'un fichier : file_get_contents ou fread
Apprendre la synthaxe xpath : ici ou encore ici
Après xpath n'est peut être pas le plus adapté , mais sans plus de détail dur les données à récupérer , c'est difficile à dire.
désolé pour avoir oublié de mettre les balise code.
Je voudrais surtout éviter ça car ce serait une manip courante et j'ai trop de fichier à extraire.Tu ouvres les fichiers les uns après les autres
Je connais les lien de chaque fichiers, placer dans un dossier en localhost, faudrait, que le code, les ouvre lui même.
je suis un peu dans la même situation que toi.
moi j'essaye de récupérer le code html de la page par
puis j'essaye de loader la variable contenant le code HTML dans un DomDocument.
Code : Sélectionner tout - Visualiser dans une fenêtre à part $html = file_get_contents($url);
je sais pas si c'est la meilleure méthode à faire, en tout cas, ça marche pas encore pour moi
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 dom1 = new DomDocument(); $dom1->loadXML($html);![]()
Vous avez un bloqueur de publicités installé.
Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.
Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.
Partager