IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

regex sur page web


Sujet :

Langage PHP

  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Décembre 2010
    Messages
    5
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2010
    Messages : 5
    Points : 5
    Points
    5
    Par défaut regex sur page web
    Bonjour,

    je voudrai faire une regex sur une page web.
    voici m regex :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
     
    $regex = '@<h3>
    			<a href="#">&nbsp;&nbsp;
    				<span class="foot_news_title_MU">(*)</span>&nbsp;&nbsp;
    				<span class="Text_Today_Time">GMT+1</span>
    				<span class="Text_news_big_Syn">&nbsp;|&nbsp;<strong>(*)</strong></span>
    			</a>
    			</h3>
    			<div style="padding:5px;" align="left">
    				<table width="99%" border="0" cellspacing="0" cellpadding="0">
    					<tr>
    						<td align="center" valign="middle" width="170">
    							<img src="(*)" width="150" height="95" title="*" alt="*" />
    						</td>
    						<td align="left" valign="middle" class="Text_news_small_Syn">(*)</td>
    					</tr>
    				</table>
    			</div>@';
    Je lui applique la fonction clean pour echapper tous les caracteres spéciaux :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    function clean($string){
    	$string = str_replace(".","\.",$string);
    	$string = str_replace("+","\+",$string);
    	$string = str_replace("-","\-",$string);
    	$string = str_replace("*","\*",$string);
    	$string = str_replace("?","\?",$string);
    	$string = str_replace("|","\|",$string);
    	$string = str_replace("-","\-",$string);
    	$string = str_replace("$","\$",$string);
    	$string = str_replace("()","\()",$string);
    	$string = str_replace("(","\(",$string);
    	$string = str_replace(")","\)",$string);
    	$string = str_replace("{}","\{}",$string);
    	$string = str_replace("{","\{",$string);
    	$string = str_replace("}","\}",$string);
    	$string = str_replace("[]","\[]",$string);
    	$string = str_replace("[","\[",$string);
    	$string = str_replace("]","\]",$string);
     
    	return $string;
    }
    Malgré ça, mon code ne marche pas.

    voici la partie de la page qui doit satisfaire l'expression réguliere :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    <h3><a href="#">&nbsp;&nbsp;<span class="foot_news_title_MU">00:45</span>&nbsp;&nbsp;<span class="Text_Today_Time">GMT+1</span><span class="Text_news_big_Syn">&nbsp;|&nbsp;<strong>NESS NESSMA &ndash; Rediffusion</strong></span><br/>&nbsp;&nbsp;Commence dans 3 heures et 3 minutes.</a></h3>
     
                        <div style="padding:5px;" align="left">
     
                          <table width="99%" border="0" cellspacing="0" cellpadding="0">
     
                            <tr>
     
                              <td align="center" valign="middle" width="170"><img src="assets/front/grille/ness150x95.jpg" width="150" height="95" title="NESS NESSMA – Rediffusion" alt="NESS NESSMA – Rediffusion" /></td>
     
                              <td align="left" valign="middle" class="Text_news_small_Syn">
     
    						  						  </td>
     
                            </tr>
     
                          </table>
     
                        </div>
    Merci pour vos réponses.

  2. #2
    Membre confirmé
    Profil pro
    Inscrit en
    Octobre 2004
    Messages
    329
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations forums :
    Inscription : Octobre 2004
    Messages : 329
    Points : 608
    Points
    608
    Par défaut
    Je ne suis pas expert en regexp, mais tu es sur que les blancs ne vont pas invalider ton expression ? Déja entre le "<h3>" et le "<a href..." au debut ça ne colle pas...

    Et tu devrais essayer de la construire progressivement, en vérifiant qu'elle valide bien la sous-partie de ta chaine cible.

  3. #3
    Membre émérite Avatar de Madfrix
    Profil pro
    Inscrit en
    Juin 2007
    Messages
    2 326
    Détails du profil
    Informations personnelles :
    Localisation : France, Gironde (Aquitaine)

    Informations forums :
    Inscription : Juin 2007
    Messages : 2 326
    Points : 2 566
    Points
    2 566
    Par défaut
    Quelle horreur cette regex


    Tu peux et dois largement simplifier. Exemple tu as qu'une balise <img> donc pas besoin d'une regex aussi longue pour récupérer le src...

    Sinon tu peux mettre des tableaux en paramètre de str_replace, cela sera plus propre


    Code php : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    $sortie = str_replace(array('a', 'b'), array('c', 'd'), $entree);

  4. #4
    Membre émérite
    Avatar de Eric2a
    Homme Profil pro
    Technicien
    Inscrit en
    Septembre 2005
    Messages
    1 225
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Corse (Corse)

    Informations professionnelles :
    Activité : Technicien

    Informations forums :
    Inscription : Septembre 2005
    Messages : 1 225
    Points : 2 411
    Points
    2 411
    Par défaut
    Salut,

    La fonction preg_quote() protège les caractères spéciaux des expressions rationnelles.

    preg_quote() ajoute un antislash devant tous les caractères de la chaîne str. Cela est très utile si vous avez une chaîne qui va servir de masque, mais qui est générée durant l'exécution.

    Les caractères spéciaux qui seront protégés sont les suivants : . \ + * ? [ ^ ] $ ( ) { } = ! < > | : -

  5. #5
    Membre habitué Avatar de Epica84
    Profil pro
    Étudiant
    Inscrit en
    Décembre 2008
    Messages
    164
    Détails du profil
    Informations personnelles :
    Âge : 34
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Décembre 2008
    Messages : 164
    Points : 188
    Points
    188
    Par défaut
    Sérieux

    Comme dit Madfrix quel horreur cette expression !!!

    En plus, regex est obsolète utilise preg_match

    Et si vous voulez mon aide. Merci de me passer la page en question en entière et ce que vous voulez récupérez .

    Je vous expliquerai le principe pour les 3 premiers enregistrement.

    Cordialement

  6. #6
    Futur Membre du Club
    Profil pro
    Inscrit en
    Décembre 2010
    Messages
    5
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2010
    Messages : 5
    Points : 5
    Points
    5
    Par défaut Regex
    Bonjour,

    Ca ne marche toujours pas. j'ai simplé lexpression reguliere au maximum histoire de tester :

    voici le code
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
     
    $regex = '/<html>(.)/';
    $page = file_get_contents($url);
    echo $page . "<br/><br/>";
    if(preg_match(preg_quote($regex),$page,$matches) != 0){
    	echo "matchs : " . $matches[1] . "<br/>";
    }
    else{
    	echo "rien trouve";
    }
    ça m'affiche toujours rien trouve. la page est bien lu et s'affiche comme prévu.

    Merci de votre aide.

  7. #7
    Membre expert
    Avatar de s.n.a.f.u
    Homme Profil pro
    Développeur Web
    Inscrit en
    Août 2006
    Messages
    2 760
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Août 2006
    Messages : 2 760
    Points : 3 545
    Points
    3 545
    Par défaut
    Citation Envoyé par Epica84 Voir le message
    En plus, regex est obsolète utilise preg_match


    C'est ereg qui est déprécié : $regex n'est ici qu'une variable pour stocker son pattern...

  8. #8
    Membre expert
    Avatar de s.n.a.f.u
    Homme Profil pro
    Développeur Web
    Inscrit en
    Août 2006
    Messages
    2 760
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Août 2006
    Messages : 2 760
    Points : 3 545
    Points
    3 545
    Par défaut
    Citation Envoyé par djamelzahal Voir le message
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
     
    $regex = '/<html>(.)/';
    $page = file_get_contents($url);
    echo $page . "<br/><br/>";
    if(preg_match(preg_quote($regex),$page,$matches) != 0){
    	echo "matchs : " . $matches[1] . "<br/>";
    }
    else{
    	echo "rien trouve";
    }
    ça m'affiche toujours rien trouve. la page est bien lu et s'affiche comme prévu.

    Merci de votre aide.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $regex = '/<html>(.)/';
    Essaies sans les preg_quotes : il n'y a aucun caractère interdit dans ce pattern.
    Si tu utilises preg_quote, tes parenthèses seront considérées comme des caractères à trouver et non comme des éléments capturants...

Discussions similaires

  1. Police ttf sur page web
    Par jorisvh dans le forum Balisage (X)HTML et validation W3C
    Réponses: 2
    Dernier message: 21/02/2007, 21h36
  2. graphique dynamique sur page web
    Par kek_net dans le forum Webdesign & Ergonomie
    Réponses: 3
    Dernier message: 16/08/2006, 15h01
  3. trouver plusieurs mots sur page web et les surligner
    Par biggione dans le forum VB 6 et antérieur
    Réponses: 3
    Dernier message: 08/08/2006, 15h22
  4. Lecteur Multimedia sur page Web
    Par beegeesman dans le forum Général Conception Web
    Réponses: 1
    Dernier message: 17/01/2006, 00h15
  5. ShellExecute - Access Denied sur page web
    Par Neilos dans le forum C++Builder
    Réponses: 7
    Dernier message: 03/10/2005, 12h04

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo