IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

Problème synthaxe pour récuperer des liens (HTML)


Sujet :

Langage Perl

  1. #1
    Membre du Club
    Inscrit en
    Octobre 2007
    Messages
    99
    Détails du profil
    Informations forums :
    Inscription : Octobre 2007
    Messages : 99
    Points : 47
    Points
    47
    Par défaut Problème synthaxe pour récuperer des liens (HTML)
    Bonjour à tous,

    Voici mon problème :
    je parse une page web, et je voudrais récupérer un lien qui se situe dans cette page, pour ,par la suite, le parser.

    Malheureusement 2 choses ne m'arrangent pas :
    Ce n'est pas le seul lien dans la page (Il se trouve avec une liste de liens assez longues)
    Ce fameux lien n'existe pas toujours !!!
    Mon premier parsage s'effectue dans une base de données (Ce fameux lien est présent ou non suivant le nom de la recherche)

    Je demande a mon programme,
    SI il trouve ce lien, alors il va parser dans ce nouveau lien
    SINON, il parse dans un autre site
    Mon problème est que, comme tous les autres liens ne correspondent pas a mon fameux lien, mes 2 instructions if et else se répetent ( et se mesurent au nombre de liens)

    Pouvez vous m'aider pour trouver une stucture synthaxique pour echaper a ce probleme

    Je voudrais simplement : Si présence du LIEN alors parser dans ce lien
    SI absence du LIEN alors parser sur un autre site !!

    MERCI d'avance

  2. #2
    Membre du Club
    Profil pro
    Inscrit en
    Février 2006
    Messages
    38
    Détails du profil
    Informations personnelles :
    Âge : 40
    Localisation : France

    Informations forums :
    Inscription : Février 2006
    Messages : 38
    Points : 45
    Points
    45
    Par défaut
    Est-ce que tu utilise une librairie en particulier pour parser ton fichier html?, parce que si c'est la cas ça ne doit pas être trop dificile de vérifier si le lien est dans la page ou pas. Je m'explique : Si ton parser te renvoie un objet du style arbre ou graphe, une recherche recursive sera vite écrite et tu pourra savoir rapidement si tu as ou non le lien dans le site.
    Après ya un truc que j'ai pas bien compris. Si le lien existe, tu veux aller parser la page qui se trouve à l'adresse du lien et sinon tu passe à une autre site que tu as définis.Mais le second parse ne reviens pas à chercher à nouveau le lien parce que sinon si une le lien visé par le lien que tu recherche contient ce lient également, ca rique de partir en boucle infinie ton machin, alors à moins que tu stock dans un booléens que tu es bien dans le site que tu voulais atteindre et donc que le lien en question n'est plus à chercher.
    Enfin bref... un peu plus de précision de ta part serait pas mal :p pour pouvoir répondre convenablement...
    FX

  3. #3
    Membre du Club
    Inscrit en
    Octobre 2007
    Messages
    99
    Détails du profil
    Informations forums :
    Inscription : Octobre 2007
    Messages : 99
    Points : 47
    Points
    47
    Par défaut
    En faite, je me suis "démerdé" autrement; j'ai réussi à implanter de nouvelle variables et instructions if, et cela fonctionne...

    Merci quand même de ton aide knarf87 !!

  4. #4
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 820
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 820
    Points : 498 771
    Points
    498 771
    Par défaut
    il exite le module URI qui te recupere tous les liens web d'une page, t'en fais ce que tu veux apres tout simplement.

Discussions similaires

  1. [C#] Problème pour récuperer des données dans une datatgridview
    Par Faible37 dans le forum Débuter
    Réponses: 2
    Dernier message: 22/03/2012, 10h26
  2. [D7] [Firebird 2.1] problème pour récuperer des champs calculés
    Par seb7710 dans le forum Bases de données
    Réponses: 5
    Dernier message: 23/11/2011, 17h29
  3. Réponses: 1
    Dernier message: 01/12/2010, 20h16
  4. [RegEx] Exclure une chaine dans un motif, pour extraire des liens html
    Par Dimitri01 dans le forum Langage
    Réponses: 4
    Dernier message: 09/11/2007, 16h40
  5. [débutante]utiliser les classes css pour surligner des liens
    Par Mitaka dans le forum Général JavaScript
    Réponses: 18
    Dernier message: 06/01/2006, 09h37

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo