IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

exercice sur les pages web


Sujet :

Python

  1. #1
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2014
    Messages
    208
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Janvier 2014
    Messages : 208
    Points : 60
    Points
    60
    Par défaut exercice sur les pages web
    Bonjour,

    je deviens folle avec cette exercice ça fait au moins 3 semaine que je cherche sans vain, j'ai vraiment besoin de l'aide

    la question est :

    adapter un script pour qu'il puisse non seulement indexer une page WEB quel que soit son codage, mais aussi pour qu'il construise automatiquement la liste des liens HTTP mentionnés dans la page, et indexe également leur contenu, quelqu'en soit le codage, toujours " ; et bien entendu, prévoir l'architecture du programme pour qu'il soit aisé de le faire évoluer en vue de traiter également les liens référencés par les pages liées il s'agit un module et un script

    j'ai tenté ça :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
     
     
    def pilote(fichier, dex) : 
          flux = open(fichier, 'r') 
          for n, ligne in enumerate(flux) : 
                  dex = indexe(dex, ligne.split(), n + 1) 
          flux.close() 
          prd(dex) 
          return dex 
     
    ponctuation = '(/-+,.")'                                                                                                                                                                                  
     
     
    def nettoie(mot) :                      
         new = ''                            
         for x in mot :                      
                 if x not in ponctuation : new += x
                 else : pass                
         return new
     
    def get_href(ligne) :
    	x = ligne.find('href=')
    	if x < 0 : return
    	ref = ligne[x+6:].split('"')[0]
    	if ref.startswith('http:') : return ref   
     
     
    def indexe(dex, mots, ligne) : 
          hrefs = []
          for ligne in dex : hrefs.append(get_href(ligne))
          for mot in mots : 
                  mot = nettoie(mot) 
                  if mot.lower() in go_get_list() : dex = ajoute(dex, mot, ligne)
                  else : pass
          return dex 
     
    def ajoute(dex, mot, ligne) : 
          if mot in dex : 
                  if ligne in dex[mot] : pass 
                  else : dex[mot].append(ligne) 
          else : dex[mot] = [ligne] 
          return dex 
     
    stoplist = 'ce de du en le in la mais on ou par pas pour qui un une'.split()
     
    golist = 'forums accessibles main Server universitaires fermeture organisation versions tools shrubbery '.split()
     
     
    def prd(d) :  
          for c in sorted(d) : 
                  print '\t', c, ':', d[c]
     
    def put_list(golist) :
          flux = open('go.list', 'w')                                                
          flux.write('\n'.join(golist))                                              
          flux.close()
     
    def go_get_list() :
                 flux = open('go.list', 'r')
                 get = flux.read().split()
                 flux.close()
                 return get 
     
     
    def put_list(stoplist) :
          flux = open('stop.list', 'w')                                                
          flux.write('\n'.join(stoplist))                                              
          flux.close()
     
     
    def get_list() :
                 flux = open('stop.list', 'r')
                 stoplist = flux.read().split()
                 flux.close()
                 return stoplist
    le module est :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    #!/usr/bin/env python
    # -*- coding: UTF-8 -*-
     
    from dexlex import indexe, prd
    from sys import argv
    from urllib import urlopen
     
     
    def pilote(f, X) :
    	url = f if f.startswith('http://') else None
    	flux = urlopen(f) if url else open(f)
    	for n, texte in enumerate(flux) :
    		X = indexe(X, texte.split(), url or n+1)
    	flux.close()
    	return X
     
     
     
    if len(argv) > 1  :
    	for x in argv[1:]: print prd(pilote(x, {}))
    else : exit('arg manquant : fichier ou url')
    mais je reçois ça comme réponse au terminal :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    ./imd.py 'http://www.iedparis8.net/ied'  
            Fermeture : ['universitaires']
            organisation : ['universitaires']
            universitaires : ['http://www.iedparis8.net/ied']
    help svp

  2. #2
    Candidat au Club
    Femme Profil pro
    Architecte technique
    Inscrit en
    Août 2014
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Architecte technique
    Secteur : Conseil

    Informations forums :
    Inscription : Août 2014
    Messages : 1
    Points : 4
    Points
    4
    Par défaut

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    ./imd.py 'http://www.iedparis8.net/ied'  
            Fermeture : ['universitaires']
            organisation : ['universitaires']
            universitaires : ['http://www.iedparis8.net/ied']
    help svp
    Elle va être contente l'université.

  3. #3
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2014
    Messages
    208
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Janvier 2014
    Messages : 208
    Points : 60
    Points
    60
    Par défaut
    !!!!! je cherche une solution :s

Discussions similaires

  1. Créer un tableau avec access comme sur les pages web
    Par celiaaa dans le forum VBA Access
    Réponses: 3
    Dernier message: 02/06/2007, 22h53
  2. gifs animés fixent sur les pages web
    Par leloup62 dans le forum Dépannage et Assistance
    Réponses: 3
    Dernier message: 28/09/2006, 14h58
  3. Réponses: 14
    Dernier message: 20/08/2006, 00h00
  4. PNG sur les pages Web
    Par Crayon dans le forum Webdesign & Ergonomie
    Réponses: 4
    Dernier message: 28/07/2006, 20h36
  5. Réponses: 2
    Dernier message: 30/11/2005, 11h19

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo