IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

[Regex] Domaine et FQDN


Sujet :

Langage Perl

  1. #1
    Membre régulier
    Inscrit en
    Juin 2005
    Messages
    243
    Détails du profil
    Informations forums :
    Inscription : Juin 2005
    Messages : 243
    Points : 89
    Points
    89
    Par défaut [Regex] Domaine et FQDN
    Bonjour tout le monde,

    Il faut que je distingue une chaine soit en tant que domaine :
    domain.com
    domain.co.uk

    ou en fqdn:
    wow.domain.com

    la regex suivante fonctionne pour les fqdn :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    (?i)(?:[-\d\p{L}]{2,}\[?\.\]?)+(?:COM|CO|UK)\b
    Voyez-vous comment maintenant je peux modifier cette regex pour dire que tout ce qui est avant les tld (COM,CO,UK) ne doit faire que 1 bloc SVP ?
    En gros
    toto.co.uk => OK
    wow.toto.co.uk => NOK

    Merci à ceux qui pourront m'aider !

  2. #2
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 820
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 820
    Points : 498 771
    Points
    498 771
    Par défaut
    Bonjour,

    Voici un programme sorti de mes vieux tiroirs.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    #!/usr/bin/perl 
    use strict;
    use warnings;
    use Data::Dumper;
    use URI;
    use Regexp::Common;
     
     
    while (<DATA>) {
        chomp;
    	print Dumper informations_from_url($_);
    }
     
    sub informations_from_url {
    	my ( $url ) = @_;
     
    	# Methode Regexp::Common
    	if ($url =~ /$RE{URI}{HTTP}{-keep}/ ) {
    		my $host = $3;
    		print "[Regexp::Common] $url => $host\n";
    	}
    	else {
    		print "[Regexp::Common] $url => NOK\n";		
    	}
     
     
    	my $u          = URI->new($url);
    	my $protocole  = $u->scheme;
    	my $has_scheme = $u->has_recognized_scheme;
     
    	# Protocole inconnu, URL bizarre et non gérable
    	unless ($has_scheme) {
    		print "Impossible d'analyser cette URL [$url]\n";
    		return;
    	}
     
    	my @paths    = $u->path_segments;
    	my $nbr_segments = scalar(@paths);
    	my $host     = $u->host;
    	my $basename = ($nbr_segments > 0) ? $paths[-1] : '';
    	if ( $nbr_segments > 0 ) {
    	$paths[-1] = undef;    # Retirer le nom du fichier
    	$paths[0]  = undef;    # retirer le vide		
    	}
    	my $repertoire = '/' . join '/', grep { defined($_) } @paths;
    	return { URL => $url, protocole => $protocole, host => $host, repertoire => $repertoire, basename => $basename };
    }	
     
    __DATA__
    https://opengl.developpez.com/
    https://www.developpez.net/forums/showthread.php?t=2114795
    https://soat.developpez.com/tutoriels/nosql/cassandra-pratique/
    http://www.spied.co.nz/thinmailer.cgi
    http://www.site.com/dir/file.html?param1=val1&param2=val2
    ftp://developpez.com/bidou/Cours/DotNet/Utiliser-ADONET-Csharp.zip
    ftp://developpez.com/bidou/Cours/DotNet/
    /logo-soat.png
    toto.co.uk
    wow.toto.co.uk
    http://toto.co.uk
    https://wow.toto.co.uk
    Résultat :
    Code text : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    [Regexp::Common] https://opengl.developpez.com/ => NOK
    $VAR1 = {
              'host' => 'opengl.developpez.com',
              'protocole' => 'https',
              'URL' => 'https://opengl.developpez.com/',
              'basename' => '',
              'repertoire' => '/'
            };
    [Regexp::Common] https://www.developpez.net/forums/showthread.php?t=2114795 => NOK
    $VAR1 = {
              'host' => 'www.developpez.net',
              'URL' => 'https://www.developpez.net/forums/showthread.php?t=2114795',
              'protocole' => 'https',
              'repertoire' => '/forums',
              'basename' => 'showthread.php'
            };
    [Regexp::Common] https://soat.developpez.com/tutoriels/nosql/cassandra-pratique/ => NOK
    $VAR1 = {
              'basename' => '',
              'repertoire' => '/tutoriels/nosql/cassandra-pratique',
              'host' => 'soat.developpez.com',
              'URL' => 'https://soat.developpez.com/tutoriels/nosql/cassandra-pratique/',
              'protocole' => 'https'
            };
    [Regexp::Common] http://www.spied.co.nz/thinmailer.cgi => www.spied.co.nz
    $VAR1 = {
              'host' => 'www.spied.co.nz',
              'URL' => 'http://www.spied.co.nz/thinmailer.cgi',
              'protocole' => 'http',
              'repertoire' => '/',
              'basename' => 'thinmailer.cgi'
            };
    [Regexp::Common] http://www.site.com/dir/file.html?param1=val1&param2=val2 => www.site.com
    $VAR1 = {
              'basename' => 'file.html',
              'repertoire' => '/dir',
              'URL' => 'http://www.site.com/dir/file.html?param1=val1&param2=val2',
              'host' => 'www.site.com',
              'protocole' => 'http'
            };
    [Regexp::Common] ftp://developpez.com/bidou/Cours/DotNet/Utiliser-ADONET-Csharp.zip => NOK
    $VAR1 = {
              'basename' => 'Utiliser-ADONET-Csharp.zip',
              'repertoire' => '/bidou/Cours/DotNet',
              'host' => 'developpez.com',
              'URL' => 'ftp://developpez.com/bidou/Cours/DotNet/Utiliser-ADONET-Csharp.zip',
              'protocole' => 'ftp'
            };
    [Regexp::Common] ftp://developpez.com/bidou/Cours/DotNet/ => NOK
    $VAR1 = {
              'URL' => 'ftp://developpez.com/bidou/Cours/DotNet/',
              'host' => 'developpez.com',
              'protocole' => 'ftp',
              'basename' => '',
              'repertoire' => '/bidou/Cours/DotNet'
            };
    [Regexp::Common] /logo-soat.png => NOK
    Impossible d'analyser cette URL [/logo-soat.png]
    [Regexp::Common] toto.co.uk => NOK
    Impossible d'analyser cette URL [toto.co.uk]
    [Regexp::Common] wow.toto.co.uk => NOK
    Impossible d'analyser cette URL [wow.toto.co.uk]
    [Regexp::Common] http://toto.co.uk => toto.co.uk
    $VAR1 = {
              'host' => 'toto.co.uk',
              'protocole' => 'http',
              'URL' => 'http://toto.co.uk',
              'repertoire' => '/',
              'basename' => ''
            };
    [Regexp::Common] https://wow.toto.co.uk => NOK
    $VAR1 = {
              'host' => 'wow.toto.co.uk',
              'URL' => 'https://wow.toto.co.uk',
              'protocole' => 'https',
              'basename' => '',
              'repertoire' => '/'
            };

  3. #3
    Membre régulier
    Inscrit en
    Juin 2005
    Messages
    243
    Détails du profil
    Informations forums :
    Inscription : Juin 2005
    Messages : 243
    Points : 89
    Points
    89
    Par défaut
    Hey bonjour Djibril !

    Merci d'avoir fouillé votre armoire pour mon besoin, c'est cool !

    Malheureusement je ne peux pas passer par un script perl pour mon besoin, il me faut juste une regex que je dois positionner dans un logiciel.

    Bonne journée dans tous les cas

  4. #4
    Membre régulier
    Inscrit en
    Juin 2005
    Messages
    243
    Détails du profil
    Informations forums :
    Inscription : Juin 2005
    Messages : 243
    Points : 89
    Points
    89
    Par défaut
    Je vais clore ce sujet comme j'ai trouvé en faisant plusieurs test :
    Domaine :
    (?i)(?:[-\d\p{L}]{2,})(?:\.(?:CO|UK|COM)){2}\b

    FQDN:
    (?i)(?:[-\d\p{L}]{2,})\.(?:[-\d\p{L}]{2,})(?:\.(?:CO|UK|COM)){2}\b

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [RegEx] RegEx pour nom de domaine
    Par eric41 dans le forum Langage
    Réponses: 3
    Dernier message: 26/06/2017, 10h19
  2. [RegEx] Regex match domain
    Par zoners007 dans le forum Langage
    Réponses: 2
    Dernier message: 13/04/2017, 00h01
  3. Réponses: 3
    Dernier message: 30/11/2016, 08h48
  4. [RegEx] Aide regex nom de domaine
    Par Darkcristal dans le forum Langage
    Réponses: 4
    Dernier message: 08/06/2011, 18h08
  5. [RegEx] regex pour découvrir un domaine
    Par broule dans le forum Langage
    Réponses: 0
    Dernier message: 02/04/2010, 11h10

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo