IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

Mesurer la longueur d'une chaine de caractères entre 2 balises


Sujet :

Langage Perl

  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Octobre 2010
    Messages
    5
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2010
    Messages : 5
    Points : 5
    Points
    5
    Par défaut Mesurer la longueur d'une chaine de caractères entre 2 balises
    Bonjour à tous
    C'est mon premier message sur ce forum. Donc je vais me présenter rapidement: je m'appelle Yonathan, je suis thésard en biologie moléculaire, et je débute en programmation.

    Je m'adresse à vous car j'ai besoin d'un coup de main pour écrire un script perl.
    Comme indiqué ci-dessus, je débute. J'ai le camel-book à coté de moi, mais je dois avouer que je m'y perd un peu.

    Voici mon problème.
    Je dispose d'un fichier texte contenant ceci:

    >moi_toto_grand_et_beau
    ATGCTAGTCGATGCTGATCGTA
    ATGGTAGTGCGCCGATGCGTCA
    TGAGTCC

    >moi_john_petit_et_moche
    ATGCTGTAGTCGTACTTGAT
    TGACTAGCCATCACTACGTC
    TGCATACGGATGT


    Je ne marque que 2 "séquences", mais il y en a plusieurs milliers.

    J'essaye de faire un script qui soit capable de compter le nombre de caractères compris entre la fin de la 1ere ligne et la fin de la séquence, et d'ajouter cette valeur à la premiere ligne (sous la forme length=X)

    Pour plus de clarté, le fichier final ressemblerait à ca:

    >moi_toto_grand_et_beau length=51
    ATGCTAGTCGATGCTGATCGTA
    ATGGTAGTGCGCCGATGCGTCA
    TGAGTCC

    >moi_john_petit_et_moche length=53
    ATGCTGTAGTCGTACTTGAT
    TGACTAGCCATCACTACGTC
    TGCATACGGATGT


    J'ai compris qu'il existe une fonction "LENGTH" dans perl, pour mesurer une chaine de caractère, mais je ne comprend pas comment dire au script de ne compter qu'entre mes 2 balises

    J'espère que l'un de vous pourra m'aider

    Merci d'avance pour vos réponses

  2. #2
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    L'algorithme classique que je donne est le suivant :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    use List::Util qw(sum);
     
    @seq = ();
    while (<>) {
      chomp;
     # fin d'une séquence la précédente
      if (/^>/ && @seq) {
        # Mettre à jour la balise avec la taille de la séquence
        print_seq(@seq);
        @seq = ();
      }
      push @seq, $_;
    }
    print_seq(@seq) if @seq;
     
    sub print_seq {
      my @seq = @_;
     
      $seq[0] .= "=".sum(map length, @seq[1..$#seq]);
      print map "$_\n", @seq;
    }
    Par contre, ta première séquence fait 51 nucléotides, pas 49.

  3. #3
    Futur Membre du Club
    Profil pro
    Inscrit en
    Octobre 2010
    Messages
    5
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2010
    Messages : 5
    Points : 5
    Points
    5
    Par défaut
    Un énorme merci à toi Philou67430

    Ton script marche vraiment du tonnerre! J'ai juste fait une modif pour qu'il rajoute "length=Xx" au lieu de "=Xx", et pour sauvegarder le résultat du script dans un fichier.

    Je reste béat d'admiration envers les gens capables de coder comme tu le fais (j'ai beau savoir que ca s'apprend, ca me bluffe a chaque fois).

    Merci mille fois!

    PS: en effet il y a 51 nucléotides, c'est corrigé

  4. #4
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    En même temps, c'est mon métier... et je peux t'assurer que je suis bluffé par tous ces chercheurs qui manipulent les gênes comme toi

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Supprimer une chaine de caractères entre 2 balises
    Par wolfatthedoor dans le forum Langage
    Réponses: 5
    Dernier message: 02/04/2014, 10h33
  2. Réponses: 7
    Dernier message: 27/11/2010, 18h10
  3. vérification de la longueur d'une chaine de caractère
    Par midodido123 dans le forum Développement de jobs
    Réponses: 3
    Dernier message: 04/08/2009, 10h24
  4. Véritable longueur d'une chaine de caractères
    Par danyII dans le forum Langage
    Réponses: 5
    Dernier message: 18/03/2008, 09h36
  5. [TRANSACT SQL] longueur d'une chaine de caractères
    Par Cyborg289 dans le forum MS SQL Server
    Réponses: 2
    Dernier message: 20/03/2007, 08h06

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo