Bonjour à tous,
Je suis post doctorant en microbiologie et pour un de mes projets j'ai trouvé une page (http://www.ncbi.nlm.nih.gov/nuccore/...918823_gene_25) sur laquelle j'aimerais extraire les noms des gènes appelés ici xxx (/gene="xxx") dans un fichier puis leur associer une fonction.
Ayant déjà utilisé un peu R auparavant pour des stats et des représentations graphiques, je voulais faire un script pour l'extraction des motifs qui m'intéressent. En voici le début :
Cependant je n'arrive pas à récupérer spécifiquement le motif qu'il y a derrière "/gene="
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 URL <- "http://www.ncbi.nlm.nih.gov/nuccore/AP001918.1#feature_8918823_gene_25" genes <- read.delim(URL) genes <- as.character(genes[,1]) these <- grep("/gene=", genes)
Est ce quelqu'un à des pistes à me donner ?
Merci pour votre aide
Partager