Re bonjour à tout le monde,
j'ai un fichier multifasta et je veux récupérer le tout pour l'insérer dans ma base de données et notamment la table transcript!
Ce fichier contient l'identifiant et la description du transcrit suivi de sa séquence! (il ya à peu près 35000 transcrits dans ce fichier).
Donc je voudrais un peu d'aide pour écrire un script pour pouvoir récupérer l'identifiant dans le champs identifiant, la description dans le champs description, et la séquence dans le champs séquence! Pour vs donner une petite idée du fichier fasta, voilà un exemple de son contenu pour un trancrit :
Merci
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19 >gi|124249439|ref|NM_001080875.1| Gallus gallus succinate dehydrogenase Ip (SDHB), mRNA AATTCCACTAGTTACGCGACCCCCGGAACCCAAAGACTTGGGTTTCCCGGGAGCTGCCCCGGTACGGCTC ATGAGTGGAGGACGTCATCAGCGGTGATGATTACTCGAATGGGGGATTCTATGGGGATTACAATGCGATG GTCGACCAAAATGGCGGCGGCCGTGGTGGGAGTCTCCTTGAGGCGCGGCGTCCCCGCGCGGTTCCTGAGG GCTGGGCTGCGGCCGGTGAGGGGACTGGAGGCGGTCCACGGGATCTGTCGAGGAGCTCAGACGGCGGCTG CAGCTACATCACGTATCAAGAAGTTTTCCATCTACAGATGGGATCCTGATAAGCCTGGGGACAAGCCCCG CATGCAGACCTATGAAGTGGATTTAAATAAATGTGGGCCTATGGTACTTGATGCTCTGATTAAGATTAAA AACGAGTTGGACTCCACTCTGACCTTCCGCAGGTCATGCAGGGAAGGCATCTGTGGCTCCTGTGCAATGA ACATTGCTGGTGGAAACACCCTGGCTTGTACTAAAAAAATTGACCCTGATCTCAGCAAGACCACTAAAAT CTACCCTCTCCCCCACATGTATGTGGTGAAGGATCTCGTTCCAGACTTGAGTAACTTCTACGCACAGTAC AAATCCATCGAGCCTTACCTGAAGAAGAAGGACGAGTCGAAACAGGGCAAGGAGCAGTACTTGCAATCCA TAGAAGACCGTCAGAAACTGGACGGACTCTATGAGTGCATCCTCTGTGCCTGCTGCAGCACCAGCTGTCC CAGTTACTGGTGGAATGGGGACAAGTACTTGGGTCCTGCTGTACTCATGCAGGCCTATCGCTGGATGATC GACTCCAGAGATGACTACACAGAGGAACGCCTGGCACAACTTCAAGACCCATTTTCTCTCTACCGTTGTC ACACTATCATGAACTGCACAAGGACTTGCCCAAAGGGTTTGAACCCTGGCAAAGCAATTGCTGAGATCAA GAAGATGATGGCAACTTACAAAGAGAAGGCAGCCGCTGCATAATGCTGTTCCCCGACTGGAAATGTAACA CACAAACATGCTTTACCTGGAAGTAACCTGCACTTGATTACACCTGGTTCCAGCAGGAATGTTGGTGTTT TTCCCATATGCTTGTGTGTACAATAAATGCTGTAAAGAACAAAAAAAA
Partager