Difficultés sur un exercice

**myriam19** · 15/05/2015, 14h21

Bonjour à tous

Je suis en première année de master linguistique appliquée aux sciences et technologies de l'information et de la communication. J'ai commencé à travailler sur le langage python ce semestre. Notre professeur nous a demandé de créer un programme qui déterminera toute notre moyenne finale.
Mais ça fait des jours que je suis dessus et que je n'y arrive vraiment pas. Si quelqu'un peut m'aider ça serait vraiment cool je suis désespérée ...

Alors, voila l'exercice :
C'est un fichier plein de phrases comme ceci dont l'ordre des éléments varient :
Exemple :

Culture.txt|5|c'est-à-dire|En effet, le gouvernement a annoncé <NP1>l'extension de la convention collective</NP1> pour le 1er juillet - <MDR>c'est-à-dire</MDR> <NP2 rel_lex="syn(extension/application à l'ensemble de)" modif_lex="remplacement(la convention collective/son)" rel_pragm="prec">son application à l'ensemble de la profession</NP2>

et elle veut qu'on transfère le tout dans un autre fichier en remplaçant certaines choses :

Culture.txt|5|c'est-à-dire|l'extension de la convention collective/son application à l'ensemble de la profession|NP1/NP2(contenu des balises)|5/7(nombre de mots avant le slach/ nombre de mots après le slach)

J'ai trouvé comment supprimé les balises : re.sub('\<\/?[A-Z0-9]+\>'," ",texte)
Comment écrire aussi dans l'autre fichier en remplaçant : fi.write(re.sub(chaine2," ",chaine))
Mais le soucis, c'est que je ne voit pas comment réussir à effacer le texte avant la balise sans effacer celui en début de ligne étant donné que ce n'est que du texte qu'il n'y a rien qui le différencie. Je me suis demandé si on pouvait mémoriser des endroits de l'expression mais je ne trouve rien sur internet je ne comprends pas la syntaxe à mettre en place. Puis pour extraire les contenu des balises tout en comptant le nombre de mots de chaque contenu je ne vois vraiment pas.

Please help me :'(

**papyfouette** · 15/05/2015, 14h57

Bonjour à toi,

Afin de t'aider et donc de ne pas faire ton travail, pourrais-tu mettre le code que tu as fait ?

Pour le mettre, le bouton <#> de la barre d'outil te sera d'une grande aide.

On demande à voir les codes, car c'est plus facile pour t'aider, que de deviner

si c'est pour une question de confidentialité, tu n'es pas obligée de mettre l'intégralité de ton code, juste les parties sur lesquels tu as du mal ainsi que les erreurs éventuelles que te retourne ton programme.

**myriam19** · 16/05/2015, 00h29

Merci, de m'avoir répondu

J'ai décortiqué mon exercice étape par étape :

- là je travaille sur l'étape de la suppression de certains éléments de la phrase. voici le code :

import re

texte="Culture.txt|5|cest-à-dire|En effet, le gouvernement a annoncé <NP1>lextension de la convention collective</NP1>"

re.sub('([A-Za-z]+\.(txt))(\|[0-9]+\|)([a-zà\-]+\|)([a-z]+)(\<[A-Z0-9]+\>)([.+])(\>)','\\1\\2\\3\\6',texte)

Résultat : 'Culture.txt|5|cest-à-dire|En effet, le gouvernement a annoncé <NP1>lextension de la convention collective</NP1>'

J'ai essayé de diviser mon texte en plusieurs éléments pour en mémoriser certains mais le résultat est le même si je ne leur fait pas appel. Je ne vois pas ou est le problème ..

**papyfouette** · 16/05/2015, 01h36

Bonsoir,

Je suis désolé, mais je ne comprend pas du tout ou vaguement ce que vous voulez, il va falloir être plus clair ^^"

Je pourrais avoir la phrase exacte ?

**myriam19** · 16/05/2015, 01h43

Phrase de départ : Culture.txt|5|c'est-à-dire|En effet, le gouvernement a annoncé <NP1>l'extension de la convention collective</NP1> pour le 1er juillet - <MDR>c'est-à-dire</MDR> <NP2 rel_lex="syn(extension/application à l'ensemble de)" modif_lex="remplacement(la convention collective/son)" rel_pragm="prec">son application à l'ensemble de la profession</NP2>

Résultat attendue : Culture.txt|5|c'est-à-dire|l'extension de la convention collective/son application à l'ensemble de la profession|NP1/NP2(contenu des balises)|5/7(nombre de mots avant le slach/ nombre de mots après le slach)

Je souhaite garde le début le phrase: Culture.txt|5|c'est-à-dire|, supprimer le texte autour des balises tout en supprimant les balises, puis extraire le contenu des balises : NP1/NP2 les ajouter à la suite, puis ajouter aussi le nombre de mot contenu dans les balises.

Je pensais que re.sub était la solution pour faire des remplacements.

C'est pour cela que dans mon message précédent j'ai testé d'abord sur un bout de la phrase mais ça ne me donne aucun résultat..

Vous comprenez ?

Difficultés sur un exercice

Python

Discussions similaires

Partager

Partager