Bonjour,

Voici le problème :
- on a déjà un couple d'analyseurs lexer.l et parser.y pour analyser le code du fichier d'entrée, via les tokens, directement pour le compilateur;
- on souhaite en plus capturer le texte de ce même code par une 2e analyse lexicale et syntaxique (entre autres de façon à retirer les commentaires), pour finalement récupérer ce listing dans une documentation automatisée.

A priori, je vois au moins deux façon de faire :
1) compléter les analyseurs existants, par exemple en concaténant chaque token (fastidieux), ou bien en rappelant une analyse simplifiée à partir du début du fichier d'entrée (avec yyrestart() ou yywrap()?);
2) programmer un nouveau couple d'analyseurs distincts (avec un nouveau préfixe), qui se contenterait de retirer les commentaires et de concaténer le reste (en gros), pour appeler par exemple une fonction lst_parse(). Mais j'ai lu qu'on utilise cette solution plutôt quand on doit lire des langages différents...

Est-ce que quelqu'un a déjà eu une expérience de ce type?
Il y a-t-il d'autres solutions? plus simples?
Sinon, laquelle me conseilleriez-vous?

Merci d'avance