Salut;
je cherche une méthode pour parser un fichier HTML et récupérer le contenu d'une balise particulière en utilisant c++, avez vous une idée, svp.
merci
Salut;
je cherche une méthode pour parser un fichier HTML et récupérer le contenu d'une balise particulière en utilisant c++, avez vous une idée, svp.
merci
Salut,
Tu récupères chaque lignes de ton fichier dans une string, et là tu recherche ta balise dans ta string avec une fonction de recherche dans les string ( comme find par exemple ), et quand tu trouves ta balise, tu sais que ton info est juste après...
Infos sur les fonctions de traitement des strings : ici
Amuses toi bien...
Bonsoir.
Si ton fichier d'entrée est écrit en XHTML plutôt qu'en HTML, tu peux utiliser une bibliothèque d'analyse du XML.
- libxml2 (en C) ;
- libxml++ ;
- TinyXml...
les balises que je cherche contient beaucoup de bla bla des dizaines de ligne, donc la solution de parcer chaque ligne ne suffira pas, mon fichier est programmé avec HTML simple.
je ne sais pas si les expressions réguliers dans C++ sont les même que Qt, si oui, comment dire a mon programme de m'afficher le résultat d'un expression régulier.
par exemple afficher tous ce qui est entre <td>(.*) </td>
merci
Salut,
Pour les expressions régulières, il n'y a pas de façon de faire en C++ ou Qt : il faut simplement utiliser une bibliothèque de regex.
La nouvelle norme (C++11) inclut les regex dans la bibliothèque standard, mais celles-ci ne sont pas encore implémentés dans les compilateurs (en tout cas, pas dans GCC, pour Visual Studio je ne sais pas).
La meilleure solution serait donc d'utiliser la bibliothèque Boost.Regex (http://www.boost.org/doc/libs/1_48_0...tml/index.html) sur laquelle sont basé les regex en C++11.
et je peux trouver une solution avec Visual studio C++?, c-a-d extraction d'une balise spécifique d'un fichier HTML
merci
Si tu es sous visual studio, les regex sont implémentées depuis quelques versions déjà (de mémoire, depuis la 2008SP1 dans le namespace std::tr1, et en 2010 dans std).
Tu peux peut-être lire http://blog.emmanueldeloget.com/inde...s-rationnelles pour voir comment les utiliser.
Vous avez un bloqueur de publicités installé.
Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.
Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.
Partager