Problème avec les expression régulières

**Dominique49** · 09/12/2011, 15h57

Bonjour, voici donc mon problème :
je dois décortiqué par exemple ce code html :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
<div class="download_file_name"> titre du fichier.zip </div>
                    <div class="fm_files_icon_avi"></div>
                    <div class="download_file_size"> 202.57 MB </div>

en fait, c'est le code produit par megaupload, car je cherche à récupérer le titre d'un fichier à partir de l'url.

donc j'ai fais ce script :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
String result = Framework.fileGetContents("http://www.megaupload.com?d=xxxxxx");
		if(result.matches(".*<div class=\"na_text\"> Invalid link </div>.*")){
			System.out.println("lien invalide");	
		}else{
			if(!result.matches(".*www\\.megaupload\\.com/\\?c=msg.*")){
				filename = result.replaceFirst(".*<div class=\"download_file_name\">(.+)</div><div class=\"fm.*", "$1");
				System.out.println(filename);
			}else{
				System.out.println("Nb de requête max atteint !");
				System.exit(0);
			}
		}

seulement ça me donne ceci :

titre du fichier .zip ... et tout le reste du code derrière ... </html>
bon alors je connais le pb, du moins en PHP, pour éviter ça on met la regex en "mode économique" grâce à une option.

En fait, il faut lui dire de s'arrêter au premier masque trouvé !
mais je n'arrive pas à trouver comment faire en java ... (je suis très mauvais dans les regex en java

)

au passage, je me demande si ce n'est pas un peu du bricolé ma manière de vérifier la validité d'une url mega upload ...
mais je ne vois pas comment faire d'autre.
d'ailleurs megaupload a changer de design il y a peu et jdownloader à immédiatement publié une nouvelle version, sans doute parce que jdownloader utilise la même technique ...

merci d'avance.

**LittleBean** · 09/12/2011, 17h24

Salut,

J'ai suis pas sur d'avoir saisi ce que tu veux faire mais

Pour

récupérer le titre d'un fichier

Tu peux faire comme ça (il faut ajouter 2/3 tests de nullité en plus)

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
 
 
import java.util.regex.Matcher;
import java.util.regex.Pattern;
 
 
public class Test {
 
	public static void main(String[] args) {
		String test ="<div class=\"download_file_name\"> titre du fichier.zip </div>";
		Pattern pattern = Pattern.compile(">(.*).zip");
		Matcher matcher = pattern.matcher(test);
		System.out.println(matcher.find());
		String group = matcher.group();
		System.out.println(group);
		String substring = group.substring(1, group.length()-4);
		System.out.println(substring);
	}
}

**thelvin** · 09/12/2011, 17h29

Ou alors simplement utiliser l'opérateur +? qui est la version reluctant de l'opérateur greedy +

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

(.+?)

**Dominique49** · 09/12/2011, 18h52

merci beaucoup ...
pour la première réponse, je ne comprends pas parce que je ne connais pas, mais je vais me renseigner. Pour la deuxième c'est exactement ce que je cherchais ... donc merci beaucoup !

Problème avec les expression régulières

avec Java

Discussions similaires

Partager

Partager