Bonjour
Qui pourrait m'indiquer comment faire pour repérer une bannière publicitaire dans le code source d'une page web?
Merci
Bonjour
Qui pourrait m'indiquer comment faire pour repérer une bannière publicitaire dans le code source d'une page web?
Merci
Tu peux pas
Tu peux faire des conjectures : google addsens, ou bien repérer des images de 600 px sur 100..... Mais tu ne sera jamais sûr du contenu !!!!!
C'est pour quel utilisation ?
BonjourEnvoyé par viviboss
On ne peut peut-être pas les repérer par le code source mais il doit bien y avoir un moyen de les repérer sur la page: impossible pas informatique ;-))
Car les inserts pub doivent bien figurer sous une forme ou une autre dans le code source. Et il doit bien y avoir des données à minima qui permettent de les positionner graphiquement ou de les relier à la régie ou l'annonceur qui les vends non?
Qu'en penses-tu?
A+
Tu pourrais éventuellement les répérer via les adresses des fichiers images/swf, mais ca inclut que tu connaisses les adresses de chacune des régies existantes autant dire que c'est impossible ... et puis comment tu fais pour les sites qui gèrent eux même leur pub ?Envoyé par murfodef
C'est déjà une piste intéressante ça! Référencer les régies pour les indexer et les repérer dans une page web ce n'est pas chose impossible. Google indexe bien le contenu de toutes les pages web du www ;-)) !!Envoyé par adrianu83
Pour les annonceurs en direct c'est vrai que c'est plus compliqué.
Mais est-ce que l'on ne pourrait pas également croiser cela avec un repérage de texte dans les images??
Malheureusement ce n'est pas possible d'extraire le texte d'une image ... le seul moyen de répérage que tu puisses avoir c'est au niveau des attributs des balises <a> et <img>Envoyé par murfodef
C'est à dire, tu peux préciser?Envoyé par adrianu83
A quoi correspondent ces balises?
Qu'est-ce que les attributs des balises <a> et <img>
Perso, je trouve cela très compliqué....
J'ai bossé sur un portail qui régissait lui même ses pubs, et les liens de comptages étaient perso.....
Cela dit, tu peut peut être miser sur le code PHP ou Javascript lié à l'image : en effet, dans la plupart des pubs tu as un compteur de clics, on peu donc faire la conjecture que dès que tu as un compteur de clic, tu as une pub......
Mais encore une fois, ce sont des conjectures !!!!(j'aime bien ce mot )
Alors, si tu regroupe : la detection d'images, les compteurs, les SWF, tu commence à avoir une ébauche générique d'un détecteur de pub.....
ajouté à ça une liste de scr ou un parsing du src */adbanner/* */adver/* ...
Ces hypothèses non étayées ou conjectures sont très inéressantes.Envoyé par viviboss
Cela crée un premier axe de travail.
Les compteurs de clics il y en a aussi sur les liens sponsoriés?
Et qu'est-ce que les SWF?
BonjourEnvoyé par SpaceFrog
JE vois que cela fourmille d'idées et de pistes
Mais peux-tu me dire ce que sont:
- une liste de scr
- un parsing du src */adbanner/* */adver/*
Cela m'éclairera grandement ... en ces temps couverts et nuageux
le scr est la source de l'image ...
il te suffirat de parser la source pour savoir si elle contient une suite de caractères typique et commune au bannières de pub ...
en ayant une liste de mots ou de path si le src fait partie de la liste c'est une pub ...
Comme cela a été dit plus haut, il faudrait analyser les valeurs des sources des fichiers et des liens afin de trouver un contenu suffisament pertinent pour définir qu'il s'agit bel et bien d'une pub et non pas d'un élément courant du site.Envoyé par murfodef
Je sais qu'il existe des extensions pour FF qui permettent de bloquer les pubs ... bien que ne sachant pas comment elles fonctionnent et ce qu'elles permettent de faire car je n'en ai jamais utilisées, ce serait bien de voir comment ces extensions traitent la chose (enfin peut être que ceci n'est que conjecture)
l'extension adblock de ffx fonctionne sur la base des src et parsant le path pour exclure des paths contenant une suite de caractères ... caractères jokers acceptés ...
Regarder du coté de FF est effectivement très instructif
Car ce que fait l'extension Adblock semble correspondre à ce que je recherche
Je vous tiens au courant de la suite de mes investigations en essayant de ne pas me perdre en "conjectures"
a+
Partager