IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

Filtrage des emails


Sujet :

Intelligence artificielle

  1. #1
    Membre du Club
    Inscrit en
    Juillet 2008
    Messages
    128
    Détails du profil
    Informations forums :
    Inscription : Juillet 2008
    Messages : 128
    Points : 53
    Points
    53
    Par défaut Filtrage des emails
    Bonsoir,

    j'ai besoin de quelques clarifications sur le sujet du filtrage des emails:
    - je dois écrire un programme qui reçoit en entrée un échantillon d'emails et fait la classification, selon le contenu texte de ces emails, en mails spam ou non-spam.
    il s'agit ici d'un apprentissage supervisé.
    j'ai la classe Java StringToKenizer(...) qui permet de décomposer une chaîne de caractères en une suite de "mots" séparés par des "délimiteurs".
    cette classe va me permettre d'avoir le contenu textuel des mes emails classifiés en un ensemble de mots. reste à analyser le contenu selon un ensemble de mots que j'identifie auparavant en tant que critère de classification.
    j'ai un problème ici:
    1) quels sont les mots qui me permettent de définir un mail comme spam? est-ce que je dois procéder pour les définir par une lecture de mes spams et dégager arbitrairement un ensemble de mots, ou est-ce qu'il existe une fonction qui le fait automatiquement?

  2. #2
    Membre régulier
    Inscrit en
    Janvier 2006
    Messages
    288
    Détails du profil
    Informations forums :
    Inscription : Janvier 2006
    Messages : 288
    Points : 113
    Points
    113
    Par défaut
    Bonjour,

    Vu de cet angle, il me semble qu'il faudrait créer une sorte de dictionnaire permettant d'identifier un spam.

  3. #3
    Membre actif
    Inscrit en
    Mars 2008
    Messages
    209
    Détails du profil
    Informations forums :
    Inscription : Mars 2008
    Messages : 209
    Points : 227
    Points
    227
    Par défaut
    pas besoin de dictionnaire !!! il suffit de créer un crible bayésien qui calculera suivant le contenu du mail la probabilité que ça soit un Spam.

Discussions similaires

  1. Filtrage des emails: serveur
    Par ksdev dans le forum Réseau
    Réponses: 1
    Dernier message: 02/06/2006, 15h06
  2. Script envoyant des emails
    Par pl14 dans le forum Réseau/Web
    Réponses: 10
    Dernier message: 03/05/2006, 17h27
  3. Normalisation du contenu des emails ?
    Par Lachessis dans le forum E-Mailing
    Réponses: 5
    Dernier message: 08/06/2005, 13h35
  4. Réponses: 13
    Dernier message: 08/03/2004, 22h32
  5. Problèmes avec le filtrage des ip
    Par berry dans le forum Réseau
    Réponses: 9
    Dernier message: 30/12/2002, 08h51

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo