IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Delphi Discussion :

Recherche de motifs non connus à l'avance et se répétant dans un texte


Sujet :

Langage Delphi

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Juillet 2003
    Messages
    152
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2003
    Messages : 152
    Points : 70
    Points
    70
    Par défaut Recherche de motifs non connus à l'avance et se répétant dans un texte
    Bonjour, je recherche un code ou un composant qui puisse permettre de rechercher des motifs se répétant un certain nombre de fois dans un texte donné.
    On a un texte T avec des lettres en majuscules sans ponctuation.
    On dispose pour chaque mot élémentaire (unique) constituant le texte, de sa longueur (len), de son nombre d'occurences (count) et de ses positions (array).
    On ne connait rien du motif ou des motifs se répétant.

    Comment rechercher EFFICACEMENT tous les motifs d'au moins x=20 caractères ou plus et se répétant au moins y=3 fois dans le texte ?

  2. #2
    Expert éminent sénior
    Avatar de ShaiLeTroll
    Homme Profil pro
    Développeur C++\Delphi
    Inscrit en
    Juillet 2006
    Messages
    13 709
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Développeur C++\Delphi
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juillet 2006
    Messages : 13 709
    Points : 25 592
    Points
    25 592
    Par défaut
    Tu devrais chercher dans les algorithme de détection de langue qui se base à la fois sur des répétions/fréquences de lettre et des statistiques.

    Et les avancés en linguistique avec l'IA ont amélioré ce genre de détection.

    Sur le forum, ici même en Delphi cherche Boyer-Moore et Knuth-Morris-Pratt mais je suppose que tu as déjà exploré ces pistes là avant de poser ta question, après tu as le text mining qui consiste a extraire des données, créer des arbres, naturellement ce genre d'algo vont compter/regrouper les occurrences d'un mot exacte voire des mots similaires (mesure de distance)

    Sinon tu aussi les algos de répétition d'ADN, curieusement on trouve ce genre de chose dans ce domaine.

  3. #3
    Membre régulier
    Profil pro
    Inscrit en
    Juillet 2003
    Messages
    152
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2003
    Messages : 152
    Points : 70
    Points
    70
    Par défaut
    En effet, une piste que j'explore est de créer des arbres.

Discussions similaires

  1. [Débutant] slider uicontrol min max value non connus à l'avance
    Par kerva29 dans le forum Interfaces Graphiques
    Réponses: 2
    Dernier message: 02/05/2013, 18h22
  2. Réponses: 2
    Dernier message: 20/05/2011, 17h29
  3. Réponses: 2
    Dernier message: 16/05/2006, 14h44
  4. typed des arguments et retour non connus
    Par will11 dans le forum C
    Réponses: 3
    Dernier message: 12/01/2006, 00h17
  5. Recherche de doublons "non strict"
    Par Oluha dans le forum Langage SQL
    Réponses: 2
    Dernier message: 10/01/2005, 10h21

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo