Bonsoir,
je met actuellement en place un serveur de recherche Solr (full text).
L'algorithme de lexémisation français est celui proposé sur le site de Snowball.
Il est assez peu agressif et j'ai remarqué rapidement que tous les mots ne sont pas découpés jusqu'à leur racine.
Je recherche donc d'autres algorithmes tout écrit (on peut rêver) car c'est pas une mince affaire et je suis tout seul sur le projet.
Si ca existe pas j'essayerais d'en implémenter un.
Voila, si vous avez des pistes, merci d'avance.
Partager