IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SQL Procédural MySQL Discussion :

indexation fulltext des mots avec un trait d'union


Sujet :

SQL Procédural MySQL

  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Septembre 2005
    Messages
    5
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2005
    Messages : 5
    Points : 6
    Points
    6
    Par défaut indexation fulltext des mots avec un trait d'union
    J'ai un problème pour l'indexation fulltext en MySQL des mots comportant un trait d'union ("hyphen" en anglais) tels que "science-fiction". L'indexation se fait comme s'il s'agissait de 2 mots distincts (dans l'exemple il va indexer "science" et "fiction" séparément). Ce n'est pas ce que je souhaite. Je voudrais que "science-fiction" soit indexé comme un seul mot.
    Savez-vous s'il y a une façon propre d'obtenir cela ? J'ai bien une solution "sale" sous la main qui consisterait à remplacer dans la base les tirets par une chaine du style "$&$" et à faire la rétroconversion à l'affichage. Mais s'il existe une solution propre, je préfèrerais.

    Edit : la seule info que j'ai pu trouver sur ce sujet est un commentaire sur la page http://dev.mysql.com/doc/refman/5.0/...xt-search.html :

    Posted by Dyfed Lloyd Evans on October 21 2002 12:39am

    Hyphen '-' characters break literals at the moment.
    A search for something like "GATA-D22S690" finds
    all entries containing GATA and not the full
    hyphenated text. The '-' character is treated as a
    word stop even within literals. The same is true if
    any of the special text search modifiers are used (eg
    +, -, ~) so that hyphenated literals are not correctly
    found with full text searches.
    ce post date du 21 octobre 2002. Il semble que ça n'a pas évolué depuis.

  2. #2
    Futur Membre du Club
    Profil pro
    Inscrit en
    Septembre 2005
    Messages
    5
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2005
    Messages : 5
    Points : 6
    Points
    6
    Par défaut
    j'ai trouvé cette page qui en dit un plus sur le sujet et parle de 2 solutions possibles :

    [11 Dec 2003 10:43] Sergei Golubchik
    If you can rebuild mysqld, you can the desired behaviour fairy easily. In
    the myisam/ftdefs.h file there is

    #define HYPHEN_IS_DELIM

    you need to comment it out.
    Pour ma part, je suis en hébergement mutualisé et cette solution est exclue.

    [15 Sep 2006 21:17] Sergei Golubchik

    There is another workaround. It was recently added to the manual:
    "
    Modify a character set file: This requires no recompilation. The
    true_word_char() macro uses a “character type” table to distinguish letters
    and numbers from other characters. . You can edit the <ctype><map> contents in
    one of the character set XML files to specify that '-' is a “letter.” Then
    use the given character set for your FULLTEXT indexes.
    "
    Là je ne comprends pas quel est le fichier à éditer. J'imagine que de toute façon je n'ai pas non plus la possibilité de faire cela en hébergement mutualisé.

  3. #3
    Membre éprouvé
    Avatar de Sivrît
    Profil pro
    Inscrit en
    Février 2006
    Messages
    953
    Détails du profil
    Informations personnelles :
    Âge : 43
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Février 2006
    Messages : 953
    Points : 1 249
    Points
    1 249
    Par défaut
    Probablement "mysql5\share\charsets\qqc.xml", mais effectivement en mutualisé c'est pas gagné.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [RegEx] Trouver des mots entre des mots avec le Regex seulement
    Par mutkas10 dans le forum Langage
    Réponses: 3
    Dernier message: 16/01/2013, 11h48
  2. REGEX - Repérer des mots avec des lettres accentuées
    Par rambc dans le forum Général Python
    Réponses: 2
    Dernier message: 16/07/2011, 16h33
  3. souligné un mot avec un trait personnalisé
    Par bracket dans le forum Qt
    Réponses: 0
    Dernier message: 02/01/2010, 16h20
  4. Réponses: 2
    Dernier message: 09/09/2008, 23h03
  5. [VBA-A]Amusons nous un peu avec des mots.
    Par Miss Ti dans le forum Access
    Réponses: 6
    Dernier message: 24/07/2006, 22h13

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo