IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

PostgreSQL Discussion :

caractères accentués avec Tsearch2


Sujet :

PostgreSQL

  1. #1
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Mai 2005
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2005
    Messages : 2
    Points : 1
    Points
    1
    Par défaut caractères accentués avec Tsearch2
    Bonjour,

    J'ai tenté d'installer le module T-search 2 de PostgreSQL avec le dictionnaire français mais je rencontre un problème avec les mots accentués. Je voudrais que "lycée" et "lycee" ("société"-"societe", "accentué"-"accentue"...) soit considéré comme étant le même mot, qu'il n'y ait pas de distinction. Ceci permettrait d'avoir des résultats pertinents, y compris pour les personnes qui ne tapent pas les caratères accentués.


    Ma configuration est la suivante :

    - dans la table pg_ts_dict :

    dict_name
    fr_ispell
    dict_initoption
    Dict_File=/usr/share/dict/french.dict,AffFile=/usr/lib/ispell/french.aff,StopFile=/usr/share/postgresql/contrib/french.stop

    french.dict contient des lignes du genre (S précise que c'est un mot singulier, F précise que c'est un mot féminin) :
    lycopode/S
    lycose/S
    lycra
    lycène/S
    lycée/S
    lycéenne/F
    lyddite/S

    french.aff permet de décoder les mots

    french.stop contient des petits mots non inclus dans la recherche (le, la, les...)


    - dans la table pg_ts_cfg :

    ts_name prs_name locale
    fr default fr_FR


    - dans la table pg_ts_cfgmap
    ts_name tok_alias dict_name
    fr email {simple}
    fr file {simple}
    fr float {simple}
    fr host {simple}
    fr hword {fr_ispell,simple}
    fr int {simple}
    fr lhword {fr_ispell,simple}
    fr lpart_hword {fr_ispell,simple}
    fr lword {fr_ispell,simple}
    fr nlhword {fr_ispell,simple}
    fr nlpart_hword {fr_ispell,simple}
    fr nlword {fr_ispell,simple}
    fr part_hword {simple}
    fr sfloat {simple}
    fr uint {simple}
    fr uri {simple}
    fr url {simple}
    fr version {simple}
    fr word {fr_ispell,simple}


    J'ai ensuite une table t_avis, qui contient un champ avis et un vecteur de cet avis, renseigné avec :
    update t_avis set vectors=to_tsvector('fr',avis).
    C'est donc sur cette table que survient mon problème.

    Ma question est donc : est-il possible que, lorsqu'une personne tape "lycee", on recherche dans le champ vectors comme si la personne avait tapé "lycée" ? Ou inversement, on recherche "lycee" dans le vecteur qui au préalable contient des mots non accentués.


    Merci beaucoup pour votre aide.

  2. #2
    Membre averti

    Homme Profil pro
    Inscrit en
    Janvier 2005
    Messages
    338
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France

    Informations forums :
    Inscription : Janvier 2005
    Messages : 338
    Points : 404
    Points
    404
    Par défaut
    La fonction to_ascii(text [, codage]) doit pouvoir servir sauf sur une base en Unicode

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
     ... to_ascii('lycée','LATIN1')
    KrysKool

  3. #3
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Mai 2005
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2005
    Messages : 2
    Points : 1
    Points
    1
    Par défaut
    Si j'utilise cette fonction, le mot "lycee" n'est plus considéré comme un mot du dictionnaire T-search. Du coup, si je tape "lycee" dans ma recherche, il va trouver. Mais si j'écris "lycée" ou "lycées", je n'aurai pas de réponses.

Discussions similaires

  1. [AJAX] Caractères accentués avec Ajax
    Par julieng31 dans le forum AJAX
    Réponses: 12
    Dernier message: 25/08/2009, 00h14
  2. pb caractères accentués avec la fonction raw_input et la fenêtre OS
    Par bourgui78 dans le forum Général Python
    Réponses: 2
    Dernier message: 27/08/2008, 13h31
  3. [Configuration] Caractères accentués avec SVN
    Par gcolmetdaage dans le forum EDI, CMS, Outils, Scripts et API
    Réponses: 5
    Dernier message: 11/09/2007, 10h04
  4. Caractères accentués avec <html:link>
    Par papysam dans le forum Struts 1
    Réponses: 5
    Dernier message: 25/05/2007, 15h18
  5. Problème de caractères accentués avec CAM::DBF
    Par ustilago dans le forum Modules
    Réponses: 4
    Dernier message: 23/06/2006, 08h46

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo