IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

FMOD Discussion :

Reconnaissance vocale ?


Sujet :

FMOD

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Octobre 2007
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 20
    Points : 10
    Points
    10
    Par défaut Reconnaissance vocale ?
    Bonjour à tous !!!

    Voila, j'ai un petit souci :
    Je voudrais faire un logicel qui intègre la reconnaissance vocale et je me demandais si avec fmod on pouvait faire ca , si oui , de quelle manière ???
    De plus , j'ai vu à différentes reprises sur des forum du net qu'il fallais obtenir
    la fréquence de la voix que l'on enregistre .mais je ne sais pas comment on récupère cette fréquence . Est-ce possible avec fmod ???

    Merci d'avance à tous.

  2. #2
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Novembre 2006
    Messages
    46
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2006
    Messages : 46
    Points : 31
    Points
    31
    Par défaut récupérer la fréquence
    Salut!

    Bon, alors pour récupérer la fréquence, tu utilise une fonction qui s'apelle "getSpectrum" et qui prend en paramètre
    - un pointeur sur le tableau qui contiendra les fréquences
    - la précision de la fft (multiple de 2: 64 à 65536 pour fmod je crois)
    - le canal (0 pour gauche, 1 pour droit)
    - le type de fenêtre à appliquer pour l'analyse (blackman, huffman.....)

    Il y a peut-être quelques subtilités si tu fais l'analyse en temps réel sur un signal provenant du micro par exemple, mais je pense que ça concernera surtout l'initialisation de fmod.

    Par contre faire de la reconnaissance vocale ce n'est pas seulement récupérer une fréquence, il va falloir que tu fasse une analyse très poussée du signal pour en obtenir quelque chose de cohérent.

    Bon courage!

    PS: tu codes avec quel langage? si c'est du C# et fmod ex je pourrais même te passer un exemple de code

  3. #3
    Membre à l'essai
    Profil pro
    Inscrit en
    Octobre 2007
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 20
    Points : 10
    Points
    10
    Par défaut
    Bonjour , Tout d'abord merci de ta réponse .


    Je code en C sous windows . Pourais-tu me donner d'avantage d'informations s'il te plait (je débute dans le domaine de la reconnaissance):

    1 : que signifie : "la précision de la fft (multiple de 2: 64 à 65536 pour fmod)"
    2 : que signifie : "le type de fenêtre à appliquer pour l'analyse (blackman, huffman.....)"

    3 : Comment récupérer d'avantage d'ifo sur le son enregistré avec fmod

    4 : Je sais que ca n'a pas de rapport avec la reconnaissance vocale mais existe-t-il une fonction qui permet de modifier le son émis par la voie avec fmod (ex : voie plus grave , plus aigue sans influer sur la vittesse du redement final comme SetFrequency())


    Merci .

  4. #4
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Novembre 2006
    Messages
    46
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2006
    Messages : 46
    Points : 31
    Points
    31
    Par défaut quelques réponses
    re, désolé ça fait un moment que je suis pas allé sur le site, d'où le temps de réponse.

    Je vais commencer par la fft (au cas où tu verrais pas ce que c'est, même si je pense que tu dois le savoir): c'est une optimisation de la fonction discrète de fourrier. Cette fonction permet de décrire n'importe quel signal (son ou autre) en tant que somme de sinus et de cosinus.
    Lorsque tu applique une fft sur un signal (donc sur un tableau contenant les amplitudes d'un signal en fonction du temps dans le context info), tu obtiens un autre tableau qui contiendra une série d'amplitudes de fréquences.

    1. la précision de la fft: plus la précision est élevée, plus tu auras de d'amplitudes de fréquences dans le tableau de retour. Si tu demandes une fft avec une précision de 64 par exemple, tu obtiendras un tableau avec 64 valeurs correspondant aux amplitudes de 64 fréquences de ton signal.
    Autre chose encore, pour savoir à quelle fréquence correspond quelle case du tableau, tu devra utiliser cette formule:

    (Freq_échantillonage / 2) / (précision_fft - i)

    où i est la case du tableau que tu veux lire.

    2. Lorsque tu fais une analyse de fourrier, tu peux risque d'obtenir des valeurs pas très justes aux extrémités (dans les graves et les aigus). Je ne vais pas rentrer dans les détails du pourquoi, mais du coup il faut compenser cette imprécision. Pour compenser tu utilise ce qu'on apelle une fenêtre.
    Une fenêtre est une fonction mathématique qui "lisse" les bords de la fft pour compenser l'imprécision. Il y a différents types de fenêtres (qui ont leurs avantages et inconvénients) permettant de faire ça, dont Blackman & Harris, Huffman....

    3. Que veux-tu dire par davantage d'infos? quelles infos particulières tu cherches à récupérer?

    4. Si je me souviens bien, ffmod donne des fonctions de filtrage du signal (filtre pass-bande je crois, égaliseur de fréquences peut-être), tu peux jouer avec ça pour changer le timbre de la voix. Par contre si tu veux baisser le ton de la voie, c'est-à-dire en quelque sortes la "note" de la voix, il va falloir que tu crée un algorithme, et là pour que ça rende quelque chose de bien sans demander trop de puissance, ça peut être compliqué.

    Voilà, j'espère que ça aura éclaircit quelques points d'ombre.

    à bientôt!

Discussions similaires

  1. probleme avec la reconnaissance vocal de Ms agent.
    Par maxoudu328 dans le forum Langage
    Réponses: 7
    Dernier message: 03/05/2006, 23h42
  2. Recherche de moteurs de reconnaissance vocale
    Par Raylemon dans le forum Composants VCL
    Réponses: 1
    Dernier message: 17/08/2005, 17h00
  3. [C#] [WinForms] Reconnaissance vocale ?
    Par vandeyy dans le forum Windows Forms
    Réponses: 3
    Dernier message: 29/11/2004, 14h30
  4. Réponses: 8
    Dernier message: 05/10/2004, 00h02
  5. Logiciel professionnel de reconnaissance vocale
    Par samyl dans le forum Applications et environnements graphiques
    Réponses: 2
    Dernier message: 01/04/2004, 14h11

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo