Bonjour à tous
J'aimerai donner une voix à une IA, mais une voie réellement synthétique, c'est à dire utilisant par exemple le bruit blanc pour vocaliser le "F" (donc sans volumineuses bibliothèques de fichier audio à stocker, juste des bibliothèques de description de courbes). En effet j'ai la nostalgie des premières voies de robots et l'IA est hébergée sur système embarqué donc limité en ressources.
J'envisage au départ de faire "vivre" l'IA dans un Raspberry Pi sous Raspbian (Debian version ARM), avec un DAC, un ampli et un haut-parleur tout autant miniaturisés (pour la partie voix).
Pour remplir la mission, voici les différentes étapes nécessaires :
- Obtention de courbes qui génèrent des sons ressemblant à des phonèmes (les sons décomposés que la voix peut produire pour former les mots) avec l'aide d'une interface permettant de jouer sur "tout" les paramètres qui peuvent modifier un son, qui pourrait se présenter au début sous forme sinusoïdal, en dents de scie, etc.). Un peu comme ce logiciel:
Premier aperçu du type de voix que je cherche à produire à 28sec.
(Ginsing tweaker | Site officiel: http://www.ginsingsound.com/what-it-does/tools-menu)
- Stockage des courbes en les associant à leur phonème
- Découpage de texte en flux de phonèmes
- A la lecture de chaque phonèmes: traitement de la courbe associée pour l'envoyer dans la sortie audio de la machine (ensuite un DAC [numérique vers analogique] enverra le signal dans un ampli puis finalement dans le haut-parleur).
Si vous connaissez des logiciels libres qui permettent de faire ça, merci de m'en faire profiter et peut être aussi à d'autre
A bientôt
Partager