Séparation Musique-Parole
[PFE] Compte Rendu Réunion n°1
CAHIER DES CHARGES
Personnes présentes
- Rémi et Pierre
- Jean Pierre Costa (Tuteur du PFE) et Jean François Bonastre
But
- Création d’une application native de karaoké (C/C++ ou autre langage adéquat)
- Possibilité de modifier l’énergie du signal de parole dans un morceau musical (idée du potentiomètre - égaliseur)
Moyens
Utilisation des toolkits Alizée et SPro.
- Spro : Récupère un fichier audio (format WAV par exemple).
Pour chaque trame de temps du morceau (définie), on calcule un nombre défini de cepstres. - Alizée : Récupère les cepstres.
Construction d’un modèle Voix et d’un modèle musique.
Calcul d’un pourcentage d’appartenance aux modèles pour chaque cepstre.
Idée
Au préalable on souhaite produire des modèles statistiques pour la parole et la musique à partir d’enregistrements de 5 morceaux. Pour chaque morceau on dispose de 3 enregistrements distincts : parole, musique, parole+musique.
On a en entrée un fichier WAV contenant de la voix et de la musique, on le soumet au logiciel SPRO qui va calculer en sortie les cepstres du signal par intervalles de temps. Ces vecteurs sont ensuite une entrée pour le logiciel ALIZEE qui va renvoyer des valeurs ALPHA et BETA correspondant à la proportion d’appartenance à tel ou tel modèle statistique (parole/musique).
A partir de cela, nous fabriquons des filtres permettant de réduire/augmenter l’énergie des cepstres correspondant respectivement à une forte/faible proportion de parole dans le signal.Enfin, on répète les mêmes étapes pour le signal de sortie jusqu’à obtention d’un signal satisfaisant (boucle de passage dans Alizée).
Téléchargez le document au format PDF
Sujet du PFE
Séparation parole - musique
L’idée est de proposer une méthode permettant a partir d’une chanson, de séparer le signal issu du chanteur au signal de musique. Le problème dans ce type d’application réside dans le fait que les fréquences utilisées sont identiques.
Cette application pourrait être utilisée sur un lecteur MP3 afin de proposer une fonctionnalité de type Karaoke.
Le travail à effectuer :
- Recherche bibliographique
- Implémentation de différents algorithmes
- Créer une interface
Téléchargez le document au format PDF
