Emiya, Valentin (2008) Transcription automatique de la musique de piano. PhD thesis Signal et images, Département Traitement du Signal et des Images, ENST p.230.
Full text available as:
|
|
Abstract
La transcription automatique de la musique (TAM) s'inscrit dans le champ de l'indexation audio et de la recherche d'informations musicales. Elle vise à extraire l'information relative aux notes jouées – début, fin, hauteur – dans un enregistrement numérique. Cette thèse aborde la TAM dans le cadre du piano, instrument difficile à transcrire par les systèmes actuels et qui occupe une place majeure d'instrument solo dans la musique occidentale. La problématique générale de la TAM étant vaste et complexe, nous exploitons certains aspects spécifiques du piano pour spécialiser la tâche, tout en abordant des thématiques générales comme l'estimation de fréquences fondamentales (F0) ou l'évaluation.
Nous étudions tout d’abord la caractérisation spectrale des sons de piano pour la transcription à travers la distribution inharmonique des partiels, la modélisation de l'enveloppe spectrale des notes et celle du bruit.
Nous proposons ensuite une méthode d'estimation de F0 isolées performante dans des conditions d'analyse difficiles qui sont réunies dans le cas du piano: les contraintes d'une fenêtre d'analyse courte et d'un registre étendu.
L'estimation de F0 multiples et du degré de polyphonie est abordée via une modélisation conjointe paramétrique (autorégressive/à moyenne ajustée). Cette méthode spectrale s'intègre dans un système de TAM pour le piano analysant tout enregistrement avec des limites raisonnables en termes de polyphonie, de vélocité et de tessiture.
Enfin, nous proposons de nouvelles métriques d’évaluation des transcriptions, un cadre d'évaluation de la qualité des métriques et une base de données de sons de piano pour l'estimation de F0 multiples et la TAM.
| Item Type: | PhD Thesis (PhD) |
|---|---|
| PhD Supervisor: | David, Bertrand and Roland, Badeau |
| Date: | 10 October 2008 |
| Board of examiners: | d’Alessandro, Christophe and de Cheveigné, Alain and Daudet, Laurent and Klapuri, Anssi and Richard, Gaël and Vincent, Emmanuel and David, Bertrand and Roland, Badeau |
| Ecole Doctorale: | ED 130 INFORMATIQUE, TELECOMMUNICATIONS ET ELECTRONIQUE (EDITE) |
| Discipline: | Signal et images |
| Collection (Fonds): | TELECOM ParisTech (ENST) |
| Institution: | ENST |
| Department: | Département Traitement du Signal et des Images |
| Subjects: | 2. Information and Communication Sciences and Technologies |
| Uncontrolled Keywords: | Traitement du signal, Audio, Indexation, Recherche d'information, Acoustique musicale, Transcription, Piano, Musique |
| ID Code: | 4867 |
| Deposited By: | Valentin Emiya |
| Deposited On: | 10 April 2009 |
Table of content
1 État de l’art
2 Paramétrisation spectrale des sons de piano
3 Estimation à court terme de hauteur simple sur un registre étendu
4 Estimation de fréquences fondamentales multiples
5 Système de transcription
6 Évaluation
Conclusion et perspectives
Repository Staff Only: edit this item