Home DE ES FR


Advanced Search

Our On-Line PhDs

Submit a Thesis
My Account Register Help

About
Fields
Mathematics and Applications
Information and Communication Sciences and Technologies
Physics, Optics
Materials Science, Mechanics and Mechanical Engineering
Fluid Mechanics and Energy
Chemistry, Physical Chemistry and Chemical Engineering
Life Sciences and Engineering
Earth Sciences and Environmental Engineering
Sciences of Economy, Management and Society
High resolution methods for estimating and tracking modulated sinusoids. Application to music signals.

Badeau, Roland (2005) High resolution methods for estimating and tracking modulated sinusoids. Application to music signals. PhD thesis Signal et Images, ENST - TSI Traitement du Signal et des Images, ENST.

Full text available as:

- Thesis.pdf ( 5407 Kb )
Licence: Copyright

Alternative Locations: http://perso.enst.fr/~rbadeau/password/Thesis.pdf

Abstract

In the field of speech and music signals analysis, the tonal part of a broad variety of sounds is often represented as a sum of sinusoids with slowly varying parameters. The Fourier transform remains a prominent tool for estimating the parameters of this model. This is due to its robustness and to the existence of fast algorithms. However, its spectral resolution is bounded. High Resolution (HR) methods are conversely not constrained by this limit, since they rely on a particular structure of the signal model. Nevertheless, they are seldom used in the field of audio signal processing, mainly because of their high computational cost. The reduction of this complexity is one of the major contributions of this thesis. To track the temporal variations of the parameters, fast subspace tracking algorithms (referred to as FAPI, YAST and SWASVD) and an adaptive version of the ESPRIT method are developed. Their application to audio signals is not straightforward: the number of sinusoidal components is unknown and the nature and the variety of these signals lead to specific difficulties. Preprocessings are developed to ensure the robustness of the HR analysis, and a new model order selection method is proposed. Lastly, a part of the document is devoted to the estimation of mixtures of complex exponentials modulated by polynomials, resulting from the presence of multiple poles. This study leads to the development of a generalized version of the ESPRIT method and to the statistical analysis of its performance.

Item Type:PhD Thesis (PhD)
Thesis Supervisor:Richard, Gaël and David, Bertrand
Date:May 2005
Board of examiners:Comon, Pierre and Marcos, Sylvie and Depalle, Philippe and Grenier, Yves and Abed-Meraim, Karim
Ecole Doctorale:ED 130 INFORMATIQUE, TELECOMMUNICATIONS ET ELECTRONIQUE (EDITE)
Discipline:Signal et Images
Collection (Fonds):ENST
Institution:ENST
Department:ENST - TSI Traitement du Signal et des Images
Prize:Prix Paristech 2006
Subjects:2. Information and Communication Sciences and Technologies
Uncontrolled Keywords:Haute résolution, Musique, Poursuite, Sous-espace, Esprit, Adaptatif, Sélection de l'ordre, Pôle multiple
ID Code:1234
Deposited By:Roland Badeau
Deposited On:12 May 2005

References

Bibliographie de l'auteur
— Articles de revues —
[Badeau et al., 2004a] R. Badeau, G. Richard, et B. David. Sliding window adaptive SVD algorithms. IEEE Trans. Signal Processing, 52(1) :1-10, janvier 2004. (reproduit en annexe).
[Badeau et al., 2005a] R. Badeau, B. David, et G. Richard. A new perturbation analysis for signal enumeration in rotational invariance techniques. IEEE Trans. Signal Processing, 2005. (à paraître).
[Badeau et al., 2005b] R. Badeau, B. David, et G. Richard. Fast Approximated Power Iteration Subspace Tracking. IEEE Trans. Signal Processing, août 2005. (à paraître).
[Badeau et al., 2005c] R. Badeau, B. David, et G. Richard. High resolution spectral analysis of mixtures of complex exponentials modulated by polynomials. IEEE Trans. Signal Processing, 2005. (accepté sous réserve de modifications mineures).
— Articles de conférences —
[Alonso et al., 2003a] M. Alonso, R. Badeau, B. David, et G. Richard. Musical tempo estimation using noise subspace projections. Dans Proc. of WASPAA'03, pages 95-98, New Paltz, NY, USA, octobre 2003. IEEE.
[Badeau et al., 2002] R. Badeau, R. Boyer, et B. David. EDS parametric modeling and tracking of audio signals. Dans Proc. of DAFx-02, pages 139-144, Hambourg, Allemagne, septembre 2002. (reproduit en annexe).
[Badeau et al., 2003a] R. Badeau, K. Abed-Meraim, G. Richard, et B. David. Sliding Window Orthonormal PAST Algorithm. Dans Proc. of ICASSP'03, volume 5, pages 261-264, Hong Kong, Chine, avril 2003. IEEE.
[Badeau et al., 2003b] R. Badeau, G. Richard, et B. David. Adaptive ESPRIT algorithm based on the PAST subspace tracker. Dans Proc. of ICASSP'03, volume 6, pages 229-232, Hong Kong, Chine, avril 2003. IEEE.
[Badeau et al., 2003c] R. Badeau, G. Richard, et B. David. Approximated power iterations for fast subspace tracking. Dans Proc. of 7th Int. Symp. on Signal Proc. and its Applications, volume 2, pages 583-586, Paris, France, juillet 2003.
[Badeau et al., 2003d] R. Badeau, G. Richard, et B. David. Suivi d'espace dominant par la méthode des puissances itérées. Dans Actes du 19ème colloque GRETSI sur le traitement du signal et des images, volume 1, pages 137-140, Paris, France, septembre 2003.
[Badeau et al., 2004b] R. Badeau, B. David, et G. Richard. Selecting the modeling order for the ESPRIT high resolution method: an alternative approach. Dans Proc. of ICASSP'04, volume 2, pages 1025-1028, Montréal, Québec, Canada, mai 2004. IEEE.
[Badeau et al., 2005d] R. Badeau, B. David, et G. Richard. Yet Another Subspace Tracker. Dans Proc. of ICASSP'05, volume 4, pages 329-332, Philadelphie, PA, USA, mars 2005. IEEE.
[Badeau et al., 2005e] R. Badeau, G. Richard, et B. David. Fast adaptive ESPRIT algorithm. Dans Proc. of SSP'05, Bordeaux, France, juillet 2005. IEEE. (à paraître).
[David et al., 2002] B. David, R. Badeau, et G. Richard. Sintrack analysis for tracking components of musical signals. Dans Proc. of the Forum Acusticum Sevilla 2002, Séville, Espagne, septembre 2002.
[David et al., 2003] B. David, G. Richard, et R. Badeau. An EDS modeling tool for tracking and modifying musical signals. Dans Proc. of SMAC'03, volume 2, pages 715-718, Stockholm, Suède, août 2003. (reproduit en annexe).
Bibliographie du document
[Abed-Meraim et al., 2000] K. Abed-Meraim, A. Chkeif, et Y. Hua. Fast orthonormal PAST algorithm. IEEE Signal Proc. Letters, 7(3) :60-62, mars 2000.
[Akaike, 1973] H. Akaike. Information theory and an extension of the maximum likelihood principle. Dans B. N. Petrov et F. Csaki, éditeurs, Proc. of the 2nd International Symposium on Information Theory, pages 267-281, Budapest, Hongrie, 1973. Akademia Kiado.
[Alonso et al., 2003b] M. Alonso, B. David, et G. Richard. A Study of Tempo Tracking Algorithms from Polyphonic Music Signals. Dans Proc. of 4th COST 276 Workshop, France, mars 2003.
[Barabell, 1983] A. J. Barabell. Improving the resolution performance of eigenstructure-based direction-finding algorithms. Dans Proc. of ICASSP'83, pages 336-339, Boston, MA, USA, 1983. IEEE.
[Barthelemy et Willett, 1993] A. C. Barthelemy et P. K. Willett. Prewhitening of colored noise fields for detection of threshold sources. Dans Conf. Record of the 27th Asilomar Conf. on Signals, Systems and Computers, volume 1, pages 243-247, Pacific Grove, CA, USA, novembre 1993.
[Bienvenu et Kopp, 1983] G. Bienvenu et L. Kopp. Optimality of high-resolution array processing using the eigensystem method. IEEE Trans. Acoust., Speech, Signal Processing, 31(5) :1235-1245, octobre 1983.
[Bischof et Shroff, 1992] C. H. Bischof et G. M. Shroff. On updating signal subspaces. IEEE Trans. Signal Processing, 40 :96-105, 1992.
[Bishop et Djuric, 1996] W. B. Bishop et P. M. Djuric. Model order selection of damped sinusoids in noise by predictive densities. IEEE Trans. Signal Processing, 44(3) :611-619, mars 1996.
[Boley et al., 1997] D. L. Boley, F. T. Luk, et D. Vandevoorde. A General Vandermonde Factorization of a Hankel Matrix. Dans Int'l Lin. Alg. Soc. (ILAS) Symp. on Fast Algorithms for Control, Signals and Image Processing, Winnipeg, Canada, 1997.
[Boyer et Abed-Meraim, 2004] R. Boyer et K. Abed-Meraim. Audio modeling based on delayed sinusoids. IEEE Trans. Speech Audio Processing, 12(2) :110-120, mars 2004.
[Boyer et al., 2002] R. Boyer, S. Essid, et N. Moreau. Non-stationary signal parametric modeling techniques with an application to low bit rate audio coding. Dans Proc. of 6th Int. Conf. on Signal Processing, volume 1, pages 430-433, Beijing, Chine, août 2002.
[Cardoso et Moulines, 1995] J. F. Cardoso et E. Moulines. Asymptotic performance analysis of direction-finding algorithms based on fourth-order cumulants. IEEE Trans. Signal Processing, 43 :214-224, janvier 1995.
[Champagne et Liu, 1998] B. Champagne et Q.-G. Liu. Plane rotation-based EVD updating schemes for efficient subspace tracking. IEEE Trans. Signal Processing, 46(7) :1886-1900, juillet 1998.
[Chen et Amari, 2001] T. Chen et S. Amari. Unified stabilization approach to principal and minor components extraction algorithms. Neural Networks, 14(10) :1377-1387, 2001.
[Chonavel et al., 2003] T. Chonavel, B. Champagne, et C. Riou. Fast adaptive eigenvalue decomposition: a maximum likelihood approach. Signal processing, 83(2) :307-324, février 2003.
[Chowning, 1973] J. M. Chowning. The synthesis of complex audio spectra by means of frequency modulation. Journal of the Acoustical Society of America, 21(7) :526-534, 1973.
[Comon et Golub, 1990] P. Comon et G. H. Golub. Tracking a few extreme singular values and vectors in signal processing. Dans Proc. of IEEE, volume 78, pages 1327-1343, août 1990.
[David, 1999] B. David. Caractérisations acoustiques de structures vibrantes par mise en atmosphère raréfiée. PhD thesis, University of Paris VI, 1999.
[Davila, 2000] C. E. Davila. Efficient, high performance, subspace tracking for time-domain data. IEEE Trans. Signal Processing, 48(12) :3307-3315, décembre 2000.
[De Moor, 1993] B. De Moor. The singular value decomposition and long and short spaces of noisy matrices. IEEE Trans. Signal Processing, 41(9) :2826-2838, septembre 1993.
[DeGroat, 1992] R. D. DeGroat. Noniterative subspace tracking. IEEE Trans. Signal Processing, 40(3) :571-577, mars 1992.
[Dologlou et al., 1997] I. Dologlou, S. Van Huffel, et D. Van Ormondt. Improved signal enhancement procedures applied to exponential data modeling. IEEE Trans. Signal Processing, 45(3) :799-803, mars 1997.
[Douglas, 2000] S. C. Douglas. Numerically-robust adaptive subspace tracking using Householder transformations. Dans Proc. of Sensor Array and Multichannel Signal Proc. Workshop, pages 499-503. IEEE, 2000.
[Dowling et al., 1994] E. M. Dowling, L. P. Ammann, et R. D. DeGroat. A TQR-iteration based adaptive SVD for real time angle and frequency tracking. IEEE Trans. Signal Processing, 42(4) :914-926, avril 1994.
[Duvaut, 1994] P. Duvaut. Traitement du signal. Hermes, Paris, France, 1994.
[Ephraim et Van Trees, 1995] Y. Ephraim et H. L. Van Trees. A signal subspace approach for speech enhancement. IEEE Trans. Speech Audio Processing, 3(4) :251-266, juillet 1995.
[Eriksson et al., 1993] A. Eriksson, P. Stoica, et T. Soderstrom. Second-order properties of MUSIC and ESPRIT estimates of sinusoidal frequencies in high SNR scenarios. IEE Proceedings on Radar, Sonar and Navigation, 140(4) :266-272, août 1993.
[Fu et Dowling, 1995] Z. Fu et E. M. Dowling. Conjugate gradient eigenstructure tracking for adaptive spectral estimation. IEEE Trans. Signal Processing, 43(5) :1151-1160, mai 1995.
[Fuchs, 1992] J. J. Fuchs. Estimation of the number of signals in the presence of unknown correlated sensor noise. IEEE Trans. Signal Processing, 40(5) :1053-1061, mai 1992.
[Gini et Bordoni, 2003] F. Gini et F. Bordoni. On the behavior of information theoretic criteria for model order selection of InSAR signals corrupted by multiplicative noise. Signal Processing, 83 :1047-1063, 2003.
[Golub et Van Loan, 1996] G. H. Golub et C. F. Van Loan. Matrix computations. The Johns Hopkins University Press, Baltimore and London, UK, third édition, 1996.
[Goodwin, 1996] M. Goodwin. Nonuniform filterbank design for audio signal modeling. Dans Conf. Record of the 30th Asilomar Conf. on Signals, Systems and Computers, volume 2, pages 1229-1233, novembre 1996.
[Goto et Muraoka, 1997] M. Goto et Y. Muraoka. Real-time Rhythm Tracking for Drumless Audio Signals. Dans Proc. of the IJCAI'97, 1997.
[Graham et al., 1994] R. L. Graham, D. E. Knuth, et O. Patashnik. Concrete Mathematics: A Foundation for Computer Science. Addison-Wesley, Reading, MA, USA, second édition, 1994.
[Göransson, 1994] B. Göransson. Robust direction estimation in the presence of spatially correlated noise. Dans Proc. of 7th Workshop on Statistical and Array Processing, pages 157-160, 1994.
[Göransson et Ottersten, 1999] B. Göransson et B. Ottersten. Direction estimation in partially unknown noise fields. IEEE Trans. Signal Processing, 47(9) :2375-2385, septembre 1999.
[Grouffaud et al., 1996] J. Grouffaud, P. Larzabal, et H. Clergeot. Some properties of ordered eigenvalues of a Wishart matrix: application in detection test and model order selection. Dans Proc. of ICASSP'96, volume 5, pages 2465-2468. IEEE, 1996.
[Hermus et al., 2002] K. Hermus, W. Verhelst, et P. Wambacq. Psychoacoustic modeling of audio with exponentially damped sinusoids. Dans Proc. of ICASSP'02, volume 2, pages 1821-1824. IEEE, 2002.
[Hermus et al., 2000] K. Hermus, W. Verhelst, P. Wambacq, et P. Lemmerling. Total Least Squares based subband modelling for scalable speech representations with damped sinusoids. Dans Proc. of International Conference on Spoken Language Processing, volume 3, pages 1129-1132, Beijing, Chine, octobre 2000.
[Hermus et Wambacq, 2004] K. Hermus et P.Wambacq. Assessment of signal subspace based speech enhancement for noise robust speech recognition. Dans Proc. of ICASSP'04, volume 1, pages 945-948. IEEE, mai 2004.
[Horn et Johnson, 1985] R. A. Horn et C. R. Johnson. Matrix analysis. Cambridge University Press, Cambridge, UK, 1985.
[Hua et Sarkar, 1990] Y. Hua et T. K. Sarkar. Matrix pencil method for estimating parameters of exponentially damped/undamped sinusoids in noise. IEEE Trans. Acoust., Speech, Signal Processing, 38(5) :814-824, mai 1990.
[Hua et Sarkar, 1991] Y. Hua et T. K. Sarkar. On SVD for estimating generalized eigenvalues of singular matrix pencil in noise. IEEE Trans. Signal Processing, 39(4) :892-900, avril 1991.
[Hua et al., 1999] Y. Hua, Y. Xiang, T. Chen, K. Abed-Meraim, et Y. Miao. A new look at the power method for fast subspace tracking. Digital Signal Processing, octobre 1999.
[Huffel, 1993] S. Van Huffel. Enhanced resolution based on minimum variance estimation and exponential data modeling. Signal Processing, 33(3) :333-355, septembre 1993.
[Jeanneau et al., 1998] M. Jeanneau, P. Mouyon, et C. Pendaries. Sintrack analysis, application to detection and estimation of flutter for flexible structures. Dans Proc. of EUSIPCO, pages 789-792, Ile de Rhodes, Grèce, septembre 1998.
[Jensen et al., 2004] J. Jensen, R. Heusdens, et S. H. Jensen. A perceptual subspace approach for modeling of speech and audio signals with damped sinusoids. IEEE Trans. Speech Audio Processing, 12(2) :121-132, mars 2004.
[Jensen et al., 1999] J. Jensen, S. H. Jensen, et E. Hansen. Exponential Sinusoidal Modeling of Transitional Speech Segments. Dans Proc. of ICASSP'99, volume 1, pages 473-476. IEEE, mars 1999.
[Kahrs et Brandenbourg, 1998] M. Kahrs et K. Brandenbourg. Applications of Digital Signal Processing to Audio and Acoustics. Kluwer Academic Press, Dortrecht, Pays-Bas, 1998.
[Karasalo, 1986] I. Karasalo. Estimating the covariance matrix by signal subspace averaging. IEEE Trans. Acoust., Speech, Signal Processing, 34 :8-12, février 1986.
[Karjalainen et al., 2003] M. Karjalainen, P. A. A. Esquef, et V. Välimäki. Making of a computer carillon. Dans Proc. of SMAC'03, volume 1, pages 339-342, Stockholm, Suède, août 2003.
[Kay, 1993] S. M. Kay. Fundamentals of Statistical Signal Processing: Estimation Theory. Prentice-Hall, Englewood Cliffs, NJ, USA, 1993.
[Keiler et Marchand, 2002] F. Keiler et S. Marchand. Survey on extraction of sinusoids in stationary sounds. Dans Proc. of DAFx-02, pages 51-58, Hambourg, Allemagne, septembre 2002.
[Kincaid et Cheney, 1996] D. Kincaid et W. Cheney. Numerical analysis. Brooks/Cole Publishing, Pacific Grove, Californie, USA, second édition, 1996.
[Klapuri, 1999] A. Klapuri. Sound Onset Detection by Applying Psychoacoustic Knowledge. Dans Proc. of ICASSP'99, Arizona, USA, mars 1999.
[Kot et al., 1987] A. Kot, S. Parthasarathy, D. Tufts, et R. Vaccaro. The statistical performance of state-variable balancing and Prony's method in parameter estimation. Dans Proc. of ICASSP'87, volume 12, pages 1549-1552, avril 1987.
[Kumaresan, 1983] R. Kumaresan. On the zeros of the Linear Prediction-error filter for deterministic signals. IEEE Trans. Acoust., Speech, Signal Processing, 31(1) :217-220, février 1983.
[Kumaresan et Tufts, 1982] R. Kumaresan et D. W. Tufts. Estimating the parameters of exponentially damped sinusoids and pole-zero modeling in noise. IEEE Trans. Acoust., Speech, Signal Processing, 30(6) :833-840, décembre 1982.
[Kundu et Mitra, 2000] D. Kundu et A. Mitra. Detecting the number of signals for an undamped exponential model using cross-validation approach. Signal Processing, 80(3) :525-534, 2000.
[Kung et al., 1983] S. Y. Kung, K. S. Arun, et D. B. Rao. State-space and singular value decomposition based approximation methods for harmonic retrieval problem. J. of Opt. Soc. of America, 73 :1799-1811, décembre 1983.
[Kung et al., 1994] S. Y. Kung, K. I. Diamantaras, et J. S. Taur. Adaptive principal component extraction (apex) and applications. IEEE Trans. Signal Processing, 42(5) :1202-1217, mai 1994.
[Lambourg et Chaigne, 1993] C. Lambourg et A. Chaigne. Measurements and modeling of the admittance matrix at bridge in guitars. Dans Proc. of SMAC'93, pages 449-453, Stockholm, Suède, juillet 1993.
[Laroche, 1989] J. Laroche. A new analysis / synthesis system of musical signals using Prony's method - application to heavily damped percussive sounds. Dans Proc. of ICASSP'89, volume 3, pages 2053-2056. IEEE, mai 1989.
[Laroche, 1993] J. Laroche. The use of the Matrix Pencil method for the spectrum analysis of musical signals. Journal of the Acoustical Society of America, 94(4) :1958-1965, octobre 1993.
[Laroche, 2001] J. Laroche. Estimating Tempo, Swing, and Beat Locations in Audio Recordings. Dans Proc. of WASPAA'01, New York, NY, USA, octobre 2001.
[Le Cadre, 1989] J. P. Le Cadre. Parametric methods for spatial signal processing in the presence of unknown colored noise fields. IEEE Trans. Acoust., Speech, Signal Processing, 37(7) :965-983, juillet 1989.
[Lee et Lee, 1995] J-J. Lee et B. G. Lee. A design of nonuniform cosine modulated filter banks. IEEE Trans. Circuits Syst. II, 42(11) :732-737, novembre 1995.
[Levine et al., 1997] S. N. Levine, T. S. Verma, et J. O. Smith. Alias-free multiresolution sinusoidal modeling for polyphonic, wideband audio. Dans Proc. of WASPAA'97, New Paltz, NY, USA, octobre 1997. IEEE.
[Li et al., 1997] Y. Li, K. Liu, et J. Razavilar. A parameter estimation scheme for damped sinusoidal signals based on low-rank Hankel approximation. IEEE Trans. Signal Processing, 45 :481-486, février 1997.
[Liavas et Regalia, 2001] A. P. Liavas et P. A. Regalia. On the behavior of Information Theoretic Criteria for model order selection. IEEE Trans. Signal Processing, 49(8) :1689-1695, août 2001.
[Liavas et al., 1999] A. P. Liavas, P. A. Regalia, et J.-P. Delmas. Blind channel approximation: effective channel order determination. IEEE Trans. Signal Processing, 47(12) :3336-3344, décembre 1999.
[Liu et al., 1994] K. J. R. Liu, D. P. O'Leary, G. W. Stewart, et Y-J. J. Wu. URV ESPRIT for tracking time-varying signals. IEEE Trans. Signal Processing, 42(12) :3443-3448, décembre 1994.
[Liu et Champagne, 1996] Q. G. Liu et B. Champagne. An adaptive ESPRIT algorithm based on perturbation of unsymmetrical matrices. Dans Proc. of 8th EUSIPCO, pages 539-542, Trieste, Italie, septembre 1996.
[MacInnes, 1998] C. S.MacInnes. Fast, accurate subspace tracking using operator restriction analysis. Dans Proc. of ICASSP'98, pages 1357-1360. IEEE, 1998.
[Marcos et al., 1998] S. Marcos, J. Sanchez-Araujo, N. Bertaux, P. Larzabal, et P. Forster. Les Méthodes à haute résolution: traitement d'antenne et analyse spectrale. Chapitres 4 et 5. Hermès, Paris, France, 1998. Ouvrage collectif sous la direction de S. Marcos.
[Mathew et Reddy, 1995] G. Mathew et V. U. Reddy. Adaptive estimation of eigensubspace. IEEE Trans. Signal Processing, 43(2) :401-411, février 1995.
[Mc Aulay et Quatieri, 1986] R. J. Mc Aulay et T. F. Quatieri. Speech analysis and synthesis based on a sinusoidal representation. IEEE Trans. Acoust., Speech, Signal Processing, 34(4) :744-754, août 1986.
[Meddis et O'Mard, 1997] R. Meddis et L. O'Mard. A Unitary Model of Pitch Perception. JASA, 102, septembre 1997.
[Miao et Hua, 1998] Y. Miao et Y. Hua. Fast subspace tracking and neural network learning by a novel information criterion. IEEE Trans. Signal Processing, 46(7) :1967-1979, juillet 1998.
[Moonen et al., 1992] M.Moonen, P. Van Dooren, et J. Vandewalle. An SVD updating algorithm for subspace tracking. SIAM J. Matrix Ana. Appl., 13(4) :1015-1038, 1992.
[Moonen et al., 1994] M. Moonen, F. J. Vanpoucke, et E. F. Deprettere. Parallel and adaptive high-resolution direction finding. IEEE Trans. Signal Processing, 42(9) :2439-2448, septembre 1994.
[Moro et al., 1997] J. Moro, J. V. Burke, et M. L. Overton. On the Lidskii-Vishik-Lyusternik perturbation theory for eigenvalues of matrices with arbitrary Jordan structure. SIAM Journal on Matrix Analysis and Applications, 18(4) :793-817, octobre 1997.
[Moulines et Laroche, 1995] E. Moulines et J. Laroche. Non parametric techniques for pitch-scale and time-scale modification of speech. Speech Communication, pages 175-205, février 1995.
[Nieuwenhuijse et al., 1998] J. Nieuwenhuijse, R. Heusens, et Ed. F. Deprettere. Robust exponential modeling of audio signals. Dans Proc. of ICASSP'98, volume 6, pages 3581-3584. IEEE, mai 1998.
[Oja, 1989] E. Oja. Neural networks, principal components and subspaces. Int. journal of neural systems, 1(1) :61-68, 1989.
[Paulus et Klapuri, 2002] J. Paulus et A. Klapuri. Measuring The Similarity of Rhythmic Patterns. Dans Proc. of ISMIR'02, 3rd Int. Conf. on Music Information Retrieval, Paris, France, octobre 2002.
[Pisarenko, 1973] V. F. Pisarenko. The retrieval of harmonics from a covariance function. Geophysical J. Royal Astron. Soc., 33 :347-366, 1973.
[Rabideau, 1996] D. J. Rabideau. Fast, rank adaptive subspace tracking and applications. IEEE Trans. Signal Processing, 44(9) :2229-2244, septembre 1996.
[Rao et Zhao, 1993] C. R. Rao et L. C. Zhao. Asymptotic behavior of maximum likelihood estimates of superimposed exponential signals. IEEE Trans. Signal Processing, 41(3) :1461-1464, mars 1993.
[Real et al., 1999] E. C. Real, D. W. Tufts, et J. W. Cooley. Two algorithms for fast approximate subspace tracking. IEEE Trans. Signal Processing, 47(7) :1936-1945, juillet 1999.
[Riche de Prony, 1795] G. M. Riche de Prony. Essai expérimental et analytique: sur les lois de la dilatabilité de fluides élastiques et sur celles de la force expansive de la vapeur de l'eau et de la vapeur de l'alcool à différentes températures. Journal de l'école polytechnique, 1(22) :24-76, 1795.
[Rissanen, 1978] J. Rissanen. Modeling by shortest data description. Automatica, 14 :465-471, 1978.
[Roman, 1984] S. Roman. The Umbral Calculus. Academic Press, New York, NY, USA, 1984. §1.2: The Lower Factorial Polynomial.
[Roy et Kailath, 1987] R. Roy et T. Kailath. Total least squares ESPRIT. Dans Proc. of 21st Asilomar Conference on Signals, Systems, and Computers, pages 297-301, novembre 1987.
[Roy et al., 1986] R. Roy, A. Paulraj, et T. Kailath. ESPRIT-A subspace rotation approach to estimation of parameters of cisoids in noise. IEEE Trans. Acoust., Speech, Signal Processing, 34(5) :1340-1342, octobre 1986.
[Saarnisaari, 1999] H. Saarnisaari. Robustness of the MUSIC algorithm to Errors in Estimation the Dimensions of the Subspaces: Delay Estimation in DS/SS in the Presence of Interference. Dans Proc. of the Military Communications Conference MILCOM'99, Atlantic City, NJ, USA, 1999.
[Scharf, 1991] L. L. Scharf. Statistical signal processing. Addison Wesley, New York, NY, USA, 1991.
[Scheirer, 1998] E. D. Scheirer. Tempo and Beat Analysis of Acoustic Music Signals. JASA, 103 :588-601, janvier 1998.
[Schmidt, 1981] R. O. Schmidt. A signal subspace approach to multiple emitter location and spectral estimation. PhD thesis, Stanford University, Stanford, Californie, USA, novembre 1981.
[Schmidt, 1986] R. O. Schmidt. Multiple emitter location and signal parameter estimation. IEEE Trans. Antennas Propagat., 34(3) :276-280, mars 1986.
[Schwarz, 1978] G. Schwarz. Estimating the dimension of a model. The Annals of Statistics, 6(2) :461-464, 1978.
[Seppänen, 2001] J. Seppänen. Tatum Grid Analysis of Musical Signals. Dans Proc. of WASPAA'01, New York, NY, USA, octobre 2001.
[Serra et Smith, 1990] X. Serra et J. Smith. Spectral modeling synthesis: a sound analysis/synthesis based on a deterministic plus stochastic decomposition. Computer Music Journal, 14(4), 1990.
[Stewart, 1992] G. W. Stewart. An updating algorithm for subspace tracking. IEEE Trans. Signal Processing, 40 :1535-1541, juin 1992.
[Stoica et al., 2000] P. Stoica, H. Li, et J. li. Amplitude estimation of sinusoidal signals: survey, new results, and an application. IEEE Trans. Signal Processing, 48(2) :338-352, 2000.
[Stoica et Nehorai, 1988] P. Stoica et A. Nehorai. Study of the statistical performance of the Pisarenko harmonic decomposition method. IEE Proceedings Radar and Signal Processing, 135(2) :161-168, avril 1988.
[Stoica et Söderström, 1991] P. Stoica et T. Söderström. Statistical Analysis of MUSIC and Subspace Rotation Estimates of Sinusoidal Frequencies. IEEE Trans. Signal Processing, 39 :1836-1847, août 1991.
[Strang, 2003] G. Strang. Introduction to Linear Algebra. Wellesley-Cambridge Press, third édition, 2003.
[Strobach, 1996] P. Strobach. Low-rank adaptive filters. IEEE Transactions on Signal Processing, 44(12) :2932-2947, décembre 1996.
[Strobach, 1997a] P. Strobach. Bi-iteration SVD subspace tracking algorithms. IEEE Trans. Signal Processing, 45(5) :1222-1240, mai 1997.
[Strobach, 1997b] P. Strobach. Square Hankel SVD subspace tracking algorithms. Signal Processing, 57(1) :1-18, février 1997.
[Strobach, 1998] P. Strobach. Fast recursive subspace adaptive ESPRIT algorithms. IEEE Trans. Signal Processing, 46(9) :2413-2430, septembre 1998.
[Tkacenko et Vaidyanathan, 2001] A. Tkacenko et P. P. Vaidyanathan. The role of filter banks in sinusoidal frequency estimation. Journal of the Franklin Institute, 338(5) :517-547, août 2001.
[Vaidyanathan, 1993] P. P. Vaidyanathan. Multirate systems and filter banks. Prentice-Hall, Inc.,Upper Saddle River, NJ, USA, 1993.
[Van der Veen et al., 1993] A-J. Van der Veen, ED. F. Deprettere, et A. L. Swindlehurst. Subspace based signal analysis using singular value decomposition. Proc. of IEEE, 81(9) :1277-1308, septembre 1993.
[Vandevoorde, 1996] D. Vandevoorde. A fast exponential decomposition algorithm and its applications to structured matrices. PhD thesis, Rensselaer Polytechnic Institute, Troy, NY, USA, 1996.
[Viberg et al., 1995] M. Viberg, P. Stoica, et B. Ottersten. Array processing in correlated noise fields based on instrumental variables and subspace fitting. IEEE Trans. Signal Processing, 43(5) :1187-1199, mai 1995.
[von Sachs, 1994] R. von Sachs. Peak-insensitive non-parametric spectrum estimation. Journal of time series analysis, 15 :429-452, 1994.
[Wang et al., 2004] J. F. Wang, C-H. Yang, et K-H. Chang. Subspace tracking for speech enhancement in car noise environments. Dans Proc. of ICASSP'04, volume 2, pages 789-792. IEEE, mai 2004.
[Wax et Kailath, 1985] M. Wax et T. Kailath. Detection of signals by information theoretic criteria. IEEE Trans. Acoust., Speech, Signal Processing, 33(2) :387-392, avril 1985.
[Weinreich, 1977] G.Weinreich. Coupled piano strings. Journal of the Acoustical Society of America, 62(6) :1474-1484, 1977.
[Williams et Madisetti, 1999] D. B. Williams et V. K. Madisetti. Fast Fourier Transforms: A Tutorial Review and a State of the Art, in Digital Signal Processing Handbook. CRC Press LLC, Boca Raton, Floride, USA, 1999.
[Xu et al., 1994] G. Xu, H. Zha, G. H. Golub, et T. Kailath. Fast algorithms for updating signal subspaces. IEEE Trans. Circuits Syst., 41(8) :537-549, août 1994.
[Xu, 1993] L. Xu. Least mean square error reconstruction principle for selg-organizing neural nets. Neural Networks, 6 :627-648, 1993.
[Yang, 1995] B. Yang. Projection Approximation Subspace Tracking. IEEE Trans. Signal Processing, 44(1) :95-107, janvier 1995.
[Zhang et Wong, 1993] Q. T. Zhang et K. M. Wong. Information theoretic criteria for the determination of the number of signals in spatially correlated noise. IEEE Trans. Signal Processing, 41(4) :1652-1663, avril 1993.
[Zhao et al., 1986a] L. C. Zhao, P. R. Krishnaiah, et Z. D. Bai. On detection of the number of signals in presence of white noise. Journal of Multivariate Analysis, 20(1) :1-25, 1986.
[Zhao et al., 1986b] L. C. Zhao, P. R. Krishnaiah, et Z. D. Bai. On detection of the number of signals when the noise covariance matrix is arbitrary. Journal of Multivariate Analysis, 20(1) :26-49, 1986.
[Zoltawski et Stavrinides, 1989] M. Zoltawski et D. Stavrinides. Sensor array signal processing via a Procrustes rotations based eigen-analysis of the ESPRIT data pencil. IEEE Trans. Acoust., Speech, Signal Processing, 37(6) :832-861, juin 1989.

Table of content

Remerciements i
Table des matières ii
Table des figures vii
Liste des tableaux ix
Acronymes x
Notations xii
Introduction 1
Partie I Modèle de signal et méthodes d'estimation 7
I État de l'art des méthodes à haute résolution 9
I.1 Introduction 10
I.2 Modèle de signal 10
I.3 Méthode du maximum de vraisemblance 11
I.3.1 Application du principe du maximum de vraisemblance au modèle ESM 12
I.3.2 Maximum de vraisemblance et résolution de Fourier 13
I.4 Méthodes à haute résolution 14
I.4.1 Techniques de prédiction linéaire 14
I.4.2 Méthodes sous-espace 17
I.5 Estimation des autres paramètres 20
I.5.1 Estimation de l'ordre de modélisation 20
I.5.2 Estimation des amplitudes, des phases et de l'écart-type du bruit 21
I.6 Performances des estimateurs 21
I.6.1 Borne de Cramer-Rao 21
I.6.2 Performances des méthodes HR 23
I.7 Conclusion 24
II Estimation des paramètres dans le cas de pôles multiples 25
II.1 Introduction 26
II.2 Le modèle Polynomial Amplitude Complex Exponentials 26
II.2.1 Equations de récurrence linéaires et homogènes 26
II.2.2 Polynômes binomiaux 27
II.2.3 Paramétrisation complète du modèle de signal 27
II.3 Les matrices de Pascal-Vandermonde 28
II.4 Méthode du maximum de vraisemblance 30
II.5 Généralisation de l'algorithme ESPRIT 31
II.5.1 Structure singulière de la matrice de données 31
II.5.2 Structure singulière de la matrice de corrélation 33
II.5.3 L'algorithme ESPRIT généralisé 33
II.6 Estimation des amplitudes, des phases et de l'écart-type du bruit 34
II.7 Conclusion 34
III Performances de l'algorithme ESPRIT généralisé 35
III.1 Introduction 36
III.2 Bornes de Cramér-Rao 36
III.2.1 Bornes de Cramér-Rao pour le modèle PACE 36
III.2.2 Bornes de Cramér-Rao asymptotiques 38
III.3 Etude des perturbations et de la performance des estimateurs 39
III.3.1 Perturbations induites par le bruit additif 39
III.3.2 Performance des estimateurs 44
III.4 Simulations numériques 47
III.4.1 Modèle de signal réel 48
III.4.2 Modulation d'amplitude polynomiale 49
III.4.3 Modulation d'amplitude et de fréquence 49
III.5 Conclusion 50
IV Estimation de l'ordre de modélisation 53
IV.1 Introduction 54
IV.2 Impact d'un ordre de modélisation erroné 54
IV.2.1 Sur-estimation de l'ordre du modèle 54
IV.2.2 Sous-estimation de l'ordre du modèle 55
IV.3 Sélection d'un ordre de modélisation approprié reposant sur l'erreur d'estimation 56
IV.3.1 Calcul récursif de (p) 57
IV.3.2 Calcul récursif de E(p) 58
IV.4 Simulations numériques 59
IV.4.1 Pertinence des bornes d'erreur a priori et a posteriori 59
IV.4.2 Sélection de l'ordre du modèle pour un signal synthétique 60
IV.4.3 Comparaison statistique des performances 62
IV.4.4 Sélection de l'ordre du modèle pour un signal de musique 63
IV.5 Conclusion 64
V Optimisation de l'algorithme d'estimation 67
V.1 Introduction 68
V.2 Estimation de l'espace signal 68
V.2.1 Algorithme d'itération orthogonale 69
V.2.2 Produit matriciel rapide 70
V.3 Optimisation des autres étapes 71
V.3.1 Calcul de la matrice spectrale 71
V.3.2 Estimation des amplitudes 72
V.4 Conclusion 73
Partie II Algorithmes rapides de poursuite des paramètres 75
VI Etat de l'art des techniques de poursuite de l'espace signal et des pôles 77
VI.1 Introduction 78
VI.2 Poursuite de l'espace signal 78
VI.2.1 Étude préliminaire 78
VI.2.2 Méthode des puissances itérées 80
VI.2.3 Algorithmes adaptatifs de poursuite de l'espace signal 81
VI.3 Poursuite de la matrice spectrale et des pôles 85
VI.4 Conclusion 86
VII Approximation de la méthode des puissances itérées 89
VII.1 Introduction 90
VII.2 Fenêtrage des données 90
VII.3 L'approximation par projection 91
VII.4 Approximation des Puissances Itérées 92
VII.4.1 Récurrence pour la matrice Cxy(t) 92
VII.4.2 Récurrence pour la matrice Z(t) 94
VII.4.3 Récurrence pour la matrice W(t) 94
VII.5 Méthode API rapide 95
VII.5.1 Une solution particulière à l'équation (VII.33) 95
VII.5.2 Implémentation rapide de la solution particulière 98
VII.6 Lien avec les algorithmes PAST et OPAST 99
VII.7 Poursuite des valeurs et vecteurs propres principaux de la matrice de corrélation 99
VII.8 Simulations numériques 101
VII.8.1 Comparaison de FAPI et TW-FAPI avec d'autres algorithmes existants 101
VII.8.2 Comportement de la méthode API vis-à-vis du RSB et de n et r 106
VII.9 Conclusion 108
VIII Yet Another Subspace Tracker 109
VIII.1 Introduction 110
VIII.2 Principe 110
VIII.3 Implémentation rapide de YAST 111
VIII.3.1 Calcul de W(t) 112
VIII.3.2 Calcul de Z(t) 112
VIII.3.3 Mise à jour de W(t) 114
VIII.3.4 Mise à jour de Z(t) 115
VIII.3.5 Implémentation 115
VIII.4 Simulations numériques 116
VIII.5 Conclusion 117
IX Suivi des pôles et des amplitudes complexes 121
IX.1 Introduction 122
IX.2 Suivi de la matrice spectrale 122
IX.3 Suivi des pôles 123
IX.3.1 Algorithme d'itération orthogonale séquentiel avec décalage 123
IX.3.2 Mise à jour exacte 125
IX.4 Simulations numériques 128
IX.5 Suivi des amplitudes complexes 129
IX.6 Conclusion 130
Partie III Application aux signaux de musique 131
X Analyse à haute résolution des signaux de musique 133
X.1 Introduction 134
X.2 Potentiel des méthodes HR pour l'analyse du signal de musique 134
X.2.1 Trémolo 134
X.2.2 Vibrato 136
X.2.3 Glissando 137
X.2.4 Modulations induites par les pôles multiples 139
X.3 Limites des méthodes HR pour l'analyse du signal de musique 140
X.3.1 Couleur du bruit 141
X.3.2 Importance perceptive relative des composantes sinusoïdales 142
X.3.3 Ordre de modélisation et stabilité numérique 142
X.4 Mise en oeuvre des méthodes HR 143
X.4.1 Techniques d'estimation du signal dans un bruit coloré 143
X.4.2 Introduction d'une connaissance psycho-acoustique 144
X.4.3 Découpage en sous-bandes 144
X.5 Conclusion 145
XI Système complet d'analyse / synthèse 147
XI.1 Introduction 148
XI.2 Décomposition du signal en sous-bandes 148
XI.2.1 Pré-accentuation du signal 148
XI.2.2 Découpage uniforme ou non uniforme 149
XI.2.3 Analyse multi-résolution 150
XI.2.4 Bancs de filtres en cosinus modulés et découpage non uniforme 151
XI.3 Blanchiment du bruit 153
XI.3.1 Blanchiment d'un processus AR 154
XI.3.2 Blanchiment d'un signal comportant des sinusoïdes 154
XI.4 Analyse HR des signaux de sous-bandes 156
XI.5 Traitements applicables dans les sous-bandes 157
XI.5.1 Débruitage du signal et extraction du bruit 157
XI.5.2 Estimation du rythme musical basée sur l'extraction du bruit 159
XI.6 Conclusion 162
Conclusions et perspectives 163
Partie IV Annexes 167
A Résultats de la première partie 169
A.1 Introduction 170
A.2 Modèle PACE 170
A.3 Déterminant de la matrice Pascal-Vandermonde 171
A.4 Propriété d'invariance rotationnelle des matrices de Pascal généralisées 174
A.5 Factorisation de la matrice de données 174
A.6 Caractérisation des matrices de Hankel singulières 175
A.7 Bornes de Cramér-Rao 177
A.7.1 Bornes générales pour le modèle PACE 177
A.7.2 Bornes asymptotiques 181
A.8 Lemmes d'inversion matricielle 182
A.9 Performance des estimateurs 182
A.9.1 Perturbation de l'espace signal 182
A.9.2 Perturbation de la matrice spectrale 183
A.9.3 Perturbation des pôles 184
A.9.4 Perturbation des amplitudes et des phases 185
A.9.5 Performance des estimateurs au premier ordre 186
A.9.6 Performances asymptotiques 188
A.10 Borne d'erreur a priori 190
B Résultats de la deuxième partie 193
B.1 Introduction 194
B.2 Moyenne géométrique des valeurs propres de Rss(t) 194
B.3 Approximation de la méthode des puissances itérées 194
B.4 Algorithme SW-NIC 195
B.5 Mise à jour des pôles 195
B.5.1 Modification de la structure propre par ajout d'une matrice de rang un 195
B.5.2 Modification de la structure propre par ajout d'une matrice de rang faible 197
C Articles 199
Bibliographie 221
Index 229

Statistiques de consultation

Repository Staff Only: edit this item

© ParisTech 2007 - Réalisé par RILK.com - Graphisme par Winch Communication