C'est exact, les valeurs propres sont les coefficients de la matrice D dans ce cas. Pour une matrice carrée de taille 50 c'est une bonne approche mais pour des tailles élevées, c'est à oublier. Pour l'ACP, on ne s'intéresse en fait qu'aux plus grandes valeurs propres (et aux vecteurs propres unitaires associés). La quantité d'information contenue dans l'hyperplan de l'ACP est mesurée par le rapport entre les valeurs propres retenues et la trace de la matrice de covariance (i.e. la somme de toutes les valeurs propres de cette matrice). En général, on se fixe un seuil de tolérance pour ce rapport (typiquement 90%), et on retient les premières plus grandes valeurs propres qui permettent d'y satisfaire. C'est la raison pour laquelle il est souvent plus malin de calculer la plus grande valeur propre, puis la seconde plus grandes, etc, jusqu'à vérifier son seuil de tolérance, plutôt que diagonaliser directement la matrice de covariance et trouver toutes les valeurs propres (algorithme de complexité cubique), d'où la remarque de FR119492.