Fundación BBVA

Multivariate Statistics

Discriminant Analysis Biplots

Summary

1. Discriminant analysis is the analysis of group means, or centroids, of a set of multivariate points classified into pre-specified groups.

2. The centroids have masses (weights) equal to the sum of the masses of their members.

3. There is a decomposition of total variance/inertia of the set of points into that of the centroids, the between-group variance/inertia, plus the weighted average variance/inertia within the groups, the within-group variance/inertia. (Inertia is simply the alternative term for variance when the points have different weights; or conversely, variance is the special case of inertia when the weights of all points are equal).

4. The dimension reduction of the centroids follows the same algorithm as the corresponding PCA, LRA or CA/MCA method.

5. Linear discriminant analysis (LDA) is also a dimension-reduction method on a set of centroids, but uses the Mahalanobis distance based on the within-groups covariance matrix to decorrelate the data.

6. In all these variations of DA the contribution biplot displays the centroids in an optimal map of their positions, along with the variables so that the most important (i.e., most discriminating) variables are quickly identified.

Biplots de análisis discriminante

Resumen Capítulo 11

1. El análisis discriminante es el análisis de medias de grupos, o centroides, de un conjunto de puntos multivariantes clasificados en grupos previamente establecidos.

2. Las masas (pesos) de los centroides son iguales a las suma de las masas de sus miembros.

3. Podemos descomponer la varianza/inercia total de los centroides, como la varianza/inercia entre grupos más la media ponderada de la varianza/inercia dentro de los grupos. (La inercia es el término alternativo a varianza cuando los puntos tienen pesos distintos, o recíprocamente, la varianza es un caso especial de inercia, cuando todos los puntos tienen los mismos pesos).

4. La reducción de la dimensionalidad de los centroides sigue el mismo algoritmo que el correspondiente a ACP, ARL o AC/ACM.

5. El análisis discriminante lineal (ADL) también es un método para la reducción de la dimensionalidad de un conjunto de centroides. Para descorrelacionar los datos utiliza la distancia de Mahalanobis basada en la matiz de covarianzas dentro de los grupos.

6. En todas estas variantes del AD, los biplots de contribuciones muestran las posiciones de los centroides y de las variables de manera que fácilmente identificamos las variables más importantes (p.e., las que discriminan mejor).

[back]