Fundación BBVA

Multivariate Statistics

Constrained biplots and triplots

Summary

1. Biplots, whether they are based on PCA, CA or LRA, display the data in a reduced dimensional space, usually a plane, with the objective of approximating the original data as closely as possible.

3. Often the data matrix can be regarded as responses to be explained by some explanatory variables that are available. The original biplot dimensions are not necessarily related to these explanatory variables, but an alternative approach constrains the principal axes of the biplot to be specifically related to these variables.

5. The constraint is usually a linear one: the data are projected first into the constrained space which is linearly correlated with the explanatory variables, and then dimension reduction takes place as before.

6. The result of such an analysis with constraints is a triplot, showing the rows and columns of the original data matrix of interest, plus vectors indicating directions for the explanatory variables.

7. The dimensions of the residual, or unconstrained space, may also be of interest. In this space variance or inertia is explained in biplots that are uncorrelated with the explanatory variables.

8. The initial total variance or inertia of the data matrix is decomposed first into a constrained part (linearly related to the explanatory variables) and a residual unconstrained part (uncorrelated with the explanatory variables). Biplots can also be constructed for the unconstrained part of the data.

9. Explanatory variables are often entered stepwise, where the entering variable is the one that explains the most additional variance in the data, and this added variance can be tested for statistical significance.

10. For a single categorical variable as an explanatory variable, where the categories are coded as dummy variables, the constrained analysis is equivalent to a discriminant analysis between the categories.

Biplots y triplots restringidos

Resumen Capítulo 12

2. Los biplots, tanto si se basan en ACP, AC o ARL, muestran los datos en un espacio de dimensión redudida, en general un plano, con el objetivo de aproximarnos lo mejor posible a los datos originales.

4. A menudo podemos ver las matrices como respuestas que se explican a partir de ciertas variables explicativas disponibles. Las dimensiones originales del biplot no tienen por que estar relacionadas con dichas variables explicativas. Una posibilidad es restringir los ejes principales del biplot para que estén explícitamente relacionados con estas variables.

5. En general, realizamos una restriccón lineal: primero proyectamos los datos sobre el espacio restringido correlacionado linealmente con las variables explicativas, y luego reducimos la dimensionalidad como anteriormente.

6. El resultado de este tipo de análisis con restricciones es un triplot. Muestra las filas y las columnas de la matriz de datos original, que es objeto de interés, más los vectores que indican las direcciones de las variables explicativas.

7. Las dimensiones residuales, o del espacio no restringido, también pueden ser de interés. En este espacio se explica la varianza o la inercia mediante biplots no correlacionados con las variables explicativas.

8. Descomponemos la varianza o la inercia total inicial de la matriz de datos en una parte restringida (relacionada linealmente con las variables explicativas) y una parte residual no restringida (no correlacionada con las variables explicativas). También podemos construir biplots a partir de la parte no restringida de los datos.

9. A menudo se introducen las variables explicativas paso a paso. En cada paso introducimos la variable que más varianza explica, pudiéndose contrastar la significación estadística de esta varianza adicional.

10. Cuando tenemos como variable explicativa una sola variable categórica, en la que codificamos las categorías como variables ficticias (dummy), el análisis restringido es equivalente a un análisis discriminante entre las categorías.

[back]