Análisis multivariante de datos
ANÁLISIS MULTIVARIANTE DE DATOS: MÉTODOS DE CLASIFICACIÓN Y REDUCCIÓN DE DATOS
CLASIFICACIÓN DE DATOS: CASO PRÁCTICO
La aplicación de clasificación de datos es muy versátil. A continuación se muestran ejemplos de aplicación de los métodos de clasificación.
Análisis de redes sociales
El ser humano es esencialmente un ser social que se relaciona por grupos: familiares, laborales, sentimentales, etc., como consecuencia de un largo proceso en la vida de cada persona. Desde el punto de vista de la sociedad, este proceso se desarrolla a partir de la participación activa de las personas en una red de relaciones sociales. En dicha red, los individuos están interconectados, interactúan y pueden tener más de un tipo de relación entre ellos.
La siguiente red se construye entre los personajes de la novela de Víctor Hugo Les Miserables. Dos personajes están conectados si ellos aparecen en la misma escena. El peso de dicha conexión es el número de apariciones comunes. Dada esta red de personajes, uno de los problemas más estudiados es conocer los grupos/comunidades de esta red (entendiendo por comunidad o grupo como un conjunto de personajes altamente conectados entre ellos y pocos conectados con los demás). Otros problemas interesantes dentro del análisis de redes sociales es detectar líderes, por ejemplo, a partir de diferentes medidas de centralidad.
Figura 15. Detección de comunidades en la relación a los personajes de Los Miserables.
Figura 16. Detección de líderes en la relación a los personajes de Los Miserables.
Clasificación de individuos
Se grupa a los individuos en grupos homogéneos en función de las características que se han medido. Por ejemplo, se pueden clasificar 9 comunidades autónomas según el número de parados en agricultura, industria, construcción, servicios y los que se encuentran buscando empleo.
![Figure 2.3.2.2](https://urjcx.urjc.es/c4x/URJCx/URJCx107/asset/big_f2322__1_.png)
Figura 17. Clasificación de individuos.
REDUCCIÓN DE DATOS: CASO PRÁCTICO
Análisis factorial
En un estudio sobre el nivel de gastos e ingresos de una familia y el nivel de educación de los miembros de la misma, se han medido las siguientes variables en una muestra de 18 individuos: gasto medio mensual del individuo, ingresos medios mensuales del individuo, número de hijos del individuo, edad del individuo, número de años de escolarización del individuo, número de años de escolarización del padre del individuo y número de años de escolarización de la madre del individuo.
Si se seleccionan dos componentes para reducir el número de variables del estudio, se observa que:
Componente | |||
---|---|---|---|
1 | 2 | ||
Gasto mensual | 0,87 | 0,45 | |
Ingresos medios mensuales | 0,715 | 0,594 | |
Número de hijos | -0,189 | -0,86 | |
Variable | Edad | 0,809 | -0,119 |
Número de años de escolarización | -0,548 | 0,729 | |
Número de años de escolarización del padre | -0,813 | 0,477 | |
Número de años de escolarización de la madre | -0,584 | 0,166 |
En la matriz de componentes las variables hijos y edad quedan representadas en una única componente. Pero las variables restantes, al tener puntuaciones parecidas en ambos componentes, no se podrían clasificarlas correctamente.
Análisis de correspondencia
En un estudio sobre 100 madres de recién nacidos en el que se analiza la clase social (alta, media, baja) y el control médico del embarazo (excelente, bueno, malo, nulo), ¿son independientes estas variables o tienen alguna relación?
En la tabla de contingencia se observa una mayor concentración de buenos controles médicos en embarazos de mujeres en clases sociales medias con respecto de las clases sociales baja y alta; un mal control médico concentrado en clases sociales medias y bajas; y un control médico excelente en clases sociales medias y altas.
Control del embarazo | |||||
---|---|---|---|---|---|
Excelente | Bueno | Malo | Nulo | ||
Alta | 8 | 5 | 0 | 0 | |
Clase social | Media | 12 | 26 | 13 | 0 |
Baja | 0 | 9 | 21 | 6 |
El diagrama conjunto de puntos de categoría muestra la proximidad de la clase social alta con un control excelente del embarazo. El medio rural urbano asociado a un mal control del embarazo y una clase social baja, etc.
![Figure 2.3.3.1](https://urjcx.urjc.es/c4x/URJCx/URJCx107/asset/big_f2331.png)
Figura 18. Análisis de correspondencia. Caso práctico.
No hay comentarios:
Publicar un comentario