Clasificación univariante
MESA REDONDA: CASOS PRÁCTICOS Y FUTURO BIG DATA
CLASIFICACIÓN DE VARIABLES CON HERRAMIENTAS INFORMÁTICAS
Se dispone de una base de datos de 14 viviendas vendidas en la comunidad universitaria de San Diego en 1990, que incluye datos sobre el precio de venta y de las características de las viviendas. Son datos de sección cruzada y las variables que se consideran son:
P: Precio de venta en miles de dólares (Rango 199,9 - 505)
F2: Pies cuadrados de área habitable (Rango 1.065 – 3.000)
BEDRMS: Número de habitaciones (Rango 3 - 4)
BATHS: Número de baños (Rango 1,75 - 3)
El análisis de patrones de estas variables muestra que las variables precio y tamaño de la vivienda son de tipo cualitativo continuo. Debido a que la base de datos es pequeña, no hay un patrón de distribución clásico que se ajuste a dichas variables, pero es posible que se pueda aproximar por un patrón de distribución normal.
Para contrastar las siguientes hipótesis:
H0: La distribución de la variable precio sigue un patrón normal.
H1: La distribución de la variable precio no sigue un patrón normal.
Se puede utilizar un software estadístico como R (https://www.r-project.org/) o IBM SPSS (http://www-01.ibm.com/software/es/analytics/spss/) e implementar el test de Kolmogorov-Smirnov ()
Precio | ||
---|---|---|
N | 14 | |
Parámetros normales a,b | Media | 317,493 |
Desviación típica | 88,4982 | |
Diferencias más | Absoluta | 0,243 |
extremas | Positiva | 0,243 |
Negativa | -0,092 | |
Z de Kolmogorov-Smirnov | 0,910 | |
Sig. asintót. (bilateral) | 0,379 |
En este caso, no se puede rechazar la hipótesis H0 que decía que la variable precio tiene un patrón normal. Análogamente, para la variable tamaño de la vivienda se plantea la hipótesis:
H0: La distribución de la variable tamaño sigue un patrón normal.
H1: La distribución de la variable tamaño no sigue un patrón normal.
Se puede utilizar un software estadístico como R (https://www.r-project.org/) o IBM SPSS (http://www-01.ibm.com/software/es/analytics/spss/) e implementar el test de Kolmogorov-Smirnov ()
Tamaño | ||
---|---|---|
N | 14 | |
Parámetros normales a,b | Media | 1.910,33 |
Desviación típica | 577,75 | |
Diferencias más | Absoluta | 0,189 |
extremas | Positiva | 0,189 |
Negativa | -0,098 | |
Z de Kolmogorov-Smirnov | 0,706 | |
Sig. asintót. (bilateral) | 0,701 |
En este caso, no podemos rechazar la hipótesis H0 que decía que la variable tamaño tiene un patrón normal.
Francisco Javier Cervigon Ruckauer
No hay comentarios:
Publicar un comentario