miércoles, 28 de octubre de 2009

SPSS: Regresión lineal

Regresión lineal Aplicaciones-Ejemplos (pincha aquí)

ORDENES REALIZADAS SOBRE EL PROGRAMA SPSS 

   En el lenguaje de órdenes, el análisis de regresión comienza con la orden REGRESSION. A continuación se excluyen los valores perdidos y se indica qué estadísticos calcular. En nuestro ejemplo concreto se piden los coeficientes (COEF), variables excluidas de la regresión (OUTS), el coeficiente de correlación (R), la tabla del análisis de la varianza (ANOVA), el análisis de colinealidad (COLLIN), tolerancia (TOL) y (TPP). Se señalan la variable dependiente (/DEPENDENT), y el método (ENTER) en que se incluyen las variables predictivas. Los residuales se identificaron según la variable x8 (ID).

REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA COLLIN TOL ZPP
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT y
/METHOD=ENTER x1 x2 x3 x4 x5 x6 x7
/RESIDUALS ID( x8 ) .
 
   Posteriormente, se eliminó la multicolinealidad entre las variables, y se seleccionaron los modelo regresión lineal múltiple más adecuados, con las variables tipificadas (Zx1-Zx7) y mediante el método de pasos (/METHOD). Además de las órdenes explicadas anteriormente, en este paso se realizó: el diagrama de puntos para los residuales estandarizados en función de los valores Y tipificados predichos (/SCATTERPLOT), el histograma de los residuales estandarizados (/RESIDUALS HIST) y los gráficos para los residuales tipificados con sus respectivos outliers (/CASEWISE PLOT). Se guardaron las distancias de Cook (COOK) y los valores de Leverage (LEVER) para posteriores análisis gráficos, así como se creó un archivo con los coeficientes otorgados por el análisis (COVB).

DATASET DECLARE coeficientes1.
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA COLLIN TOL
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT y
/METHOD=STEPWISE Zx1 Zx2 Zx3 Zx4 Zx5 Zx6 Zx7
/SCATTERPLOT=(*SDRESID ,*ZPRED )
/RESIDUALS HIST(ZRESID) ID( x8 )
/CASEWISE PLOT(ZRESID) OUTLIERS(2)
/SAVE COOK LEVER
/OUTFILE=COVB(coeficientes1) .
 
   Los gráficos de los residuales estandarizados (ZRE_1) según los valores de las variables tipificadas (Zx3, Zx5 y Zx6), se generaron a partir de las siguientes órdenes. En ellas se especifican las variables incluidas (VARIABLES). A su vez, se especifica que se han de identificar los casos según el valor obtenido en la variable x8.

* Generador de gráficos.
GGRAPH
/GRAPHDATASET NAME="graphdataset" VARIABLES=Zx3 ZRE_1 x8 MISSING=
LISTWISE REPORTMISSING=NO
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: Zx3=col(source(s), name("Zx3"))
DATA: ZRE_1=col(source(s), name("ZRE_1"))
DATA: x8=col(source(s), name("x8"))
GUIDE: axis(dim(1), label("Puntua(x3)"))
GUIDE: axis(dim(2), label("Standardized Residual"))
ELEMENT: point(position(Zx3*ZRE_1), label(x8))
END GPL.
 
* Generador de gráficos.
GGRAPH
/GRAPHDATASET NAME="graphdataset" VARIABLES=Zx5 ZRE_1 x8 MISSING=
LISTWISE REPORTMISSING=NO
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: Zx5=col(source(s), name("Zx5"))
DATA: ZRE_1=col(source(s), name("ZRE_1"))
DATA: x8=col(source(s), name("x8"))
GUIDE: axis(dim(1), label("Puntua(x5)"))
GUIDE: axis(dim(2), label("Standardized Residual"))
ELEMENT: point(position(Zx5*ZRE_1), label(x8))
END GPL.

* Generador de gráficos.
GGRAPH
/GRAPHDATASET NAME="graphdataset" VARIABLES=Zx6 ZRE_1 x8 MISSING=
LISTWISE REPORTMISSING=NO
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: Zx6=col(source(s), name("Zx6"))
DATA: ZRE_1=col(source(s), name("ZRE_1"))
DATA: x8=col(source(s), name("x8"))
GUIDE: axis(dim(1), label("Puntua(x6)"))
GUIDE: axis(dim(2), label("Standardized Residual"))
ELEMENT: point(position(Zx6*ZRE_1), label(x8))
END GPL.

El gráfico distancia de Cook en función de los valores de Leverage, se construyó mediante las siguientes órdenes. Aquí se especifican los datos utilizados (DATA) y la identificación de los casos según la variable x8 (ELEMENT). Se indican los nombres de los ejes del gráfico (GUIDE).

* Generador de gráficos.
GGRAPH
/GRAPHDATASET NAME="graphdataset" VARIABLES=LEV_1 COO_1 x8 MISSING=
LISTWISE REPORTMISSING=NO
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))

DATA: LEV_1=col(source(s), name("LEV_1"))
DATA: COO_1=col(source(s), name("COO_1"))
DATA: x8=col(source(s), name("x8"))
GUIDE: axis(dim(1), label("Centered Leverage Value"))
GUIDE: axis(dim(2), label("Cook's Distance"))
ELEMENT: point(position(LEV_1*COO_1), label(x8))
END GPL.

No hay comentarios:

Publicar un comentario

Libros para descargar (gratis) sobre Estadística Computacional