02 abril 2010

modelo

Come se escribe el modelo para un diseño doblemente en medidas repetidas.

Yij = µ +αi + Ʈj +€ij

Yij= i,j K-enesima observación

µ = parámetro común para los tratamientos, es la media global.

αi = Factor tiempo, efecto del i-esimo nivel del factor, efecto del i-esimo tiempo.

Ʈj = Factor tratamiento, efecto del j-esimo segundo factor, efecto del j-esimo tratamiento.

€ij= componente del error aleatorio.
DATA VACAS;
INPUT TRATAMIENTO $ L1 L3 L5 L7 G1 G3 G5 G7;
DATALINES;
T0 4.59 4.30 4.28 3.80 3.1 3.1 3.2 3.8
TO 4.40 4.10 4.00 3.50 3.2 3.5 3.1 3.2
T0 4.10 4.08 3.80 3.61 3.2 3.9 3.1 3.5
T0 4.30 4.10 3.99 3.70 3.2 3.1 3.3 3.3
T0 4.49 4.30 4.00 3.91 3.1 3.2 3.2 3.5
T0 4.50 4.41 4.28 3.90 3.9 3.2 3.8 3.2
T0 3.91 3.70 3.79 3.40 3.9 3.1 3.2 3.3
T0 4.58 4.10 4.01 3.70 3.8 3.2 3.8 3.2
T0 3.89 3.71 3.70 3.30 3.1 3.2 3.5 3.9
T0 4.18 4.00 3.81 3.50 3.9 3.1 3.8 3.2
T0 4.38 4.10 3.99 3.70 3.1 3.1 3.8 3.1
T0 4.49 4.30 4.00 3.91 3.5 3.2 3.1 3.5
T0 4.50 4.41 4.28 3.90 3.2 3.1 3.3 3.2
T0 3.91 3.70 3.79 3.40 3.5 3.3 3.5 3.2
T0 4.58 4.10 4.01 3.70 3.3 3.2 3.2 3.2
T1 5.09 4.90 4.88 4.60 3.1 3.3 3.9 3.4
T1 4.91 4.88 4.70 4.70 3.9 3.8 3.3 3.8
T1 3.88 4.10 3.89 3.70 3.9 3.5 3.1 3.4
T1 4.81 5.00 4.99 4.70 3.1 3.4 3.8 3.4
T1 4.19 4.30 4.28 4.00 3.1 3.4 3.4 3.7
T1 3.69 3.80 3.78 3.60 3.1 3.6 3.9 3.4
T1 5.01 5.00 4.78 4.60 3.4 3.8 3.5 3.9
T1 4.40 4.59 4.30 4.28 3.8 3.4 3.9 3.4
T1 4.80 4.70 4.80 5.00 3.5 3.3 3.4 3.4
T1 4.79 4.90 4.89 4.80 3.9 3.4 3.1 3.4
T1 4.40 4.59 4.30 4.28 3.7 3.7 3.7 3.3
T1 4.19 4.30 4.28 4.00 3.1 3.7 3.8 3.3
T1 4.08 4.90 4.89 4.80 3.2 3.7 3.8 3.3
T1 3.88 4.10 3.89 3.70 3.5 3.2 3.6 3.9
T1 4.91 4.88 4.70 4.70 3.1 3.3 3.8 3.6
T2 4.78 4.90 5.00 5.09 3.4 3.8 3.3 3.3
T2 4.99 5.20 5.28 5.80 3.8 3.6 3.8 3.3
T2 4.80 5.01 5.19 5.30 3.1 3.6 3.8 3.3
T2 4.59 4.70 4.61 4.90 3.9 3.6 3.5 3.9
T2 4.71 4.90 4.90 5.08 3.1 3.8 3.6 3.5
T2 5.08 5.00 5.21 5.40 3.8 3.9 3.8 3.1
T2 4.09 4.00 4.38 4.40 3.3 3.1 3.2 3.9
T2 4.39 4.61 4.30 4.20 3.8 3.6 3.1 3.2
T2 3.99 4.00 4.18 4.40 3.1 3.3 3.8 3.8
T2 5.08 5.00 5.21 5.40 3.9 3.4 3.3 3.1
T2 4.80 5.01 5.19 5.30 3.6 3.2 3.1 3.6
T2 4.39 4.61 4.30 4.28 3.9 3.2 3.1 3.6
T2 4.09 4.01 4.38 4.40 3.8 3.5 3.9 3.3
T2 4.59 4.70 4.61 4.90 3.2 3.4 3.6 3.4
T2 4.58 4.70 4.59 4.60 3.1 3.5 3.8 3.2
;
PROC GLM DATA=VACAS;
CLASS TRATAMIENTO;
MODEL L1 L3 L5 L7 G1 G3 G5 G7=TRATAMIENTO/NOUNI;
REPEATED RESPONSE 2 IDENTITY, TIME 4;
RUN;

Sistema SAS
Procedimiento GLM
Información del nivel de clase
Clase Niveles Valores
TRATAMIENTO 4 T0 T1 T2 TO

Número de observaciones 45

________________________________________

Sistema SAS
Procedimiento GLM
Análisis de medidas repetidas de la varianza
Información del nivel de medidas repetidas
Variable dependiente L1 L3 L5 L7 G1 G3 G5 G7
Nivel de RESPONSE 1 1 1 1 2 2 2 2
Nivel de TIME 1 2 3 4 1 2 3 4

Criterio de test MANOVA y estadísticos F exactos para la hipótesis de efectos no RESPONSE
H = Tipo III Matriz SSCP para Término indeRESPONSE
Matriz SSCP de error E =

S=1 M=0 N=19
Estadístico Valor F-Valor Num DF Den DF Pr > F
Wilks' Lambda 0.00259775 7678.98 2 40 <.0001
Pillai's Trace 0.99740225 7678.98 2 40 <.0001
Hotelling-Lawley Trace 383.94891638 7678.98 2 40 <.0001
Roy's Greatest Root 383.94891638 7678.98 2 40 <.0001
1. Efecto nulo de la respuesta (son dos respuestas)
Ρ= 0,0001, rechazo la hipótesis nula El efecto no es nulo. (No se comporta la una como la otra.)

Criterio de test MANOVA y aproximaciones para la hipótesis de efectos no RESPONSE*TRATAMIENTO H = Tipo III Matriz SSCP para RESPONSE*TRATAMIENTO Matriz SSCP de error E = S=2 M=0 N=19 Estadístico Valor F-Valor Num DF Den DF Pr > F
Wilks' Lambda 0.41199047 7.44 6 80 <.0001
Pillai's Trace 0.62592470 6.23 6 82 <.0001
Hotelling-Lawley Trace 1.33521139 8.80 6 51.593 <.0001
Roy's Greatest Root 1.26230573 17.25 3 41 <.0001 NOTA:
El estadístico F para la raíz mayor de Roy es un límite superior. NOTA: El estadístico F para Lambda de Wilks es exacto.

2. La interacción nula RESPUESTA *TRATAMIENTO
Ρ= 0,0001, rechaza la hipótesis nula, de que se comporten de igual manera El efecto no es nulo.
Criterio de test MANOVA y estadísticos F exactos para la hipótesis de efectos no RESPONSE*TIME H = Tipo III Matriz SSCP para Término indeRESPONSE*TIME Matriz SSCP de error E = S=1 M=2 N=17 Estadístico Valor F-Valor Num DF Den DF Pr > F
Wilks' Lambda 0.51069240 5.75 6 36 0.0003
Pillai's Trace 0.48930760 5.75 6 36 0.0003
Hotelling-Lawley Trace 0.95812585 5.75 6 36 0.0003
Roy's Greatest Root 0.95812585 5.75 6 36 0.0003


3. Interaccion nula RESPUESTA*TIEMPO
Ρ= 0,0001, rechaza la hipótesis nula, de que se comporten de igual manera
El efecto no es nulo.




Criterio de test MANOVA y aproximaciones para la
hipótesis de efectos no RESPONSE*TIME*TRATAMIENTO
H = Tipo III Matriz SSCP para RESPONSE*TIME*TRATAMIENTO
Matriz SSCP de error E =

S=3 M=1 N=17
Estadístico Valor F-Valor Num DF Den DF Pr > F
Wilks' Lambda 0.13594589 5.83 18 102.31 <.0001
Pillai's Trace 1.18750372 4.15 18 114 <.0001
Hotelling-Lawley Trace 4.17462531 8.13 18 66.222 <.0001
Roy's Greatest Root 3.64550339 23.09 6 38 <.0001
NOTA: El estadístico F para la raíz mayor de Roy es un límite superior. 4. Interacción nula RESPUESTA*TIEMPO*TRATAMIENTO
Ρ= 0,0001, rechaza la hipótesis nula, de que se comporten de igual manera El efecto no es nulo. Todas las interacciones son altamente significativas, no se discuten las tablas de media ________________________________________

Sistema SAS Procedimiento GLM Análisis de medidas repetidas de la varianza Tests de hipótesis para efectos Between Subjects Fuente DF Tipo III SS Cuadrado de la media F-Valor Pr > F
TRATAMIENTO 3 12.05784395 4.01928132 14.74 <.0001 Error 41 11.17983827 0.27267898

ANALISIS DE VARIANZA MULTIVARIANTE PARA EL DISEÑO EN MEDIDAS REPETIDAS USANDO COMO RESPUESTA LA MEDICION PARA LECHE. DATA VACAS; INPUT TRATAMIENTO $ L1 L3 L5 L7 G1 G3 G5 G7; DATALINES; T0 4.59 4.30 4.28 3.80 3.1 3.1 3.2 3.8 TO 4.40 4.10 4.00 3.50 3.2 3.5 3.1 3.2 T0 4.10 4.08 3.80 3.61 3.2 3.9 3.1 3.5 T0 4.30 4.10 3.99 3.70 3.2 3.1 3.3 3.3 T0 4.49 4.30 4.00 3.91 3.1 3.2 3.2 3.5 T0 4.50 4.41 4.28 3.90 3.9 3.2 3.8 3.2 T0 3.91 3.70 3.79 3.40 3.9 3.1 3.2 3.3 T0 4.58 4.10 4.01 3.70 3.8 3.2 3.8 3.2 T0 3.89 3.71 3.70 3.30 3.1 3.2 3.5 3.9 T0 4.18 4.00 3.81 3.50 3.9 3.1 3.8 3.2 T0 4.38 4.10 3.99 3.70 3.1 3.1 3.8 3.1 T0 4.49 4.30 4.00 3.91 3.5 3.2 3.1 3.5 T0 4.50 4.41 4.28 3.90 3.2 3.1 3.3 3.2 T0 3.91 3.70 3.79 3.40 3.5 3.3 3.5 3.2 T0 4.58 4.10 4.01 3.70 3.3 3.2 3.2 3.2 T1 5.09 4.90 4.88 4.60 3.1 3.3 3.9 3.4 T1 4.91 4.88 4.70 4.70 3.9 3.8 3.3 3.8 T1 3.88 4.10 3.89 3.70 3.9 3.5 3.1 3.4 T1 4.81 5.00 4.99 4.70 3.1 3.4 3.8 3.4 T1 4.19 4.30 4.28 4.00 3.1 3.4 3.4 3.7 T1 3.69 3.80 3.78 3.60 3.1 3.6 3.9 3.4 T1 5.01 5.00 4.78 4.60 3.4 3.8 3.5 3.9 T1 4.40 4.59 4.30 4.28 3.8 3.4 3.9 3.4 T1 4.80 4.70 4.80 5.00 3.5 3.3 3.4 3.4 T1 4.79 4.90 4.89 4.80 3.9 3.4 3.1 3.4 T1 4.40 4.59 4.30 4.28 3.7 3.7 3.7 3.3 T1 4.19 4.30 4.28 4.00 3.1 3.7 3.8 3.3 T1 4.08 4.90 4.89 4.80 3.2 3.7 3.8 3.3 T1 3.88 4.10 3.89 3.70 3.5 3.2 3.6 3.9 T1 4.91 4.88 4.70 4.70 3.1 3.3 3.8 3.6 T2 4.78 4.90 5.00 5.09 3.4 3.8 3.3 3.3 T2 4.99 5.20 5.28 5.80 3.8 3.6 3.8 3.3 T2 4.80 5.01 5.19 5.30 3.1 3.6 3.8 3.3 T2 4.59 4.70 4.61 4.90 3.9 3.6 3.5 3.9 T2 4.71 4.90 4.90 5.08 3.1 3.8 3.6 3.5 T2 5.08 5.00 5.21 5.40 3.8 3.9 3.8 3.1 T2 4.09 4.00 4.38 4.40 3.3 3.1 3.2 3.9 T2 4.39 4.61 4.30 4.20 3.8 3.6 3.1 3.2 T2 3.99 4.00 4.18 4.40 3.1 3.3 3.8 3.8 T2 5.08 5.00 5.21 5.40 3.9 3.4 3.3 3.1 T2 4.80 5.01 5.19 5.30 3.6 3.2 3.1 3.6 T2 4.39 4.61 4.30 4.28 3.9 3.2 3.1 3.6 T2 4.09 4.01 4.38 4.40 3.8 3.5 3.9 3.3 T2 4.59 4.70 4.61 4.90 3.2 3.4 3.6 3.4 T2 4.58 4.70 4.59 4.60 3.1 3.5 3.8 3.2 ; *PROC GLM DATA=VACAS; *CLASS TRATAMIENTO; *MODEL L1 L3 L5 L7 G1 G3 G5 G7=TRATAMIENTO/NOUNI; *REPEATED RESPONSE 2 IDENTITY, TIME 4; *RUN; PROC GLM DATA=VACAS; CLASS TRATAMIENTO; MODEL L1 L3 L5 L7 =TRATAMIENTO/NOUNI; REPEATED TIME 4/SUMMARY; RUN; Sistema SAS Procedimiento GLM Información del nivel de clase Clase Niveles Valores TRATAMIENTO 4 T0 T1 T2 TO Número de observaciones 45 ________________________________________

Sistema SAS Procedimiento GLM Análisis de medidas repetidas de la varianza Información del nivel de medidas repetidas Variable dependiente L1 L3 L5 L7 Nivel de TIME 1 2 3 4
Criterio de test MANOVA y estadísticos F exactos para la hipótesis de efectos no TIME H = Tipo III Matriz SSCP para Término indeTIME Matriz SSCP de error E = S=1 M=0.5 N=18.5 Estadístico Valor F-Valor Num DF Den DF Pr > F
Wilks' Lambda 0.52448513 11.79 3 39 <.0001
Pillai's Trace 0.47551487 11.79 3 39 <.0001
Hotelling-Lawley Trace 0.90663176 11.79 3 39 <.0001
Roy's Greatest Root 0.90663176 11.79 3 39 <.0001
El efecto tiempo es altamente significativo con respecto a las respuestas lo cual se rechaza la hipótesis nula que se comporta de igual manera en el tiempo.
Criterio de test MANOVA y aproximaciones para la hipótesis de efectos no TIME*TRATAMIENTO H = Tipo III Matriz SSCP para TIME*TRATAMIENTO Matriz SSCP de error E = S=3 M=-0.5 N=18.5 Estadístico Valor F-Valor Num DF Den DF Pr > F
Wilks' Lambda 0.16019707 11.85 9 95.066 <.0001
Pillai's Trace 1.04524319 7.31 9 123 <.0001
Hotelling-Lawley Trace 3.96875894 16.90 9 58.185 <.0001
Roy's Greatest Root 3.62008386 49.47 3 41 <.0001
NOTA: El estadístico F para la raíz mayor de Roy es un límite superior.

La interacción TIEMPO*TRATAMIENTO P= 0,0001 altamente significativa se rechaza la Ha. existiendo diferencias asociados entre el tratamiento y el tiempo para la producción de leche. ________________________________________

Sistema SAS Procedimiento GLM Análisis de medidas repetidas de la varianza Tests de hipótesis para efectos Between Subjects Fuente DF Tipo III SS Cuadrado de la media F-Valor Pr > F
TRATAMIENTO 3 16.00180218 5.33393406 10.58 <.0001 Error 41 20.66679560 0.50406819

Sistema SAS Procedimiento GLM Análisis de medidas repetidas de la varianza Test de hipótesis univariante para efectos Within Subject Fuente DF Tipo III SS Cuadrado de la media F-Valor Pr > F Adj Pr > F
G - G H - F
TIME 3 0.82806366 0.27602122 16.28 <.0001 <.0001 <.0001
TIME*TRATAMIENTO 9 3.82623925 0.42513769 25.08 <.0001 <.0001 <.0001 Error(TIME) 123 2.08481631 0.01694973 Greenhouse-Geisser Epsilon 0.7750 Huynh-Feldt Epsilon 0.8845 ________________________________________ Sistema SAS Procedimiento GLM Análisis de medidas repetidas de la varianza Análisis de varianza de las variables de contraste TIME_N representa el contraste entre el nivel n de TIME y de último Variable de contraste: TIME_1 Fuente DF Tipo III SS Cuadrado de la media F-Valor Pr > F

Mean 1 1.50241297 1.50241297 28.88 <.0001
TRATAMIENTO 3 7.00123159 2.33374386 44.85 <.0001 Error 41 2.13326619 0.05203088 Variable de contraste: TIME_2 Fuente DF Tipo III SS Cuadrado de la media F-Valor Pr > F
Mean 1 0.90700227 0.90700227 22.98 <.0001
TRATAMIENTO 3 3.23185778 1.07728593 27.29 <.0001 Error 41 1.61857333 0.03947740 Variable de contraste: TIME_3 Fuente DF Tipo III SS Cuadrado de la media F-Valor Pr > F
Mean 1 0.52040351 0.52040351 27.28 <.0001
TRATAMIENTO 3 1.64437206 0.54812402 28.73 <.0001 Error 41 0.78221905 0.01907851


ANALISIS DE VARIANZA MULTIVARIANTE PARA EL DISEÑO EN MEDIDAS REPETIDAS USANDO COMO RESPUESTA LA MEDICION PARA GRASA. DATA VACAS; INPUT TRATAMIENTO $ L1 L3 L5 L7 G1 G3 G5 G7; DATALINES; T0 4.59 4.30 4.28 3.80 3.1 3.1 3.2 3.8 TO 4.40 4.10 4.00 3.50 3.2 3.5 3.1 3.2 T0 4.10 4.08 3.80 3.61 3.2 3.9 3.1 3.5 T0 4.30 4.10 3.99 3.70 3.2 3.1 3.3 3.3 T0 4.49 4.30 4.00 3.91 3.1 3.2 3.2 3.5 T0 4.50 4.41 4.28 3.90 3.9 3.2 3.8 3.2 T0 3.91 3.70 3.79 3.40 3.9 3.1 3.2 3.3 T0 4.58 4.10 4.01 3.70 3.8 3.2 3.8 3.2 T0 3.89 3.71 3.70 3.30 3.1 3.2 3.5 3.9 T0 4.18 4.00 3.81 3.50 3.9 3.1 3.8 3.2 T0 4.38 4.10 3.99 3.70 3.1 3.1 3.8 3.1 T0 4.49 4.30 4.00 3.91 3.5 3.2 3.1 3.5 T0 4.50 4.41 4.28 3.90 3.2 3.1 3.3 3.2 T0 3.91 3.70 3.79 3.40 3.5 3.3 3.5 3.2 T0 4.58 4.10 4.01 3.70 3.3 3.2 3.2 3.2 T1 5.09 4.90 4.88 4.60 3.1 3.3 3.9 3.4 T1 4.91 4.88 4.70 4.70 3.9 3.8 3.3 3.8 T1 3.88 4.10 3.89 3.70 3.9 3.5 3.1 3.4 T1 4.81 5.00 4.99 4.70 3.1 3.4 3.8 3.4 T1 4.19 4.30 4.28 4.00 3.1 3.4 3.4 3.7 T1 3.69 3.80 3.78 3.60 3.1 3.6 3.9 3.4 T1 5.01 5.00 4.78 4.60 3.4 3.8 3.5 3.9 T1 4.40 4.59 4.30 4.28 3.8 3.4 3.9 3.4 T1 4.80 4.70 4.80 5.00 3.5 3.3 3.4 3.4 T1 4.79 4.90 4.89 4.80 3.9 3.4 3.1 3.4 T1 4.40 4.59 4.30 4.28 3.7 3.7 3.7 3.3 T1 4.19 4.30 4.28 4.00 3.1 3.7 3.8 3.3 T1 4.08 4.90 4.89 4.80 3.2 3.7 3.8 3.3 T1 3.88 4.10 3.89 3.70 3.5 3.2 3.6 3.9 T1 4.91 4.88 4.70 4.70 3.1 3.3 3.8 3.6 T2 4.78 4.90 5.00 5.09 3.4 3.8 3.3 3.3 T2 4.99 5.20 5.28 5.80 3.8 3.6 3.8 3.3 T2 4.80 5.01 5.19 5.30 3.1 3.6 3.8 3.3 T2 4.59 4.70 4.61 4.90 3.9 3.6 3.5 3.9 T2 4.71 4.90 4.90 5.08 3.1 3.8 3.6 3.5 T2 5.08 5.00 5.21 5.40 3.8 3.9 3.8 3.1 T2 4.09 4.00 4.38 4.40 3.3 3.1 3.2 3.9 T2 4.39 4.61 4.30 4.20 3.8 3.6 3.1 3.2 T2 3.99 4.00 4.18 4.40 3.1 3.3 3.8 3.8 T2 5.08 5.00 5.21 5.40 3.9 3.4 3.3 3.1 T2 4.80 5.01 5.19 5.30 3.6 3.2 3.1 3.6 T2 4.39 4.61 4.30 4.28 3.9 3.2 3.1 3.6 T2 4.09 4.01 4.38 4.40 3.8 3.5 3.9 3.3 T2 4.59 4.70 4.61 4.90 3.2 3.4 3.6 3.4 T2 4.58 4.70 4.59 4.60 3.1 3.5 3.8 3.2 ;
*PROC GLM DATA=VACAS;
*CLASS TRATAMIENTO;
*MODEL L1 L3 L5 L7 G1 G3 G5 G7=TRATAMIENTO/NOUNI;
*REPEATED RESPONSE 2 IDENTITY, TIME 4;
*RUN; PROC GLM DATA=VACAS; CLASS TRATAMIENTO; MODEL G1 G3 G5 G7 =TRATAMIENTO/NOUNI; REPEATED TIME 4/SUMMARY; RUN;

Sistema SAS Procedimiento GLM Información del nivel de clase Clase Niveles Valores TRATAMIENTO 4 T0 T1 T2 TO Número de observaciones 45 ________________________________________ Sistema SAS Procedimiento GLM Análisis de medidas repetidas de la varianza Información del nivel de medidas repetidas Variable dependiente G1 G3 G5 G7 Nivel de TIME 1 2 3 4 Criterio de test MANOVA y estadísticos F exactos para la hipótesis de efectos no TIME H = Tipo III Matriz SSCP para Término indeTIME Matriz SSCP de error E = S=1 M=0.5 N=18.5 Estadístico Valor F-Valor Num DF Den DF Pr > F
Wilks' Lambda 0.99173708 0.11 3 39 0.9547
Pillai's Trace 0.00826292 0.11 3 39 0.9547
Hotelling-Lawley Trace 0.00833176 0.11 3 39 0.9547
Roy's Greatest Root 0.00833176 0.11 3 39 0.9547




El efecto nulo del TIEMPO
P= 0,9547 no significativo se acepta la Ha. no existiendo diferencias en el tiempo para el % de grasa en leche.

Criterio de test MANOVA y aproximaciones para la hipótesis de efectos no TIME*TRATAMIENTO
H = Tipo III Matriz SSCP para TIME*TRATAMIENTO
Matriz SSCP de error E =

S=3 M=-0.5 N=18.5
Estadístico Valor F-Valor Num DF Den DF Pr > F
Wilks' Lambda 0.81398910 0.93 9 95.066 0.5012
Pillai's Trace 0.19237133 0.94 9 123 0.4963
Hotelling-Lawley Trace 0.22073335 0.94 9 58.185 0.4984
Roy's Greatest Root 0.17813088 2.43 3 41 0.0785
NOTA: El estadístico F para la raíz mayor de Roy es un límite superior.
La interaccion nula TIEMPO*TRATAMIENTO
P= 0,50 no significativo se acepta la Ha. no existiendo diferencias en el tiempo para el % de grasa en leche.

Según el análisis en medidas repetidas la interacción tiempo*tratamiento no presenta diferencias significativas a la respuesta % de grasa; igual el tiempo y el tratamiento con respecto al porcentaje de grasa en la leche.
Se recomienda usar el tratamiento 1 como mayor pructor de leche independiente del porcentaje de grasa, ya que el efecto tiempo y tratamiento no es significativo segun el analisis de medidas repetidas para grasa.
________________________________________

Sistema SAS
Procedimiento GLM
Análisis de medidas repetidas de la varianza
Tests de hipótesis para efectos Between Subjects
Fuente DF Tipo III SS Cuadrado de la media F-Valor Pr > F
TRATAMIENTO 3 1.00801190 0.33600397 7.47 0.0004
Error 41 1.84398810 0.04497532

________________________________________

Sistema SAS
Procedimiento GLM
Análisis de medidas repetidas de la varianza
Test de hipótesis univariante para efectos Within Subject
Fuente DF Tipo III SS Cuadrado de la media F-Valor Pr > F Adj Pr > F
G - G H - F
TIME 3 0.02033366 0.00677789 0.08 0.9713 0.9612 0.9713
TIME*TRATAMIENTO 9 0.55819444 0.06202160 0.72 0.6871 0.6718 0.6871
Error(TIME) 123 10.55291667 0.08579607

Greenhouse-Geisser Epsilon 0.8947
Huynh-Feldt Epsilon 1.0334

Sistema SAS
Procedimiento GLM
Análisis de medidas repetidas de la varianza
Análisis de varianza de las variables de contraste

TIME_N representa el contraste entre el nivel n de TIME y de último
Variable de contraste: TIME_1
Fuente DF Tipo III SS Cuadrado de la media F-Valor Pr > F
Mean 1 0.00266535 0.00266535 0.01 0.9093
TRATAMIENTO 3 0.22944444 0.07648148 0.38 0.7700
Error 41 8.31633333 0.20283740
Variable de contraste: TIME_2

Fuente DF Tipo III SS Cuadrado de la media F-Valor Pr > F
Mean 1 0.03660474 0.03660474 0.29 0.5911
TRATAMIENTO 3 0.45433333 0.15144444 1.21 0.3170
Error 41 5.11766667 0.12482114
Variable de contraste: TIME_3

Fuente DF Tipo III SS Cuadrado de la media F-Valor Pr > F
Mean 1 0.01262582 0.01262582 0.07 0.7966
TRATAMIENTO 3 0.04411111 0.01470370 0.08 0.9713
Error 41 7.68833333 0.18752033

ANALISIS MULTIVARIANTE DE COVARIANZA

En LOS DATOS se presenta la descripción de los niveles de los factores. Se muestra las 4 medidas para producción de leche y el porcentaje de grasa medidos quincenalmente. Además se muestran los tres (3) niveles del factor tratamiento o factor entre sujetos, donde T0 es el grupo control o testigo, T1 es el tratamiento con alimento concentrado “vaca lechera”, suministrado a razón de 2 kilogramos por animal por día y T2 es el tratamiento suplemento artesanal a base de maíz y frijol a razón de 2 kilogramos por animal por día. Es preciso calcular un par de variables que serán utilizadas en los diseños que no son en medidas repetidas. Estas se llamarán promedio de leche y promedio porcentual de grasa. La idea es recomendar en todos los casos el mejor tratamiento. Cuando sea necesario justificar los análisis univariantes es preciso hacerlo


ANALISIS MULTIVARIANTE DE COVARIANZA.USANDO COMO COVARIANZA EL NÚMERO DE PARTOS.
Factores inter-sujetos
N
TRATAMIENTO 0 15
1 15
2 15

Estadísticos descriptivos

TRATAMIENTO Media Desv. típ. N
PROML 0 4,0147 ,20983 15
1 4,4813 ,41533 15
2 4,7360 ,39337 15
Total 4,4107 ,45757 45
PROMG 0 3,3480 ,11053 15
1 3,5113 ,09334 15
2 3,4907 ,11386 15
Total 3,4500 ,12719 45

Prueba de Box sobre la igualdad de las matrices de covarianzas(a)

M de Box 8,912
F 1,383
gl1 6
gl2 43964,308
Significación ,217
Contrasta la hipótesis nula de que las matrices de covarianza observadas de las variables dependientes son iguales en todos los grupos.
a Diseño: Intersección+TRATAMIENTO+NP

Contrastes multivariados(c)

Efecto Valor F Gl de la hipótesis Gl del error Significación
Intersección Traza de Pillai ,994 3286,949(a) 2,000 40,000 ,000
Lambda de Wilks ,006 3286,949(a) 2,000 40,000 ,000
Traza de Hotelling 164,347 3286,949(a) 2,000 40,000 ,000
Raíz mayor de Roy 164,347 3286,949(a) 2,000 40,000 ,000
TRATAMIENTO Traza de Pillai ,616 9,127 4,000 82,000 ,000
Lambda de Wilks ,418 10,952(a) 4,000 80,000 ,000
Traza de Hotelling 1,314 12,816 4,000 78,000 ,000
Raíz mayor de Roy 1,250 25,625(b) 2,000 41,000 ,000
NP Traza de Pillai ,017 ,338(a) 2,000 40,000 ,715
Lambda de Wilks ,983 ,338(a) 2,000 40,000 ,715
Traza de Hotelling ,017 ,338(a) 2,000 40,000 ,715
Raíz mayor de Roy ,017 ,338(a) 2,000 40,000 ,715
a Estadístico exacto
b El estadístico es un límite superior para la F el cual ofrece un límite inferior para el nivel de significación.
c Diseño: Intersección+TRATAMIENTO+NP




RESULTANDO NO SIGNIFICATIVO (DEL 71 %) EL NUMERO DE PARTOS COMO COVARIABLE, POR LO TANTO SE REALIZARA UN ANALISIS MULTIVARIANTE DE VARIANZA, USANDO COMO VARIABLES RESPUESTA EL PROMEDIO DE LECHE Y PROMEDIO DE GRASA, Y COMO FACTOR LOS 3 TRATAMIENTOS.


Contraste de Levene sobre la igualdad de las varianzas error(a)

F gl1 gl2 Significación
PROML 5,673 2 42 ,007
PROMG ,544 2 42 ,585
Contrasta la hipótesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos.
a Diseño: Intersección+TRATAMIENTO+NP

Pruebas de los efectos inter-sujetos

Fuente Variable dependiente Suma de cuadrados tipo III Gl Media cuadrática F Significación
Modelo corregido
PROML 4,068(a) 3 1,356 10,808 ,000
PROMG 240(b) 3 ,080 6,956 ,001
Intersección PROML 110,345 1 110,345 879 ,457 ,000
PROMG 65,556 1 65,556 5698,053 ,000
TRATAMIENTO PROML 3,981 2 1,991 15,865 ,000
PROMG ,236 2 ,118 10,273 ,000
NP PROML ,053 1 ,053 ,426 ,518
PROMG ,003 1 ,003 ,244 ,624
Error PROML 5,144 41 ,125
PROMG ,472 41 ,012
Total PROML 884,642 45
PROMG 536,324 45
Total corregida PROML 9,212 44
PROMG ,712 44
a R cuadrado = ,442 (R cuadrado corregida = ,401)
b R cuadrado = ,337 (R cuadrado corregida = ,289)

En el cuadro anterior se observa que no existen diferencias significativas en cuanto al número de partos y las diferentes respuestas, pero si diferencias altamente significativas de los tratamientos y las respuestas, por lo tanto se rechaza la hipótesis nula de que los tres tratamientos se comportan de igual manera con respecto a las respuestas.

Matriz SCPC inter-sujetos

PROML PROMG
Hipótesis
Intersección PROML 110,345 85,051
PROMG 85,051 65,556

TRATAMIENTO PROML 3,981 ,864
PROMG ,864 ,236
NP PROML ,053 ,012
PROMG ,012 ,003
Error PROML 5,144 -,053
PROMG -,053 ,472
Basado en la suma de cuadrados tipo III

Matriz SCPC residual

PROML PROMG
Suma de cuadrados y productos cruzados PROML 5,144 -,053
PROMG -,053 ,472
Covarianza PROML ,125 -,001
PROMG -,001 ,012
Correlación PROML 1,000 -,034
PROMG -,034 1,000
Basado en la suma de cuadrados tipo III

En el cuadro anterior se observa que las correlaciones entre las dos respuestas son negativas queriendo decir que a medida que aumenta la producción de leche disminuye el porcentaje de grasa.
FALTA DE AJUSTE
Contrastes multivariados

Variables dependientes Valor F Gl de la hipótesis Gl del error Significación
PROML, PROMG
Traza de Pillai ,288 1,210 10,000 72,000 ,299
Lambda de Wilks ,726 1,213(a) 10,000 70,000 ,298
Traza de Hotelling ,357 1,215 10,000 68,000 ,298
Raíz mayor de Roy ,290 2,087(b) 5,000 36,000 ,090

PROML Traza de Pillai ,076 ,596(a) 5,000 36,000 ,703
Lambda de Wilks ,924 ,596(a) 5,000 36,000 ,703
Traza de Hotelling ,083 ,596(a) 5,000 36,000 ,703
Raíz mayor de Roy ,083 ,596(a) 5,000 36,000 ,703

PROMG Traza de Pillai ,208 1,893(a) 5,000 36,000 ,120
Lambda de Wilks ,792 1,893(a) 5,000 36,000 ,120
Traza de Hotelling ,263 1,893(a) 5,000 36,000 ,120
Raíz mayor de Roy ,263 1,893(a) 5,000 36,000 ,120
a Estadístico exacto
b El estadístico es un límite superior para la F el cual ofrece un límite inferior para el nivel de significación.

Dado que no se obtuvo que la covariable numero de partos no fue significativa se realizara un análisis multivariante de varianza, sin covariable.

ANALISIS MULTIVARIANTE DE VARIANZA USANDO SOLO COMO VARIABLES RESPUESTAS EL PROMEDIO DE LECHE Y EL PROMEDIO DEL % DE GRASA.


Factores inter-sujetos

N
TRATAMIENTO
0 15
1 15
2 15


Estadísticos descriptivos

TRATAMIENTO Media Desv. típ. N
PROML 0 4,0147 ,20983 15
1 4,4813 ,41533 15
2 4,7360 ,39337 15
Total 4,4107 ,45757 45
PROMG 0 3,3480 ,11053 15
1 3,5113 ,09334 15
2 3,4907 ,11386 15
Total 3,4500 ,12719 45



Prueba de Box sobre la igualdad de las matrices de covarianzas(a)

M de Box 8,912
F 1,383
gl1 6
gl2 43964,308
Significación ,217
Contrasta la hipótesis nula de que las matrices de covarianza observadas de las variables dependientes son iguales en todos los grupos.
a Diseño: Intersección+TRATAMIENTO

Según la prueba de box no es significativa las covarianza.

Contrastes multivariados(c)

Efecto Valor F Gl de la hipótesis Gl del error Significación
Intersección
Traza de Pillai ,999 27077,187(a) 2,000 41,000 ,000
Lambda de Wilks ,001 27077,187(a) 2,000 41,000 ,000
Traza de Hotelling 1320,838 27077,187(a) 2,000 41,000 ,000
Raíz mayor de Roy 1320,838 27077,187(a) 2,000 41,000 ,000
TRATAMIENTO
Traza de Pillai ,614 9,298 4,000 84,000 ,000
Lambda de Wilks ,420 11,140(a) 4,000 82,000 ,000
Traza de Hotelling 1,302 13,022 4,000 80,000 ,000
Raíz mayor de Roy 1,238 25,992(b) 2,000 42,000 ,000
a Estadístico exacto
b El estadístico es un límite superior para la F el cual ofrece un límite inferior para el nivel de significación.
c Diseño: Intersección+TRATAMIENTO


Contraste de Levene sobre la igualdad de las varianzas error(a)

F gl1 gl2 Significación
PROML 6,017 2 42 ,005
PROMG ,539 2 42 ,587
Contrasta la hipótesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos.
a Diseño: Intersección+TRATAMIENTO


Pruebas de los efectos inter-sujetos

Fuente Variabdepen Suma de cuads tipo III GlMedcuadrá F Significación
Modelo corregido
PROML 4,015(a) 2 2,007 16,221 ,000
PROMG ,237(b) 2 ,119 10,502 ,000
Intersección
PROML 875,429 1 875,429 7073,893 ,000
PROMG 535,613 1 535,613 47408,660 ,000
TRATAMIENTO PROML 4,015 2 2,007 16,221 ,000
PROMG ,237 2 ,119 10,502 ,000
Error PROML 5,198 42 ,124
PROMG ,475 42 ,011
Total PROML 884,642 45
PROMG 536,324 45
Total corregida
PROML 9,212 44
PROMG ,712 44
a R cuadrado = ,436 (R cuadrado corregida = ,409)
b R cuadrado = ,333 (R cuadrado corregida = ,302)


Matriz SCPC inter-sujetos

PROML PROMG
Hipótesis
Intersección PROML 875,429 684,756
PROMG 684,756 535,613

TRATAMIENTO PROML 4,015 ,869
PROMG ,869 ,237
Error PROML 5,198 -,041
PROMG -,041 ,475
Basado en la suma de cuadrados tipo III




Falta de ajuste


Contrastes multivariados

Variables dependientes Valor F Gl de la hipót Gl del error Significación
PROML, PROMG
Traza de Pillai ,000 . ,000 ,000 .
Lambda de Wilks 1,000 . ,000 41,500 .
Traza de Hotelling ,000 . ,000 2,000 .
Raíz mayor de Roy ,000 ,000(a) 2,000 40,000 1,000
PROML Traza de Pillai ,000 . ,000 ,000 .
Lambda de Wilks 1,000 . ,000 42,000 .
Traza de Hotelling ,000 . ,000 2,000 .
Raíz mayor de Roy ,000 ,000(a) 1,000 41,000 1,000
PROMG Traza de Pillai ,000 . ,000 ,000 .
Lambda de Wilks 1,000 . ,000 42,000 .
Traza de Hotelling ,000 . ,000 2,000 .
Raíz mayor de Roy ,000 ,000(a) 1,000 41,000 1,000
a Estadístico exacto




Contrastes univariados

Variable dependiente Fuente Suma de cuadr Gl Media cuadrF Significación
PROML Falta de ajuste ,000 0 . . .
Error puro 5,198 42 ,124
PROMG Falta de ajuste ,000 0 . . .
Error puro ,475 42 ,011


Matriz SCPC

PROML PROMG
Falta de ajuste PROML ,000 ,000
PROMG ,000 ,000
Error puro PROML 5,198 -,041
PROMG -,041 ,475


Medias marginales estimadas

1. Media global



Coeficientes de transformación (matriz M)

Variable dependiente PROML PROMG
PROML 1 0
PROMG 0 1

Estimaciones

Variable dependiente Media Error típ. Intervalo de confianza al 95%.
Límite inferior Límite superior Límite inferior Límite superior
PROML 4,411 ,052 4,305 4,516
PROMG 3,450 ,016 3,418 3,482



2. TRATAMIENTO

Coeficientes de transformación (matriz M)

Variable dependiente PROML PROMG
PROML 1 0
PROMG 0 1


Estimaciones

Variable dependiente TRATAMIENTO Media Error típ. Intervalo de confianza al 95%.
Límite inferior Límite superior Límite inferior Límite superior
PROML 0 4,015 ,091 3,831 4,198
1 4,481 ,091 4,298 4,665
2 4,736 ,091 4,553 4,919
PROMG 0 3,348 ,027 3,293 3,403
1 3,511 ,027 3,456 3,567
2 3,491 ,027 3,435 3,546

Pruebas post hoc
TRATAMIENTO
Comparaciones múltiples


Bonferroni
Variable dependiente (I) TRATANTO (J) TRATAMIENTO Intervalo de conf95%
Dif.entre
medias (I-J) error Signifn .Límite inf.Límite sup

PROML 0 1 -,4667(*) ,12845 ,002 -,7870 -,1463
2 -,7213(*) ,12845 ,000 -1,0417 -,4010
1 0 ,4667(*) ,12845 ,002 ,1463 ,7870
2 -,2547 ,12845 ,162 -,5750 ,0657
2 0 ,7213(*) ,12845 ,000 ,4010 1,0417
1 ,2547 ,12845 ,162 -,0657 ,5750
PROMG 0 1 -,1633(*) ,03881 ,000 -,2601 -,0665
2 -,1427(*) ,03881 ,002 -,2395 -,0459
1 0 ,1633(*) ,03881 ,000 ,0665 ,2601
2 ,0207 ,03881 1,000 -,0761 ,1175
2 0 ,1427(*) ,03881 ,002 ,0459 ,2395
1 -,0207 ,03881 1,000 -,1175 ,0761
Basado en las medias observadas.
* La diferencia de medias es significativa al nivel ,05.


Al tener la interacción significativa no se discuten las medias por separado. Se puede analizar que en el cuadro de bonferroni donde se comparan los diferentes tratamientos se aprecia que el tratamiento T0 con respecto a los demás tratamientos presenta diferencias altamente significativos, mientras que las diferencias entres los tratamientos T1 y T2 no son altamente significativas estadísticamente. Pudiéndose recomendar cualquiera de los dos tratamientos T1 y T2, en todo caso el que aporta mayor producción de leche es el tratamiento T2 indiferentemente del porcentaje de grasa, ya que estadísticamente no son significativo.

01 abril 2010

Mi Coeficiente  es negativo!

Mi Coeficiente  es negativo!
Por David P. Nichols
Principal Apoyo Estadístico y Gerente de Apoyo de Estadística
From SPSS Keywords, Number 68, 1999
Una característica esencial de la definición de un coeficiente de fiabilidad es que, como proporción de la varianza, que en teoría debería oscilar entre 0 y 1 en valor. Desafortunadamente, las definiciones dadas aquí son observables verdadera y las calificaciones de error, y cuando pasamos de la teoría a la práctica, nuestros intentos para estimar la fiabilidad puede producir resultados inesperados. En la práctica, los posibles valores de las estimaciones de la fiabilidad de la gama de -  a 1, en lugar de 0 a 1.
Para ver que este es el caso, vamos a ver la fórmula más comúnmente citada para el cálculo del coeficiente , el coeficiente de fiabilidad más populares. Esa fórmula es
 = [k/(k-1)][1 - (i2/X2)]
donde k es el número de artículos,   i2 es la suma de las varianzas elemento individual asumido todos los artículos de k, y  X2 es la varianza de la escala. Dado que el término en el primer conjunto de corchetes es siempre positivo,  será negativo si y sólo si,i2/X2 > 1,
o si y sólo si
i2 > X2.
En otras palabras,  será negativo cuando la suma de las varianzas elemento individual es mayor que la varianza de la escala.
Puesto que la varianza de la suma de un conjunto de variables aleatorias es igual a la suma de las diferencias individuales más dos veces la suma de sus covarianzas (véase, por ejemplo, Hays (1981), Apéndice C), y dado que la puntuación de la escala es la suma el tema de las puntuaciones individuales, la varianza de la escala se puede expresar como
X2 = i2 + ij,
donde  ij denota la covarianza entre los puntos I y J, y el doble sumatorio se extiende a todas las combinaciones de i y j donde i  j. Así pues, podemos traducir la condición necesaria y suficiente para  a ser negativo como
i2 > i2 + ij,
or
ij < 0.
En otras palabras,  será negativo cuando el doble de la suma de las covarianzas tema es negativo. Esto se puede afirmar aún más, simplemente diciendo que  será negativo cuando el promedio de covarianza entre los elementos es negativa.
Para que puede ir a -, tenga en cuenta una escala que consta de dos elementos con igual varianza y una correlación negativa perfecta de -1. Desde la covarianza  12 entre los puntos 1 y 2 se define (véase, por ejemplo, Lord & Novick), como
12 = 12 1 2,
if 12 = -1, and 1 = 2 = , then
12 = (-1)()() = -.
Conectar estos en el denominador de la relación en la fórmula para , tenemos
X2 = 12 + 22 + 212 =  +  + (2)(-) = 0.
Así  se calcula como
 = [2/(2-1)][1 - (2/0)] = 2(1 - ) = -.
Aunque este es el caso más extremo, los usuarios de SPSS en ocasiones se presentan los valores de  que son negativos y tienen magnitudes superiores a 1, y quieren saber cómo puede ocurrir esto. Hay que tener en cuenta que  es en realidad un límite inferior en la verdadera fiabilidad de un test en condiciones generales, y que sólo será igual a la verdadera fiabilidad si los artículos satisify una propiedad conocida como  esenciales de equivalencia (Lord y Novick), que exige que sus resultados verdaderos son todos iguales, o que el nivel real de cada elemento se puede convertir en verdadera puntuación de cualquier otro tema, añadiendo una constante. Esto implica que para que  ser una medida de la fiabilidad en lugar de un límite inferior, los elementos de medición debe ser la misma cosa. Tenga en cuenta que incluso si los artículos se ajusten a lo esencial  supuesto de equivalencia, si hay una buena cantidad de error en la medición, los valores de la muestra de  puede ser negativo a pesar de que los valores de la población son positivas. Esto se hace menos probable que los números de casos y artículos de aumentos, porque se reduce la variabilidad de muestreo.
Si uno encuentra un valor negativo para , lo que supone un promedio de covarianza entre los puntos negativos, lo primero que se debe comprobar es ver si los datos o elemento de los errores de codificación son responsables. Un problema común de este tipo es que la escala se compone de algunos elementos que están redactados en direcciones opuestas para paliar los sesgos de respuesta, y el investigador se ha olvidado de forma adecuada recodificar el reverso anotó puntos, dando lugar a covarianzas negativas cuando las covarianzas reales de interés son positivas . Otra posibilidad, más probable es que con tamaños de muestra pequeños y pequeñas cantidades de artículos, es que mientras las covarianzas real de la población entre los elementos son positivos, el error de muestreo se ha producido un promedio de covarianza negativa en una determinada muestra de casos. Por último, puede ser simplemente el caso de que los elementos no tienen realmente covarianzas positivas, y por lo tanto no pueden formar una única escala de utilidad debido a que no están midiendo lo mismo.
Referencias
Hays, W. L. (1981). Statistics (3rd Ed.). Holt, Rinehart and Winston.
Lord, F. M., & Novick, M. R. (1968). Statistical theories of mental test scores. Reading, MA: Addison-Wesley.