chi_cuad2010.ppt

ESTADÍSTICA NO
PARAMÉTRICA
Proporciones
Chi-Cuadrado (c2)
Mann-Whitney
Kruskal-Wallis
Correlación de Spearman

Tipo de Variables y test a utilizar
Variable Grupos Test
Intervalar 2 - ind dif. Student no pareado
Intervalar 2 - mismos ind. Student pareado
Intervalar 3 ó más grupos ANOVA/Scheffé/...
Dep/Ind Análisis de Reg. / r
Nominal 2 grupos Chi cuadrado
Ordinal 2 grupos Chi cuadrado
Ordinal 2 grupos Mann-Whitney
Ordinal 3 grupos Kruskal-Wallis
Ordinal 2 g /mismos ind Wilcoxon
Ordinal dep/ind Spearman

Tipo de experimento
Escala de
medición
Dos grupos de
tratamiento
consistentes de
individuos
diferentes
Tres o más
grupos
consistentes
de individuos
diferentes
Antes y
después de un
tratamiento en
los mismos
individuos
Múltiples
tratamientos
en los
mismos
individuos
Asociación
entre dos
variables
Intervalar (y
obtenida de
población con
distribución
normal)*
Test t no pareado Análisis de
Varianza
Test t pareado Análisis de
varianza de
medidas
repetidas
Regresión
linear y
correlación de
Pearson;
análisis de
Bland-Altman
Nominal Chi-cuadrado de
tabla de
contingencia
Chi-cuadrado
de tabla de
contingencia
Test de
McNemar
Q de
Cochrane
Coeficiente de
contingencia
Ordinal Test de suma de
rangos de Mann-
Whitney
Estadístico de
Kruskal-Wallis
Test del signo
de rangos de
Wilcoxon
Estadístico de
Friedman
Correlación de
rangos de
Spearman
Tiempo de
sobrevida
Test de Gehan ó
Test de rango del
Log
* Si los datos no tienen distribución normal, se ordenan y se aplican los tests para variables ordinales

Proporción
• Resumen de variables binarias:
– Síntoma: Presente / Ausente
– Tratamiento: Efectivo / Fracaso
• Si r, número de sujetos observados con
la característica, en la muestra n la
proporción será:
– Con la característica p = r / n
– Sin la característica q = 1- p

Intervalo de confianza de una
proporción
)
(
96
,
1
/
)
1
(
)
(
%
95 p
se
p
IC
n
p
p
p
se






En una clínica dental le
preguntan a 263 pctes si
confían que sus CD tengan
los datos en un PC, 81
dicen que la privacidad se
pierde, el IC 95% es:
0,364
a
252
,
0
0285
,
0
96
,
1
308
,
0
0285
,
0
263
/
)
308
,
0
1
(
308
,
0
)
(
308
,
0
263
/
81
%
95 








IC
p
se
p
30.8%
No confía
69.2%
Si confía

Tests de proporciones
• Si existe diferencia con una proporción
conocida
• Comparar si existen diferencias
significativas entre dos proporciones no
pareadas
• Comparar si existen diferencias
significativas entre dos proporciones
pareadas

Si existe diferencia con una
proporción conocida
• Similar a lo visto en test t (comparar con
promedio conocido), o sea:
observado
valor
de
estándar
error
esperado
valor
-
observado
Valor

En una clínica de 215 pctes, 39 (18%) tienen asma, a nivel
nacional se sabe que el asma se presenta en 15%.
¿Existen diferencias significativas, entre 15% y 18%?
187
2
,
0
1,23
:
(buscar)
z
valores
de
Tabla
23
,
1
0244
,
0
15
,
0
18
,
0
0244
,
0
215
85
,
0
15
,
0
)
(
)
1
(
)
(
)
(











z
p
se
n
p
p
p
se
p
se
p
p
z
esp

A 25 pctes con osteoartrosis cervical se les dividió, al
azar, en dos grupos (Lewith y Machin, 1981):
• 12 fueron tratados con estimulación infra roja (IR).
• 13 recibieron placebo.
9/12 con IR mejoró o desapareció el dolor = 0,75
4/13 en el grupo placebo mejoró =0,31
¿Existen diferencias significativas?

ivas
significat
dif
Existen
0,79
a
0,09
95%
IC
sea
o
es
estándar
Error
el
y
0,4423
0,3077
-
0,7500
:
ejemplo
el
En
)
var(p
)
var(p 2
1



























1789
,
0
96
,
1
1789
,
0
)
(
13
6923
,
0
3077
,
0
12
25
,
0
75
,
0
)
(
)
(
96
,
1
)
1
(
)
1
(
)
(
)
(
2
1
%
95
2
1
2
1
2
1
2
1
%
95
2
2
2
1
1
1
2
1
2
1
p
p
IC
p
p
se
p
p
se
p
p
se
p
p
IC
n
p
p
n
p
p
p
p
se
p
p
se

Chi cuadrado
Lado del dado f(0) f(E) (0-E)
2
/E
--------------------------------------------------------------------------------------
1 7 10 0,9
2 5 10 2,5
3 15 10 2,5
4 17 10 4,9
5 5 10 2,5
6 11 10 0,1
-------------------------------------------------------------------------------------
TOTAL 60 60 =13,40 = c
Gl = 6 - 1 = 5
Crític : c
0.05 = 11.07 Rechazar Ho

c2= 31,793, gl = 1, p<0,0001
SI NO
75
25
34
63
MEJORA SINTOMAS DEL RESFRIO
VITAMINA C
PLACEBO
793
,
31
33
,
43
)
33
,
43
63
(
67
,
44
)
67
,
44
25
(
67
,
53
)
67
,
53
34
(
33
,
55
)
33
,
55
75
(
)
(
2
2
2
2
2
2
2










 
c
c
E
E
O

Cálculo del test – chi-cuadrado
Mejoran de los síntomas del
resfrío
SI NO Total
Vitamina C fo =75
fe =55,33
fo =34
fe =53,67
109
Placebo fo =25
fe =44,67
fo =63
fe =43,33
88
Total
f columna
100 25 197
= 100*109/197
= 100*88/197

Cálculo de valores esperados
A
C
B
D
)
/(
)
)(
(
)
/(
)
)(
(
)
/(
)
)(
(
)
/(
)
)(
(
D
C
B
A
D
C
D
B
E
D
C
B
A
D
C
C
A
E
D
C
B
A
D
B
B
A
E
D
C
B
A
C
A
B
A
E
d
c
b
a

























Cálculo de valores esperados
Si No Total Esperados
75 34 109 55,33 53,67
25 63 88 44,67 43,33
100 97 197
793
,
31
33
,
43
)
33
,
43
63
(
67
,
44
)
67
,
44
25
(
67
,
53
)
67
,
53
34
(
33
,
55
)
33
,
55
75
(
)
(
2
2
2
2
2
2
2










 
c
c
E
E
O

ESTUDIO DE TRES PASTAS DENTALES Y SU EFECTO ANTI-
CÁLCULO
PD Bajo E Moderado E Alto E TOTAL
A 49 (55) 30 (26) 21 (19) 100
B 67 (55) 21 (26) 12 (19) 100
C 49 (55) 27 (26) 24 (19) 100
TOTAL165 78 57 300
E = 100 E = 55
165 300
c2 = (49 - 55)2/55 + ... + (24 - 19)2/19 = 9,65
gl = (f - 1) (c - 1) = (3 - 1) (3 - 1) = 4
Crítico: c2
0.05 = 9,49. SE RECHAZA HO

Chi - cuadrado (c2)
c2 = (O - E)2/E (Chi cuadrado de Pearson)
c = (|O - E|2 - 1/2) / E Corrección de Yates
Corrección de Yates: para tablas 2x2, con
muestras pequeñas (en una celda existen
menos de 5 observaciones).
Tamaño de muestra: n de celdas x 10.
Ej: 2 x 2 = 4 x 10 = 40
Ej. Ant: 3x3 = 9 x 10 = 90

Distribución de Chi-Cuadrado
• Supongamos que repetimos
experimento 1000 veces (el de
la Vit C / Placebo). Para cada
experimento calculamos el
valor de Chi-Cuadrado y
ploteamos dichos valores.
• Eje X es el valor calculado de
Chi-cuadrado de acuerdo a la
fórmula.
• Eje Y es el número de veces
que se obtiene el valor de chi-
cuadrado.

ODDS RATIO
• Proporciona:
– Estimado de la relación entre dos variables
binarias (si / no)
– Permite examinar los efectos de otras
variables en dicha relación
– Forma especial y conveniente de
interpretación en estudios caso-control

• “The odds that a single throw of a die
will produce a six are 1 to 5, or 1/5”.
• “ODDS: es la relación de la probabilidad
que el evento de interés ocurra contra
la probabilidad de que esto no ocurra”.
Bland y Altman. The odds ratio, BMJ 320;1468, 2000

Razón de desigualdad
(Odd ratio)
OR = 5,559
IC 95% : 3,00 a 10,29
75 (a) 34 (b)
25 (c) 63 (d)
Si No
Si
No
)
(log
96
,
1
1
1
1
1
)
(log
%
95 OR
SE
OR
IC
d
c
b
a
OR
SE
bc
ad
d
b
c
a
OR
e
e









 
)
(ln
96
,
1
ln
exp
314035
,
0
)
(log
63
1
34
1
25
1
75
1
)
(log
1
1
1
1
)
(log
559
,
5
25
34
63
75
%
95 OR
SE
OR
OR
IC
OR
SE
OR
SE
d
c
b
a
OR
SE
bc
ad
d
b
c
a
OR
e
e
e


















3,00
a
10,286
IC
exp(1,100)
),
exp(2,3308
1,100
a
95% 








3308
,
2
3140
,
0
96
,
1
7154
,
1
7154
,
1
)
559
,
5
(
559
,
5
25
34
63
75
IC
LN
OR

Cases are weighted by the value of variable N.
Frequencies
HACE_EJERC$ (rows) by MEJOR_SINT$ (columns)
si no Total
Si 75.000 34.000 109.000
No 25.000 63.000 88.000
Total 100.000 97.000 197.000
Test statistic Value df Prob
Pearson Chi-square 31.793 1.000 0.000
Yates corrected Chi-square 30.197 1.000 0.000
Coefficient Value Asymptotic Std Error
Odds Ratio 5.559
Ln(Odds) 1.715 0.314
OjO: Debe calcular IC 95% = 1.715 ± 1.96 * 0.314

Riesgo Relativo
• Relación de frecuencias de dos categorías.
O desigualdad de ser clasificado en la
columna 1 en lugar de la columna 2.
• OR = (A/C) / (B/D)
• >1: personas con factor de riesgo tienen
más probabilidad que presenten el evento.
• <1: personas con factor de riesgo son
menos probable que experimenten el
evento.

Edad Materna y peso al nacer
(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 10 40 50
> 20 a. 15 135 150
Total 25 175 200
Existe asociación entre niños de bajo peso al nacer
y edad de la madre?

Odds ratio
(es solamente para estudios caso-control, variables
nominales, tablas 2x2)
(similar a riesgo relativo)
• Si OR >1: existe una asociación positiva entre el
factor de riesgo y el evento.
• Si OR <1: hay una asociación negativa, (presencia
del factor disminuye la probabilidad de encontrar el
evento.

Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 10 40 50
> 20 a. 15 135 150
Total 25 175 200
n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2
c2 = ------------------------------------------ = --------------------------------------------- = 2,58
n1.n2.n.1n.2 50x150x25x175

Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. n11 n12 n1.
> 20 a. n21 n22 n2.
Total n.1 n.2 n..
n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2
c2 = ------------------------------------------ = --------------------------------------------- = 2,58
n1.n2.n.1n.2 50x150x25x175

Proporciones
Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 0,050 0,200 0,25
> 20 a. 0,075 0,675 0,75
Total 0,125 0,875 1,00

Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 20 80 100
> 20 a. 30 270 300
Total 50 350 400
Existe asociación entre niños de bajo peso al nacer
y edad de la madre?

• Sensibilidad: proporción de positivos
que son correctamente identificados por
el test.
• Especificidad: proporción de negativos
que son correctamente identificados por
el test

Comparación de sensibilidad y especificidad vs.
Valores predictivos positivo y negativo para evaluar la
seguridad de tests para diagnóstico
SI NO
SI
NO
(a)
Verdad +
45
(c)
Falso –
5
(b)
Falso +
10
(d)
Verdad -
40
TEST
ENFERMEDAD
Sensibilidad = a / a + c = 45 / 50 = 0,90
Especificidad = d / b + d = 40 / 50 = 0,80
VPP = a / a + b = 45 / 55 = 0,82
VPN = d / c + d = 40 / 45 = 0,89
N = 100

Comparación de sensibilidad y especificidad vs. Valores
predictivos positivo y negativo para evaluar la seguridad de tests
para diagnóstico
Tomado de Kramer, 1988
SI NO
SI
NO
(a)
Verdad +
9
(c)
Falso –
1
(b)
Falso +
18
(d)
Verdad -
72
TEST
ENFERMEDAD
Sensibilidad = a / a + c = 9 / 10 = 0,90
Especificidad = d / b + d = 72 / 90 = 0,80
VPP = a / a + b = 9 / 27 = 0,33
VPN = d / c + d = 72 / 73 = 0,99
N = 100

• Valor predictivo positivo (VPP): proporción de
pacientes con resultado de test positivo que
son correctamente diagnosticados.
• Valor predictivo negativo (VPN): proporción
de pacientes con resultado de test negativo
que son correctamente diagnosticados.

Tests no paramétricos para dos o
más muestras
Equivalente a test t pareado: Wilcoxon
Equivalente a test t no pareado: Mann-Whitney
Equivalente a ANOVA: Kruskal Wallis
Utilizar con variables ordinales o cuando
variables intervalares no presenten
distribución normal

Test U de Mann-Whitney
• Colocar rangos a las observaciones en
orden de menor a mayor

Test de Mann-Whitney
Producción de orina diaria mL/día.
Placebo Rango Droga Rango
------------------------------------------------------------------------
1000 1 1400 6
1380 5 1600 7
1200 3 1180 2
1220 4
T= 9 19
--------------------------------------------------------------------------
Mann-Whitney U= 3, p = 0.289

Test de Tukey-Duckworth
• Cálculos se pueden hacer en la cabeza
• Existe solamente un requisito que
cumplir:
4 ≤ n1 ≤ n2 ≤ 30
• Ho: Las muestras son idénticas
• Ha: Las muestras son diferentes
• El test estadístico a calcular es C

• Existen solamente dos valores críticos:
C0,05 = 7
C0,01 = 10

Procedimiento
1. Determine medición más grande y más
pequeña en cada muestra ranqueada.
2. En la muestra que contiene el valor
más grande de todos los valores
combinados, cuente todos los valores
que son mayores que la medición más
grande en el otro grupo.

3. En la otra muestra, cuente todas las
mediciones que son más pequeñas que
la medición más pequeña del grupo de
la primera medición.
4. Sume ambas cantidades (= C).

Grupo1 Grupo2
80 84
81 89
82 92
83 92
84 92
85 94
86 95
87 96
89 96
92 96
93 98
94 98
96 99
97 101
98 103 Mayor valor
Valores de
exclusión
Ccalc = 4 + 3 = 7 C0,05 = 7
Ccalc ≥ C0,05 por lo tanto se rechaza Ho.
Conclusión: las muestras son diferentes

Kruskal-Wallis
• Equivalente a Anova
• Extensión del test de Mann-Whitney a más
de dos grupos
• Al conjunto de observaciones (N) se les da
rango (1 a N), indiferente de qué grupo estén,
y para cada grupo se calcula la suma de
rangos, y posteriormente se calcula H,
definido por

Donde R es el promedio de todos los rangos, y
es siempre igual a (N+1)/2. Ri = es la suma de
los rangos de ni observaciones.
Para calcular es más fácil:
)
1
(
)
(
12 2




N
N
R
R
n
H i
i
)
1
(
3
)
1
(
12 2



  N
n
R
N
N
H
i
i

% de reducción de cefalea en
tres grupos (Fentress et al, 1986)
(Rangos en paréntesis)
Relajación y biofeedback Relajación No tratados
62 (11) 69 (10) 50 (12)
74 ( 8,5) 43 (13) -120 (17)
86 ( 7) 100 ( 2) 100 ( 2)
74 ( 8,5) 94 ( 5) -288 (18)
91 ( 6) 100 ( 2) 4 (15)
37 (14) 98 ( 4) -76 (16)
 rango 55 36 80
Rango medio 9,17 6,00 13,33

69
,
5
19
3
6
80
6
36
6
55
19
18
12
)
1
(
3
)
1
(
12
2
2
2
2


















 
H
N
n
R
N
N
H
i
i
Gl = GRUPOS – 1 = 2
Valor crítico: tabla de c = 5,99
Se acepta Ho.

• Medida No
Paramétrica para
establecer relación
de dos variables
ordinales (ó
intervalares sin DN)
Ventajas:
- No se necesita
distribución normal
- No se ve tan
afectada por
“outliers”
Sicólogo, 1863 - 1945

• Correlación para variables ordinales
• Para determinar la significancia de la
asociación de dos variables continuas
en que no existe normalidad de las
variables.
• Contrapartida no paramétrica de la
correlación de Pearson.

(n: número de pares de obs.)
(d= dif de rangos)
n
n
d
r
n
n
y
x
r
s
i
i
s









3
2
2
2
6
1
)
1
(
)
(
6
1

Grado de reabsorción ósea en mandíbula, lado
der e izq. Existe relación ?
Derecha (x) 83 97 91 72 76 88 95 89 75 74
Rango 5 10 8 1 4 6 9 7 3 2
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Izquierda(y) 87 98 84 82 74 92 91 83 80 77
Rango 7 10 6 4 1 9 8 5 3 2
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Dif. de rangos: -2 0 2 -3 3 -3 1 2 0 0
(x – y)
d2 = 4 0 4 9 9 9 1 4 0 0
 d2 = 40
rs = 1 – [ 6(40) / 10(102 – 1)] = 0,757

Diferentes escalas, diferentes
medidas de su asociación
Escala de ambas
variables
Medida de
asociación
Nominal Chi-Square de
Pearson: χ2
Ordinal rho de Spearman
Intervalar r de Pearson

Resumen
• Método de investigación
– Protocolo
– Artículo científico
• Bioestadística
– Estadística descriptiva: n, %, x ± ds
– Inferencia estadística: test t, ANOVA, ARS,
RL, c2

chi_cuad2010.ppt

Recommended

Recommended

More Related Content

Similar to chi_cuad2010.ppt

Similar to chi_cuad2010.ppt (20)

Recently uploaded

Recently uploaded (20)

chi_cuad2010.ppt