4. RECORDANDO….
• Hay dos tipos de análisis estadísticos que pueden realizarse
para probar hipótesis:
ANÁLISIS
PARAMÉTRICO
ANÁLISIS NO
PARAMÉTRICO
LA ELECCIÓN DE QUÉ CLASE DE ANÁLISIS EFECTUAR DEPENDE DE LOS SUPUESTOS
5. Coeficiente de correlación de Pearson
Prueba T
Prueba de regresión lineal
Análisis de varianza factorial (ANOVA).
ANÁLISIS
PARAMÉTRICO
8. REGRESION LINEAL SIMPLE
• En el análisis de regresión lineal es simple cuando intervienen sólo
dos variables:
VARIABLE X
(variable independiente )
VARIABLE Y
(variable dependiente)
Los valores de la variable dependiente son los que
deseamos predecir, usando para ello la información
aportada por la variable independiente ( X )
9. En el caso de una relación lineal, el objetivo es obtener la
ECUACIÓN DE LA RECTA que mejor se ajuste a los datos (que mejor
represente la relación entre las variables).
10. ANALIZANDO RESULTADOS…
• PASO 01: Construir la ecuación de recta de regresión lineal
simple.
• PASO 02: Observar los valores mostrados en el cuadro de
COFICIENTES:
• CONSTANTE DE REGRESIÓN
• COEFICIENTE DE REGRESIÓN
11. COEFICIENTE DE
REGRESIÓN
CONSTANTE DE
REGRESIÓN
• B>0 → relación lineal es positiva
(B representa el número de unidades que tiende a
aumentar la variable Y por cada unidad que aumenta
la variable X)
• B<0 → relación lineal es negativa
(B representa el número de unidades que tiende a
disminuir la variable Y por cada unidad que aumenta
la variable X)
• B=0 → la ecuación de regresión lineal no
es el modelo más adecuado para
describir la relación entre las variables
involucradas
• Indica el valor correspondiente a la
variable dependiente cuando la
variable independiente asume un
valor igual a cero.
• Cuidado al interpretar la constante de
regresión de la ecuación pues en
ocasiones ésta no tiene sentido.
12. • PASO 03: Evaluar la SIGNIFICANCIA (se evalúa a través del p
valor y de los intervalos de confianza que deben acompañar los
resultados)
• P < 0,05 “significativo” → los valores de la variable X tiene
INFLUENCIA sobre los valores de la variable Y
• P > 0,05 “no significativo” → los valores de la variable X no tiene
relación con la variable Y
14. COEFICIENTE DE
CORRELACION DE PEARSON
• Podemos definir el coeficiente de correlación de Pearson como
un índice que puede utilizarse para medir el grado de relación
de dos variables siempre y cuando ambas sean cuantitativas.
• El coeficiente de correlación de Pearson se calcula a partir de
las puntuaciones obtenidas en una muestra en dos variables.
• Se relacionan las puntuaciones recolectadas de una variable
con las puntuaciones obtenidos de la otra.
15. VENTAJAS Y DESVENTAJAS DEL COEFICIENTE DE PEARSON
VENTAJAS DESVENTAJAS
• El valor de coeficiente de
correlación es independiente
de cualquier unidad usada para
medir variables.
• Mientras mas grande es la
muestra mas exacta será la
estimación.
• Requiere supuestos acerca de
la naturaleza o formas de las
poblaciones afectadas.
• Requiere que las dos variables
hayan ido medidas hasta un
nivel cuantitativo continuo y
que la distribución de ambas
sea semejante a la de la curva
normal.
16. USOS
• Permite predecir el valor de una variable dado un valor determinado
de la otra variable.
• Se trata de valorar la asociación entre dos variables cuantitativas
estudiando el método conocido como correlación.
• Dicho cálculo es el primer paso para determinar la relación entre las
variables.
• Consiste en la posibilidad de calcular su distribución muestral y así
poder determinar su error típico de estimación.
• Reporta un valor de correlación cercano a 0 como un indicador de
que no hay relación lineal entre 2 variables.
• Reporta un valor de correlación cercano a 1 como un indicador de
que existe una relación lineal positiva entre las 2 variables. Un valor
mayor a cero que se acerque a 1 da como resultado una mayor
correlación positiva entre la información.
17.
18. COEFICIENTE DE
CORRELACION DE SPEARMAN
• La interpretación de coeficiente de Spearman es igual que la
del coeficiente de correlación de Pearson. Oscila entre -1 y +1,
indicándonos asociaciones negativas o positivas
respectivamente, 0 cero, significa no correlación pero no
independencia.
• Correlación de Pearson para el conjunto de rangos apareados.
La correlación de Spearman puede ser calculada con la
fórmula de Pearson, si antes hemos transformado las
puntuaciones en rangos.
19. VENTAJAS DESVENTAJAS
• No esta afectada por los
cambios en las unidades de
medida.
• Al ser una técnica no
paramétrica, es libre de
distribución probabilística.
• Es recomendable usarlo
cuando los datos presentan
valores extremos, ya que en
dichos valores afectan mucho
el coeficiente de correlación
de Pearson o ante distribución
no normales.
• R no debe ser utilizado para
decir algo sobre la relación
entre causa y efecto.
20. ANALIZANDO RESULTADOS…
Ejemplo: veremos a 100 mujeres a quien se le evaluó la
hemoglobina durante la gestación y también se evaluó el
peso de su recién nacido con la finalidad de conocer si el
valor de la hemoglobina de la madre esta relacionada con el
peso del recién nacido.
• 1° Ingresamos los datos
al SPSS y elegimos el
calculo del estadístico.
21. • 2° Colocamos las variables al lado
derecho y elegimos la opción
(Coeficiente de correlación de
Pearson).
o Al ver los reportes observamos que la correlación
de Pearson tiene un valor de 0,293 y la Sig.
(Bilateral) tiene un valor de 0,003 estando por
debajo de 0,01 por lo tanto rechazamos la Ho
(Nula).
o Para este ejemplo se trabajo con un nivel de
confianza de 99% por lo tanto el nivel de
significancia es de 0,01
23. ANALIZANDO RESULTADOS…
Pasos para probar una hipótesis estadística
• Paso 1.- Planteamiento de hipótesis.
• H0 : d = 0 (Las medias de muestras relacionales son similares).
• H1 : d ≠ 0 (Las medias de muestras relacionales no son similares).
• Paso 2.- Niveles de significación. (teórico) “”
• Paso 3.- Estadístico de prueba.
• «T» de student de muestras relacionales grados de libertad (n-1).
• Paso 4.- Formular la regla de decisión
• Si el p-valor < Se rechaza H0
• Si el p-valor ≥ No se rechaza H0
• Paso 5.- Conclusión:
• En este caso se especifica la hipótesis estadística que no ha sido rechazada
indicando el nivel de significancia teórico considerado (α)
Se obtiene el valor de
significación practico
«P- valor» mediante el
SPSS.
P - VALOR
P>0.05 No significativo
P<0.05 Significativo
P<0.01 Muy significativo
P<0.001 Altamente significativo
24. EJEMPLO: Determinar la efectividad del programa dieta
ejercicios en la disminución del los niveles de colesterol.
• A continuación se tienen los niveles de colesterol total de una
muestra de ocho pacientes antes y después de participar en un
programa dieta ejercicio.
25. • PASO 01: PLANTEAMIENTO DE HIPÓTESIS
• H0 : El programa no es efectivo. (Después del programa los valores de
colesterol total no disminuirán).
• H1 : El programa es efectivo. (Después del programa los valores de colesterol
total disminuirán).
• PASO 2: Niveles de significación. (teórico) ””
• Se asume un nivel de significancia de 0.05
• PASO 3: Estadístico de prueba. «T» de student con su respectivos
grados de libertad.
26. • Empezamos por comprobar la normalidad de la diferencia de los
datos para muestras relacionadas.
• Ruta en SPSS: Analizar / Estadísticos descriptivos / Explorar,
dentro del menú. Explorar en la opción Gráficos marcar Gráficos
con prueba de normalidad
Los tests de normalidad dan un valor de p no significativo (p>0,05) en ambas muestras relacionadas (en
este caso, por el tamaño muestral que tenemos correcto utilizar el test de Shapiro-Wilks). No hay
evidencias para rechazar la hipótesis nula de normalidad de la variable reducción del
colesterol.
27. • Paso 4: Formular la regla de decisión
• Como p-valor = 0,032 < 0,05 se rechaza H0
• Paso 5: Conclusión:
• Se concluye que hay evidencia para indicar que el programa dieta –
ejercicio es efectiva; es decir, que después del programa dieta -
ejercicios los niveles de colesterol fueron significativamente menores
que los obtenidos antes, a un nivel de significancia de 0,05.
29. ANÁLISIS DE VARIANZA ANOVA
• Su nombre está basado en el método que se utiliza y puede
desorientar, pero el ANOVA no compara varianzas, sino medias y es
el test indicado cuando se desean comparar las medias de tres o
más grupos independientes.
• La situación que vamos a tratar es similar a la del t-test para
muestras independientes:
• La variable a contrastar (dependiente) es cuantitativa.
• La variable de agrupación es cualitativa con más de dos categorías.
• El ANOVA es un método paramétrico y exige el cumplimiento de
unos supuestos, de manera que cuando no se cumplan las
condiciones de aplicación se dispone de una técnica no paramétrica
que es el test de Kruskal-Wallis.
30. ANALIZANDO RESULTADOS:
• Paso 1: Planteamiento de hipótesis.
• H0: El pertenecer a un grupo u otro no influye en el cambio del colesterol
• H1: Al menos dos grupos difieren
• Paso 2: Niveles de significación. (teórico) ””
• Se asume un nivel de significancia de 0.05
31. • Paso 3: Estadístico de prueba. «F» de Fisher de Snedecor.
• CUMPLE CON LOS SUPUESTOS POR LO QUE SE APLICA EL ANOVA
• Aplicamos la prueba «F» de Fisher mediante el SPSS cuya ruta es: Analizar /
Comparar medias / ANOVA DE UN FACTOR.
Siendo la prueba F= 5,225 su
respectiva significancia
p-valor =0,025.
32. INTERPRETANDO…
• Paso 4: Formular la regla de decisión
• Como p-valor = 0,025 < 0,05 se rechaza H0
• Paso 5: Conclusión:
• Se concluye que hay evidencia para indicar que al menos dos tipos de dietas
difieren; es decir, que las intervenciones sobre dietas es efectiva con un nivel
de significancia de 0.05.
34. PRUEBA CHI CUADRADO DE HOMOGENEIDAD.
• Prueba estadística para evaluar hipótesis acerca de la relación entre dos
variables categóricas.
• Procedimiento: se calcula por medio de una tabla de contingencia o
tabulación cruzada, que es un cuadro de dos dimensiones y cada dimensión
contiene una variable. A su vez, cada variable se subdivide en dos o más
categorías.
• OJO!
• Se necesita que más del 20 % de los valores esperados estén por encima de 5 y que
ninguna celda tenga valor esperado menor a 1.
• Si la tabla es de 2x2, todas las celdas deben tener valores esperados por encima de 5.
• En el caso de la tabla de 2x2 si existe una sola celda con valor esperado menor que 5,
esto representaría un 25 % de las celdas con esa condición, por lo que se utilizaría la
Prueba de las Probabilidades exactas de Fisher en lugar de la Prueba χ2 , ya que en
éste caso no es posible agrupar categorías.
35. ANALIZANDO RESULTADOS…
• EJEMPLO: Determinar si existe homogeneidad entre los
enfermos y no enfermos de cáncer del pulmón respecto a
fumar o no fumar.
• Se seleccionan 2 muestras aleatorias, una de pacientes con esta
enfermedad y l a otra de personas sin esta condición.
36. • Paso 1: Planteamiento de
hipótesis.
• H0: Hay homogeneidad entre los
enfermos y no enfermos de cáncer del
pulmón respecto a fumar o no fumar (la
proporción de fumadores es similar en
enfermos y no enfermos)
•H1: No hay homogeneidad (la
proporción de fumadores difiere en
enfermos y no enfermos)
• Paso 2: Niveles de significación.
(teórico) ””
• Se asume un nivel de significancia de 0.05
• Paso 3: Estadístico de prueba
«Prueba CHI CUADRADO DE
HOMOGENEIDAD
37. • RESULTADOS:
• Paso 4: Formular la regla de decisión
• Como p-valor =0,009 < 0,05 se rechaza H0
• Paso 5: Conclusión
• Se concluye que hay evidencia para indica que no hay homogeneidad (la proporción de
fumadores difiere en enfermos y no enfermos), con un nivel de significación de 0.05.
• Es decir, existen diferencias estadísticas significativas entre enfermos de cáncer del pulmón y
libres de la enfermedad en relación a la distribución de fumadores y no fumadores.
Siendo la prueba chi
cuadrado = 6,792 con
1 grados de libertad y
su respectiva
significancia p-valor
=0,009.
39. Prueba de WILCOXON.
• OBJETIVO: Comparar dos mediciones de rangos
(medianas) y determiner que la diferencia no se deba al
azar (que la diferencia sea estadísticamente significativa).
• La prueba es posible utilizarla en lugar de la prueba
paramétrica t de Student para una muestra en la cual se
necesita probar una hipótesis en relación con un parámetro que
refleja una tendencia central.
40. ANALIZANDO RESULTADOS…
• EJEMPLO: Probar si hay diferencias en el nivel de estrés laboral de
los trabajadores de una empresa antes y después de la
implementación de un programa de mejoramiento del ambiente
laboral.
• El nivel de estrés se midió en una escala de nada, bajo, medio, alto y muy
alto.
Decisiones para seleccionar la prueba de Wilcoxon
Es un problema de Comparación
VI: programa de mejoramiento del ambiente laboral
2 grupos relacionados (estrés antes y después del
programa)
VD: nivel de estrés laboral
41. • PASO 01: Planteamiento de hipótesis.
• H0: No hay diferencias en el nivel de estrés laboral de los trabajadores antes
y después de implementar el programa de mejoramiento del ambiente laboral
(Md1 = Md2 ).
• H1: Hay diferencias en el nivel de estrés laboral de los trabajadores antes y
después de implementar el programa de mejoramiento del ambiente laboral
(Md1 ≠ Md2 ).
• Paso 02: Niveles de significación. (teórico) “”
• Se asume un nivel de significancia de 0.05
42. • PASO 3: Estadístico de prueba. «Prueba de WILCOXON»
• Siendo la prueba Z = -0.541 su respectiva significancia p-valor =0,589.
• PASO 4: Formular la regla de decisión
• Como p-valor =0,589 > 0,05 no se rechaza H0
• PASO 5: Conclusión:
• Se concluye que hay evidencia para indica no hay diferencias en el nivel de
estrés laboral de los trabajadores antes y después de implementar el programa
de mejoramiento del ambiente laboral, con un nivel de significación de 0.05.
44. PRUEBAS NO PARAMETRICAS. Prueba KRUSKAL
WALLIS.
• OBJETIVO: Comparar mas de dos mediciones de rangos
(medianas) y determinar que la diferencia no se deba al azar
(que la diferencia sea estadísticamente significativa).
• Es una prueba no paramétrica que compara mas de dos
muestras independientes. Se debe cumplir las siguientes
características:
• Es libre de curva, no necesita una distribución específica
• Nivel ordinal de la variable dependiente
• Es una alternativa de la prueba “F” de ANOVA de un factor.
45. ANALIZANDO RESULTADOS…
• EJEMPLO: Determinar si las cifras que excretan en orina de
sodio y potasio 4 tipos de ratas difieren entre sí.
• PASO 1: Planteamiento de hipótesis.
• H0: Med1= Med2=Med3=Med4
• H1: Medi ≠ Medj al menos para un par (i,j)
• PASO 2: Niveles de significación. (teórico) “”
Se asume un nivel de significancia de 0.05
46. • PASO 3: analizar el RESULTADOS
• Siendo la prueba Z chi cuadrado = 13,699 con 3
grados de libertad y su respectiva significancia p-valor
=0,003.
47. • PASO 4: Formular la regla de decisión
• Como p-valor =0,003 < 0,05 se rechaza H0
• PASO 5: Conclusión
• Se concluye que hay evidencia para indica que el nivel de excreción
urinaria de sodio/potasio difiere entre los cuatro tipos de ratas, con un
nivel de significación de 0.05.
49. Prueba U De Mann Whitney Para Dos Grupos
Independientes.
• OBJETIVO: Comparar dos grupos de rangos (medianas)
• Es una prueba no paramétrica de comparación de dos
muestras independientes, debe cumplir las siguientes
características:
• Es libre de curva, no necesita una distribución específica.
• Nivel ordinal de la variable dependiente
50. ANALIZANDO RESULTADOS…
• PASO 1: Planteamiento de
hipótesis.
• H0: No existe diferencias en el nivel de
estrés entre enfermeras de terapia
intensiva y las del servicio de urgencias
en un hospital (Med1 = Med2 )
• H1: Existe diferencias en el nivel de
estrés entre enfermeras de terapia
intensiva y las del servicio de urgencias
en un hospital (Med1 ≠ Med2 )
• PASO 2: Niveles de significación.
(teórico) ” = 0.05”
• PASO 3: Estadístico de prueba:
Prueba U MANN WHITNEY.
51. • RESULTADOS:
Siendo la prueba U MANN WHITNEY = 11 su respectiva significancia p-valor =0,135
• PASO 4: Formular la regla de decisión
Como p-valor > 0.05, no se rechaza H0
• PASO 5: Conclusión→ Se concluye que hay evidencia para indica el nivel de estrés es igual entre los 2
grupos de enfermeras., con un nivel de significación de 0.05.