Presentación de los conceptos básicos de la estadística unidimensional.
Habla de los elementos básicos: medidas de centralización y dispersión; así como de la forma de organizar los datos en tablas y representarlos en los diferentes tipos de gráficos.
Las tablas se diferencian según sean para datos agrupados o aislados.
Los gráficos también se diferencian por tipos de datos: cuantitativos o cualitativos, así como de los tipos de agrupaciones de los datos cuantitativos: aislados o grupados.
2. 2
¿Para qué sirve la estadística?
● La Ciencia se ocupa en general de fenómenos observables.
● La Ciencia se desarrolla observando hechos, formulando leyes que los
explican y realizando experimentos para validar o rechazar dichas leyes.
● Los modelos que crea la ciencia son de tipo determinista o aleatorio
(estocástico).
● La Estadística se utiliza como tecnología al servicio de las ciencias donde
la variabilidad y la incertidumbre forman parte de su naturaleza.
.
● “La Bioestadística [...] enseña y ayuda a investigar en todas las áreas de las
Ciencias de la Vida donde la variablidad no es la excepción sino la regla”
Carrasco de la Peña (1982).
3. 3
Definición
La Estadística es la Ciencia de la
• Sistematización, recogida, ordenación y
presentación de los datos referentes a un fenómeno
que presenta variabilidad o incertidumbre para su
estudio metódico, con objeto de
• deducir las leyes que rigen esos fenómenos,
• y poder de esa forma hacer previsiones sobre los
mismos, tomar decisiones u obtener conclusiones.
Descriptiva
Probabilidad
Inferencia
4. 4
Pasos en un estudio estadístico
● Plantear hipótesis sobre una población
● Los fumadores tienen “más bajas” laborales que los no fumadores
● ¿En qué sentido? ¿Mayor número? ¿Tiempo medio?
● Decidir qué datos recoger (diseño de experimentos)
– Qué individuos pertenecerán al estudio (muestras) CUIDADO CON ESTO !!!!!!!
● Fumadores y no fumadores en edad laboral.
● Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas?
– Qué datos recoger de los mismos (variables)
● Número de bajas
● Tiempo de duración de cada baja
● ¿Sexo? ¿Sector laboral? ¿Otros factores?
● Recoger los datos (muestreo)
– ¿Estratificado? ¿Sistemáticamente?
● Describir (resumir) los datos obtenidos
● tiempo medio de baja en fumadores y no (estadísticos)
● % de bajas por fumadores y sexo (frecuencias), gráficos,...
● Realizar una inferencia sobre la población
● Los fumadores están de baja al menos 10 días/año más de media que los no fumadores.
● Cuantificar la confianza en la inferencia
– Nivel de confianza del 95%
– Significación del contraste: p=2%
5. 5
• Población
• Individuos
• Muestra
• Censo
• Caracteres
• Modalidad / Valor
• Variable estadística
• Observaciones
CONCEPTOS DE BÁSICOS DE ESTADÍSTICA
6. 6
POBLACIÓN
● Llamamos población estadística, universo o
colectivo al conjunto de referencia sobre el cual
vana recaer las observaciones.
● Se llama unidad estadística o individuo a cada
uno de los elementos que componen la
población estadística. No tiene por qué ser una
persona, puede ser un objeto, un ser vivo, o
incluso algo abstracto.
● Una muestra es un subconjunto de elementos
de la población.
● Realizamos un censo cuando se observan
TODOS los elementos de la población
estadística.
POBLACIÓN
INDIVIDUOS MUESTRA CENSO
CARACTERES
(Datos)
La muestra es el elemento más
importante de un estudio estadístico, ya
que la calidad de los resultados van a
depender de la calidad de la muestra.
7. 7
MUESTRA
MUESTRA
CARACTERES
(Datos)
Por tanto, algunos afirman que la
Estadística es la mejor forma de mentir,
sin decir mentiras.
La famosa frase de Mark Twain sobre las
estadísticas
Mark Twain, uno de los escritores más famosos del siglo
XIX, escribió una famosa frase sobre las estadísticas:
«Mentiras, malditas mentiras y estadísticas». ¿Por qué dijo
esto y qué significa hoy en día? Descubre cómo Twain criticó
el uso engañoso de las estadísticas y cómo sus palabras
siguen siendo relevantes hoy en día.
El sentido original de la expresión hacía referencia a lo fácil
que podría ser engañar mediante la presentación astuta de
los datos. Para evitar esta conjetura, la ciencia ha avanzado
durante los s.XX-XXI para la correcta interpretación de los
datos y de la evidencia empírica, hasta el punto de que
prácticamente ninguna disciplina científica puede avanzar ya
sin su uso.
11. 11
CARACTERES
● Cualitativos : aquellos que son categóricos,
pero no son numéricos.
p. ej. <color de los ojos>, <profesión>,
<marca de coche>,...
● Ordinales : aquellos que pueden ordenarse,
pero no son numéricos.
p. ej. <preguntas de encuesta sobre el
grado de satisfacción de algo>
Mucho, poco, nada. Bueno, regular, malo, ...
● Cuantitativos : son numéricos.
p. ej. <peso>, <talla>, <núm. de hijos>,
<núm. de libros leídos al mes>,...
CUANTITATIVOS
CARACTERES
CUALITATIVOS ORDINALES
MODALIDAD /
VALOR
Generalmente se utiliza el término modalidad cuando hablamos de caracteres cualitativos y el
término valor cuando estudiamos caracteres cuantitativos.
p. ej. el carácter cualitativo <Estado Civil> puede adoptar las modalidades : casado, soltero, viudo.
El carácter cuantitativo <Edad> puede tomar los valores : diez, once, doce, quince años, ...
12. 12
VARIABLE ESTADÍSTICA
● Al conjunto de los distintos valores numéricos
que adopta un carácter cuantitativo se llama
variable estadística.
● Discretas : Aquellas que toman valores
aislados (números naturales), y que no
pueden tomar ningún valor intermedio entre
dos consecutivos fijados.
p. ej. <núm. de goles marcados>, <núm. de
hijos>, <núm., de discos comprados>, <núm.
de pulsaciones>,...
Generalmente, toma valores enteros.
● Contínuas : Aquellas que toman infinitos
valores (números reales) en un intervalo
dado, de forma que pueden tomar cualquier
valor intermedio, al menos teóricamente, en
su rango de variación.
p. ej. <talla>, <peso>, <presión sanguínea>,
<temperatura>, ...
Generalmente, toma valores decimales.
VARIABLE ESTADÍSTICA
DISCRETAS CONTÍNUAS
OBSERVACIONES: Una observación es el
conjunto de modalidades o valores de
cada variable estadística medidos en un
mismo individuo. p. ej. en una población
de 100 individuos podemos estudiar, de
forma individual, tres caracteres : <edad :
18, 19, ...>, <sexo : Hombre, Mujer> y <si
ha votado en las elecciones : Si, No>.
Realizamos 100 observaciones con tres
datos cada una, es decir, una de las
observaciones podría ser (43, H, S).
13. 13
Modalidades
■ Los posibles valores de una variable suelen denominarse modalidades.
■ Las modalidades pueden agruparse en clases (intervalos), aunque no sean
variables continuas.
◻ Edades:
■ Menos de 20 años, de 20 a 50 años, más de 50 años
◻ Hijos:
■ Menos de 3 hijos, De 3 a 5, 6 o más hijos
■ Las modalidades/clases deben formar un sistema exhaustivo y excluyente:
◻ Exhaustivo: No podemos olvidar ningún posible valor de la variable
◻ Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)?
◻ Bien: ¿Cuál es su grupo sanguíneo?
◻ Excluyente: Nadie puede presentar dos valores simultáneos de la variable:
■ Estudio sobre el ocio
◻ Mal: De los siguientes, qué le gusta: (deporte, cine)
◻ Bien: Le gusta el deporte: (Sí, No)
◻ Bien: Le gusta el cine: (Sí, No)
◻ Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)
14. 1
4
Presentación ordenada de datos:
Tabla de frecuencias.
● Las tablas de frecuencias y las representaciones gráficas son dos
maneras equivalentes de presentar la información. Las dos
exponen ordenadamente la información recogida en una muestra.
Género Frec.
Hombre 4
Mujer 6
15. 1
5
Datos desordenados y ordenados en
tablas
● Variable: Género
– Modalidades:
● H = Hombre
● M = Mujer
● Muestra:
M H H M M H M M M H
– equivale a
HHHH MMMMMM
Género Frec.
Frec. relat.
porcentaje
Hombre 4 4/10=0,4=40%
Mujer 6 6/10=0,6=60%
10=tamaño
muestral
16. 1
6
Ejemplo:
● ¿Cuántos individuos tienen menos de 2
hijos?
– frec. indiv. sin hijos
+
frec. indiv. con 1 hijo
= 419 + 255 = 674 individuos
● ¿Qué porcentaje de individuos tiene 6
hijos o menos?
– 97,3%
● ¿Qué cantidad de hijos es tal que al
menos el 50% de la población tiene una
cantidad inferior o igual?
– 2 hijos
≥50%
17. Gráficos para variables cualitativas
(Básicamente sólo se pueden contar)
● Diagramas de barras
– Alturas proporcionales a las frecuencias (abs. o rel.)
– Se pueden aplicar también a variables discretas
■ Diagramas de sectores (tartas, polares)
◻ No usarlo con variables ordinales.
◻ El área de cada sector es proporcional a su frecuencia
(abs. o rel.)
18. 1
8
■ Pictogramas
◻ Fáciles de entender.
◻ El área de cada modalidad debe ser proporcional a la
frecuencia.
◻ El dibujo debe tener relación con el tipo de dato
recogido.
◻ ¿De los dos, cuál es incorrecto?.
Gráficos para variables cualitativas
(Básicamente sólo se pueden contar)
19. 1
9
Gráficos diferenciales para variables
cuantitativas (numéricas)
● Son diferentes en función de que las variables
sean discretas o continuas. Valen con frec.
absolutas o relativas.
– Diagramas barras para v. discretas
● Se deja un hueco entre barras para indicar los valores que
no son posibles
◻ Histogramas para v. continuas
■ El área que hay bajo el histograma entre dos puntos
cualesquiera indica la cantidad (porcentaje o frecuencia) de
individuos en el intervalo.