Este documento describe diferentes métodos para analizar y presentar datos estadísticos, incluyendo gráficas de barras, diagramas de Pareto, distribuciones de frecuencia, histogramas y medidas de tendencia central y dispersión. Explica cómo estas técnicas pueden usarse para resumir y visualizar datos cualitativos y cuantitativos de una manera que revele patrones y proporcione información útil.
1. Licenciatura en Educación Preescolar
Ciclo escolar 2017 – 2018 3° Semestre “B”
Curso: Procesamiento de información estadística.
Alumna: Oronzor Castillo Isela Benazir.
ANÁLISIS DESCRIPTIVO Y PRESENTACIÓN DE DATOS DE
UNA VARIABLE.
Existen varias formas gráficas (visuales) para describir la información.
Datos cualitativos:
Gráficas de pastel (gráficas circulares) y gráficas de barras: Gráficas que se
usan para resumir datos cualitativos, atributos o categóricos. Las gráficas
de pastel (gráficas circulares) muestran la cantidad de datos que
pertenecen a cada categoría como una parte proporcional de un círculo.
Las gráficas de barras muestran la cantidad de datos que pertenecen a
cada categoría como un área rectangular del tamaño proporcional.
Cuando la gráfica de barras se presenta en la forma de un diagramade Pareto,
presenta información adicional y muy útil.
Diagrama de Pareto: Gráfica de barra con las barras ordenadas de la
categoría más numerosa a la categoría menos numerosa. Incluye una
gráfica de línea que muestra los porcentajes acumulados y conteos de las
barras.
Es popular en aplicaciones de control de calidad. Un diagrama de Pareto
de tipos de defecto mostrará aquellos que tengan el mayor efecto sobre
la tasa de defectos en orden de efecto. Entonces es fácil ver cuáles
defectos deben observarse para reducir de manera más efectiva la tasa de
defectos.
Datos cuantitativos:
Una de las principales razones para construir una gráfica de datos
cuantitativos es mostrar su distribución.
La Distribución es un patrón de variabilidad que muestran los datos de
una variable. La distribución muestra la frecuencia de cada valor de la
variable.
Una de las gráficas más simples usadas para mostrar una distribución es
la gráfica de puntos: Describe los datos de una muestra al representar
cada valor de datos con un punto colocado a lo largo de una escala. Esta
escala puede ser horizontal o vertical. La frecuencia de los valores se
representa a lo largo de la otra escala.
Es una técnica conveniente que se usa cuando uno comienza a analizar los
datos. Resulta en una imagen de los datos que los ordena numéricamente.
Se ha vuelto popular una técnica conocida como:
2. Licenciatura en Educación Preescolar
Ciclo escolar 2017 – 2018 3° Semestre “B”
Curso: Procesamiento de información estadística.
Alumna: Oronzor Castillo Isela Benazir.
Presentación de tallo y hojas (para resumir datos numéricos): Presenta los
datos de una muestra con los dígitos reales que constituyen los valores de
datos. Cada valor numérico se divide en dos partes: el (los) dígito(s)
inicial(es) es (son) el tallo y los dígitos posteriores son las hojas. Los tallos
se ubican a lo largo del eje principal y para cada valor de datos se ubica
una hoja de modo que muestre la distribución de los datos.
Es bastante usual que muchas variables presenten una distribución que esté
concentrada (ajustada) en torno a un valor central y después en alguna forma
dispersa en una o ambas direcciones.
Una presentación gráfica revela algo que el analista puede o no haber
anticipado.
Distribuciones de frecuencia e histogramas.
Distribución de frecuencias: Listado, con frecuencia expresado en forma de
tabla, que relaciona los valores de una variable con su frecuencia.
Frecuencia: es el número de veces que el valor x ocurre en la muestra.
Distribución de frecuencias no agrupadas: “No agrupadas” porque cada valor
de x en la distribución es independiente.
Distribución de frecuencia agrupada: Cuando un conjunto grande de datos
tiene muchos valores x diferentes en lugar de algunos valores repetidos.
Lineamientos básicos para construir una distribución de frecuencia
agrupada:
Cada clase debe ser del mismo ancho.
Las clases (en ocasiones llamadas cajas) deben establecerse de modo que
no se traslapen y de modo que cada valor de dato pertenezca exactamente
a una clase.
Usa un sistema que saque ventaja de algún patrón para garantizar
precisión.
Cuando sea conveniente, con frecuenciaex ventajoso un ancho de clase par.
Una vez establecidas las clases, es necesarios ordenar los datos en dichas
clases.
El método para ordenar dependerá del formato actual de los datos.
Histograma: Gráfica de barras que representa una distribución de frecuencias
de una variable cuantitativa. Un histograma se constituye con los
componentes siguientes:
Un título, que identifica la población o muestra de interés.
3. Licenciatura en Educación Preescolar
Ciclo escolar 2017 – 2018 3° Semestre “B”
Curso: Procesamiento de información estadística.
Alumna: Oronzor Castillo Isela Benazir.
Una escala vertical, que identifica las frecuencias en las diversas
clases.
Una escala horizontal, que identifica a la variable x. Los valores para
los límites de clase o puntos medios de clase pueden etiquetarse a lo
largo del eje x. Usa cualquier método etiquetado de ejes que
represente mejor la variable.
Frecuencia relativa: Medida proporcional de la frecuencia para una ocurrencia.
Se encuentra al dividir la clase ente el número total de observaciones. Puede
expresarse en fracción común, en forma decimal o como porcentaje.
Los histogramas son herramientas valiosas.
Formas de histogramas:
Simétrico: Ambos lado de esta distribución son idénticos (las mitades son
imágenes especulares)
Normal: Una distribución simétrica que se amontona en torno a la media
y se dispersa en los extremos.
Uniforme (rectangular): Cada valor aparece con igual frecuencia.
Sesgado: Una cola se prolonga más que la otra. La dirección de asimetría
está en el lado de la cola más larga.
Forma de J: No hay cola al lado de la clase con la frecuencia más alta.
Bimodal: Las dos clases más pobladas están separadas por una o más
clases. Con frecuencia, esta situación implica que se muestrearon dos
poblaciones.
Moda: Valor de los datos que ocurren con mayor frecuencia.
Clase modal: es la clase con la frecuencia más alta.
Distribución bimodal: tiene dos clases de frecuencia alta, separadas por clases
con frecuencias menores. No es necesario que las dos frecuencias altas sean
iguales.
Distribución de frecuencias acumuladas: Distribución de frecuencias que
relaciones frecuencias acumuladas on valores de la variable.
Frecuencia acumulada: Para una clase dad es la suma de la frecuencia para
dicha clase y las frecuencias de todas las clases de valores menores.
Ovija: Gráfica de línea de una frecuencia acumulada o distribución de
frecuencias relativas acumuladas.
Medidas de tendencia central.
Las medidas de tendencia central son valore numéricos que ubican, en
cierto sentido, el centro de un conjunto de datos.
4. Licenciatura en Educación Preescolar
Ciclo escolar 2017 – 2018 3° Semestre “B”
Curso: Procesamiento de información estadística.
Alumna: Oronzor Castillo Isela Benazir.
Media (Media aritmética).
Mediana: Valor de los datos que ocupan la posición media cuando los datos
se clasifican en orden de acuerdo con su tamaño.
Moda: Es el valor de x que ocurre con más frecuencia.
Medio rango: Número exactamente a la mitad de un dato de valor más bajo,
L y un dato de valor más alto, H. Se encuentra al promediar los valores bajo y
alto.
Medidas de dispersión.
Incluyen rango, varianza y desviación estándar. Dichos valores numéricos
describen la cantidad de dispersión o variabilidad, que se encuentra entre los
datos: los datos estrechamente agrupados tienen valores relativamente
pequeños y los datos más ampliamente dispersos tienen valores más grandes.
Rango: Diferencia en valor entre los datos con valor más alto, H y los datos
con valor más bajo, L:
Desviación de la media: Es una desviación de la media, x – x, es la diferencia
entre el valor x y la media.
Varianza muestral: Es la medida de las desviaciones al cuadrado, calculada con
n-1 como el divisor.
Desviación estándar muestral: La desviación estándar de una muestra, s, es la
raíz cuadrada positiva de la varianza.