Algunas veces, cuando un analista realiza una serie de mediciones repetidas, es muy frecuente encontrarse con la situación en que uno (o posiblemente más) de los resultados que obtienen de un conjunto de medidas difiera del resto de forma inexplicable, incluso que parece estar fuera del grupo. A estas medidas se denominas resultados anómalos (outliers) o atípicos. Entonces, el analista deberá decidir si descarta ese resultado para una consideración posterior.
En algunos casos, un resultado anómalo puede atribuirse a un error humano. En el trabajo científico es aceptado como regla general que una medición se rechaza en forma automática cuando se sabe que se ha cometido un error. Como una forma de prevenir una preferencia inconsciente en las mediciones es rechazar cada resultado en el que se sabe que se ha cometido un error, a pesar de que concuerden con los otros. Es incorrecto (pero también del todo humano) rechazar resultados que estuvieron sujetos a errores conocidos cuando parecen ser discordante, es decir anómalos.
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Contraste de Grubbs. Rev. 00
1. Ejemplo:
Se obtuvieron los siguientes valores para la concentración de nitrito (mg·L-1) en una muestra de agua de río: 0,403; 0,410;
0,401; 0,380; 0,400; 0,413 y 0,411. Aplicar el contraste de Grubbs a los datos.
Considere, para los siete valores de la concentración de nitrito,
s = 0,0112 mg·L-1, pero al rechazar el valor atípico, s = 0,0056
mg·L-1, es decir, la precisión parece mejorar en un factor de 2.
1. Ordene los datos de menor a mayor.
2. Identifique el valor sospechoso.
3. Calcule la media y la desviación estándar incluyendo todos
los datos.
4. Determine el valor critico (P = 0,05).
5. Defina la diferencia entre el valor sospechoso y la media.
6. Calcular el cociente de Grubbs (G).
7. Compare el valor de G calculado, con el valor crítico.
s
2,016 < 2,020 (no rechazar el valor)
= 0,01121
x = 0,4026
Valor critico (P = 0,05) = 2,020
Valor sospechoso = 0,380
G =
0,0112
0,380 - 0,4026
G =
0,0112
0,0226
= 2,016
En ambos contrastes aplicados a los valores presentados en los diagramas de puntos,
se conserva el valor sospechoso (3,1) producto de los enmascaramiento del segundo
dato anómalo (2,9 y 1,9), respectivamente.
Ciudad Bolívar, Venezuela Código: InfoEstQui-02 / Revisión: 00
Contraste de Grubbs
#MicroClasesDeCastro / Marzo, 2021 / Por: José Luis Castro Soto
Caso Nº 1:
Si el número de réplicas es grande, descartar un valor no
es un problema importante; en primera, un solo valor
tendrá un leve efecto sobre la media, y en segundo, las
consideraciones estadísticas dan una respuesta clara,
considerando la probabilidad de que el dato sospechoso es
miembro de la misma población al igual que los otros.
Caso Nº 2:
Por otro lado, cuando el número de réplicas es pequeño
surge un verdadero dilema; el resultado divergente ejerce
un efecto significativo sobre la media, mientras que al
mismo tiempo existen datos insuficientes para permitir un
análisis estadístico real de la posición relativa del resultado
sospechoso.
Referencias Bibliográficas
Day, R., & Underwood, A. (s.f.). Química Analítica Cuantitativa (Quinta ed.). México: Prentice - Hall Hispanoamericana, S. A.
Gámez , C. (2009). Evaluación de la homogeneidad química de algunos elementos mayoritarios, minoritarios y traza, en la
Muestra Compuesta de Arcillitas de Falcón MCAF, propuesta como material de referencia. Trabajo Especial de Grado
para optar al Título de Licenciado en Geoquímica, Universidad Central de Venezuela, Departamento de Geoquimica,
Escuela de Química , Facultad de Ciencias, Caracas.
Miller, J. N., & Miller, J. C. (2002). Estadística y Quimiometría para Química Analítica (Cuarta ed.). Madrid, España: Pearson
Educación S. A.
Torres, T., & Sorto, M. (2003). Aplicación de la estadística al Análisis Químico. Trabajo de graduación para optar al grado de:
Maestro(a) En Estadística, Universidad de el Salvador, Escuela de Matemática, Facultad de Ciencias Naturales y
Matemática, Ciudad Universitaria.
@jlcastros78 Micro Clases de Castro
José Luis Castro Soto José Luis Castro Soto Micro Clases de Castro
Conclusión
Los valores finales de la media y la desviación estándar dependerá de si los datos anómalos han sido rechazados o no. Las
recomendaciones que se han sido promulgadas por diversos autores, certifican que el problema de desechar o retener un
valor divergente en una muestra pequeña en realidad no puede ser resuelto satisfactoriamente. Puesto que la discusión
sobre la precisión y la exactitud de un método depende de estos valores finales, tiene que quedar claro siempre si los datos
anómalos han sido rechazados y, si es así, por qué. Sin embargo, las iteraciones múltiples cambian las probabilidades de
detección, y la prueba de esta forma no puede usarse para muestras de tamaño seis o menos.
Agradecimientos
A los participantes del Laboratorio de Química de la Universidad Politécnica Territorial del Estado Bolívar (UPTEB): Reymond
Pérez, Alejandro Saavedra, Génesis Miranda, Rosanny Pérez, Yuber Pérez y Ze Manue Bolívar, por participar y facilitar las
fotografías empleadas en este recursos.
Entonces es casi seguro que el cuarto valor corresponda a un error en escritura, y que debería leerse 12,14 mL. Sin
embargo, incluso cuando los datos que son obviamente erróneas hayan sido eliminados o corregidos, todavía quedan datos
que pudieran ser anómalos. Entonces?
a) ¿Cómo decidir descartar un dato que parece anómalo cuando no se conoce ninguna razón para desconfiar de él?
b) ¿Deberíamos conservarlos, o deberíamos buscar algún procedimiento para comprobar estadísticamente si deben ser
rechazados?
El contraste de Grubbs
Otro contraste utilizado frecuentemente para datos anómalos es el contraste de Grubbs. Esta prueba es algo más robusta
que el de Dixon. El contrate de Grubbs compara la desviación entre el valor sospechoso y la media muestral, con la
desviación estándar de la muestra. Se utiliza cuando un sistema está bajo un buen control estadístico, para una muestra de
tamaño n en el intervalo de 3 a 150.Este contrate lo recomienda ISO preferentemente al de Dixon.
El ejemplo anterior aclara la importancia de ser cauto al rechazar datos anómalos. Cuando las medidas se repiten pocas
veces (lo que es normal en trabajo analítico), el rechazo de un valor origina una gran variación sobre la media y la desviación
estándar. En concreto, el hecho de tomar tres medidas y rechazar la que difiere más de las otras debe evitarse. Por otro
lado, si un conjunto de datos contiene dos o más resultados sospechosos, al decidir si se justifica el rechazo, surgen otras
complicaciones. La siguiente figura ilustra en forma de diagrama de puntos dos ejemplos de tales dificultades:
Introducción
Algunas veces, cuando un analista realiza una serie de mediciones repetidas, es
muy frecuente encontrarse con la situación en que uno (o posiblemente más) de
los resultados que obtienen de un conjunto de medidas difiera del resto de forma
inexplicable, incluso que parece estar fuera del grupo. A estas medidas se
denominas resultados anómalos (outliers) o atípicos. Entonces, el analista deberá
decidir si descarta ese resultado para una consideración posterior.
En algunos casos, un resultado anómalo puede atribuirse a un error humano. En
el trabajo científico es aceptado como regla general que una medición se rechaza
en forma automática cuando se sabe que se ha cometido un error. Como una
forma de prevenir una preferencia inconsciente en las mediciones es rechazar
cada resultado en el que se sabe que se ha cometido un error, a pesar de que
concuerden con los otros. Es incorrecto (pero también del todo humano) rechazar
resultados que estuvieron sujetos a errores conocidos cuando parecen ser
discordante, es decir anómalos. Por ejemplo, si se obtienen los siguientes
resultados en una valoración:
El contraste de Dixon, a veces llamado contrate Q, Prueba Q o Test-Q, es
un contraste popular para datos anómalos debido a que el cálculo es
simple. Para pequeñas muestras (tamaños de 3 a 7) el contraste evalúa
una medida sospechosa comparando la diferencia entre ella y la medida
más próxima en tamaño, con el intervalo de medidas.
Q = w
xc - xv
= w
d
Los valores críticos de G para P = 0,05 se encuentran en la
tabla de abajo. Si el valor de G calculado supera al valor crítico,
se rechaza la hipótesis de que el dato sospechoso no es
anómalo. Es decir, se acepta que el valor es anómalo.
Valores críticos de G (P = 0,05) para un contraste de dos cola
Tamaño de la muestra (N) Valor Critico
3 1,155
4 1,481
5 1,715
6 1,887
7 2,020
8 2,126
9 2,215
10 2,290
a) Hay dos datos (2,9 y 3,1), que son altamente
sospechosos al compararlos con la media (2,4) de los
datos. Claramente el posible valor anómalo (3,1) ha
sido enmascarado por el otro valor anómalo posible
(2,9), dando un valor de Q pequeño.
b) Muestra una situación diferente, donde los dos (2) datos
sospechosos (1,9 y 3,1) en lugares opuestos del
conjunto de datos. Nuevamente, trae como resultado (Q
y G) pequeños y, por tanto, no significativo debiéndose
conservar los datos sospechosos.
Tamaño de
la muestra
Contraste Q
QCrit.90%
Contraste G Valor
Critico (G)
a b a b
7 0,1818 0,3333 0,507 1,6403 1,6625 2,020
Valoración:
Replica
1
2
3
4
5
Volumen titulante (mL)
12,12
12,15
12,13
13,14
12,12
?
Para usar el contraste de Grubbs para un valor
anómalo, esto es, para probar H0: todas las medidas
proceden de la misma población. Donde la desviación
estándar (s) se calcula incluyendo el valor sospechoso.
El contraste supone que la población es normal.
G = s
Valor sospechoso - x
• Si G > Valor critico; el valor es anómalo.
Diagrama de puntos para ilustrar el problema del manejo de datos anómalos: (a)
cuando existen dos datos sospechosos en el extremo superior de los datos de
muestra, y (b) cuando existen dos datos sospechosos uno a cada extremo de datos.
a
b
2,0 2,2 2,4 2,6 2,8 3,0
x1 x2
x1 x2
2,0 2,2 2,4 2,6 2,8 3,0
x
x