Pruebas de bondad de ajuste

INTRODUCCIÓN

Una de las bases fundamentales del control estadístico de la calidad es la inferencia estadística. Por ello, la determinación del tipo de distribución correspondiente a un conjunto de datos provenientes del estudio es absolutamente necesaria. La prueba de bondad de ajuste permite probar el ajuste de los resultados de un experimento a una distribución de probabilidad teóricasujeto a un error o nivel de confianza.
El método en cuestión se basa en la comparación de las frecuencias absolutas observadas y las frecuencias absolutas esperadas, calculadas a partir de la distribución teórica en análisis.

Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos se ajustan a una determinada distribución, esta distribución puede estar completamenteespecificada (hipótesis simple) o perteneciente a una clase paramétrica (hipótesis compuesta).
Las pruebas de Bondad de Ajuste más comúnmente conocidas, son:
•Anderson-Darling
•Chi-Cuadrada
• Kolmogorov-Smirnov
La prueba Chi-Cuadrada se emplea tanto para distribuciones continuas como para discretas, mientras que la de Kolmogorov-Smirnov como la de Anderson Darling se emplean sólo para distribucionescontinuas.

Prueba ?² Distribución Normal
Esta prueba se usa cuando se quiere probar la hipótesis de que unos datos muéstrales provienen de una determinada distribución.
La prueba chi cuadrado se basa en la comparación entre la frecuencia observada en un intervalo de clase y la frecuencia esperada en dicho intervalo, calculada de acuerdo con la hipótesis nula formulada. Es decir, se quieredeterminar si las frecuencias observadas en la muestra están lo suficientemente cerca de las frecuencias esperadas bajo la hipótesis nula.
Para esta prueba es necesario agrupar o distribuir las observaciones de la muestra en intervalos de clase, preferiblemente del mismo tamaño. El estadístico de prueba está definido como:
[pic]
donde:
Oi = Total de valores que caen en el intervalo i.
Ei = Númeroesperado de valores en el intervalo i.
k = Número de intervalos de clase en que se distribuyen las observaciones.
Si los límites del intervalo de clase i están dados por Xi-1 y Xi, como lo ilustra la presente gráfica, el número esperado de observaciones para ese intervalo está dado por:
Ei =nPi
donde Pi representa la probabilidad de que una observación quede en el intervalo i, de acuerdo confunción de densidad que se esté analizando, y n es el número total de observaciones.
La probabilidad de que una observación caiga en el intervalo i está dada por:
[pic]

donde f0(x,?) es la función de densidad de la variable aleatoria X, bajo la hipótesis nula.
Para ver que distribución sigue el estadístico X², considere la siguiente situación:
Suponga que las observaciones de la muestrapueden clasificarse en dos intervalos o categorías. Sea Y1 el número de observaciones que caen en la categoría 1, y sea P1 su respectiva probabilidad.
Si el tamaño de muestra es lo suficientemente grande, Y1 (que sigue una distribución binomial) puede aproximarse por una distribución normal con valor esperado nP1 y varianza nP1(1-P1). Por lo tanto, la variable Z definida a continuación sigue unadistribución normal estándar, y Z² una distribución chi cuadrado con un grado de libertad.
[pic]
[pic]

• Ejercicio 1
A un grupo de 80 empleados se les ha aplicado una prueba de habilidad espacial. En una graduación de 0 a 100 han obtenido las puntuaciones dadas en la tabla siguiente. Se pide verificar la hipótesis de que los puntajes se pueden ajustar a una distribución normal.
[pic]Análisis:
Media = 55.8
S = 18.6
El puntaje mínimo fue de 14 y el máximo de 93
Rango = R = Rango = Xmax – Xmin = 93 – 14 = 79

k = 1 +3.32 Log10 (80) = 7.32 ? 8

[pic]? 10

Ho: f(x,?) = N(?, ?²)=N((=55,8 ; (=18,6)

Ha: f(x,?) ? N(?, ?²)

Cálculos:
?=5%
4 grados de libertad
?² = 9.49

[pic]
[pic]
[pic]
Para los demás valores Pi se calculó como: Pi = F(Xi) – F(Xi-1) = ?(zi)-…