Ejercicio de prueba de hipótesis estadística pdf
Atención, un error frecuente: en un estudio de no inferioridad que utiliza una prueba de una cola, un resultado no significativo no permite afirmar que no hay diferencia entre los 2 tratamientos y que, por tanto, son equivalentes. Sólo significa que el estudio no demuestra la superioridad del nuevo tratamiento sobre el de referencia.
De hecho, la ley de los grandes números indica que cuando se realiza un sorteo de una serie grande, cuanto mayor sea el tamaño de la muestra, más se acercarán las características estadísticas del sorteo (la muestra) a las características estadísticas de la población.
1. Messerli FH. Consumo de chocolate, función cognitiva y premios Nobel. New England Journal of Medicine [Internet]. 2012 Oct 18 [citado 2016 Apr 27];367(16):1562-4. Disponible en: http://dx.doi.org/10.1056/NEJMon1211064
¿Cómo se puede formular una hipótesis alternativa?
La hipótesis alternativa, H1, es la negación de H0 y equivale a decir “H0 es falsa”. La decisión de rechazar H0 significa que o bien H1 es verdadera o bien H1 es falsa. Nota: Existe una importante asimetría en las conclusiones de las pruebas.
¿Cómo sabemos si rechazamos H0?
La decisión de rechazar o no la hipótesis nula en una prueba de hipótesis. Para tomar una decisión, elija el nivel de significación α (alfa), antes de realizar la prueba: Si p es menor o igual que α, rechace H0.
Hipótesis nula y ejemplo alternativo
Supongamos que estas mediciones siguen una distribución normal. Si el instrumento fuera insesgado (= 50), ¿cuál sería la probabilidad de que la media de la muestra se alejara tanto del valor de referencia?
En nuestro ejemplo del principio del curso, ¿podríamos calcular la potencia de la prueba, es decir, la probabilidad de detectar un sesgo del instrumento con la muestra de 9 mediciones? ¿Qué información adicional necesitamos?
A diferencia del nivel de significación, que es elegido por el analista, la potencia de una prueba depende (entre otras cosas) del tamaño real del efecto. En nuestro ejemplo, para un tamaño y diseño fijos, es más fácil detectar un sesgo grande que un sesgo pequeño.
La tabla de datos InsectSprays incluida en R contiene datos de un experimento de Geoffrey Beall (1942) sobre el número de insectos (recuento) en parcelas tratadas con diferentes insecticidas (pulverización), con 12 mediciones independientes por tipo de insecticida.
Prueba de hipótesis estadística Ejercicio corregido
El intervalo de confianza proporciona un rango de valores probables para la proporción de la población. Como las muestras son aleatorias, es poco probable que dos muestras de una población den intervalos de confianza idénticos. Sin embargo, si se repitiera el muestreo muchas veces, un cierto porcentaje de los intervalos o límites de confianza resultantes contendría la proporción poblacional desconocida. El porcentaje de estos intervalos de confianza o límites que contienen la proporción es el nivel de confianza del intervalo. Por ejemplo, un nivel de confianza del 95% indica que, de 100 muestras tomadas al azar de la población, aproximadamente 95 de ellas deben producir intervalos que contengan la proporción poblacional.
El intervalo de confianza proporciona un rango de valores probables para la proporción poblacional. Como las muestras son aleatorias, es poco probable que dos muestras de una población den intervalos de confianza idénticos. Sin embargo, si se repitiera el muestreo muchas veces, un cierto porcentaje de los intervalos o límites de confianza resultantes contendría la proporción poblacional desconocida. El porcentaje de estos intervalos de confianza o límites que contienen la proporción es el nivel de confianza del intervalo. Por ejemplo, un nivel de confianza del 95% indica que, de 100 muestras tomadas al azar de la población, aproximadamente 95 de ellas deben producir intervalos que contengan la proporción poblacional.
Hipótesis nula estadística
La importancia de las ecuaciones lineales radica no sólo en el hecho de que muchas correlaciones son de esta forma, sino también en que pueden proporcionar buenas aproximaciones de correlaciones complicadas que serían difíciles de describir en términos matemáticos. Un conjunto de pares de variables se denomina población bivariante o población definida por dos variables. Los mínimos cuadrados y la regresión lineal se aplican a poblaciones bivariadas. Los siguientes gráficos de dispersión describen los datos de la tabla: 0 1 2 3 4 5 6 7 8 9 10 1 2 4 3 6 8 10 9 7 12 con una aproximación lineal de los datos :
Con el conjunto de datos [ 0 1 2 3 4 5 6 7 8 9 10 1 2 4 4 3 6 8 10 9 7 12 ], ∙ ∑_{i=1}ⁿX_{i}Y_{i}=(0⋅1) +(1⋅2) +(2⋅4) +(3⋅4) +(4⋅3) +(5⋅6) +(6⋅8) +(7⋅10) +(8⋅9) +(9⋅7) +(10⋅12)= 437 ∙ ∑_{i=1}ⁿX_{i}=0+1+2+3+4+5+6+7+8+9+10= 55 ∙ ∑_{i=1}ⁿY_{i}=1+2+4+3+6+8+10+9+7+12= 66 ∙ ∑_{i=1}ⁿX_{i}=0²+1²+2²+3²+4²+5²+6²+7²+8²+9²+10²= 385 ∙