Prueba de hipótesis: definición, ejemplos

Recuerde que las estadísticas a menudo apuntan a hacer inferencias sobre parámetros poblacionales desconocidos basándose en la información contenida en datos de muestra. Estas inferencias se expresan de dos maneras;

como estimaciones de los respectivos parámetros o
como pruebas de hipótesis sobre sus valores.

En muchos sentidos, el procedimiento formal para probar hipótesis es similar al método científico. El científico observa la naturaleza, formula una teoría y luego la contrasta con las observaciones.

Aprenda las pruebas de hipótesis.

En nuestro contexto de prueba de hipótesis, el investigador establece una hipótesis relativa a uno o más parámetros poblacionales: que son iguales a algunos valores específicos.

Luego toma una muestra de la población y compara sus observaciones con la hipótesis. Si las observaciones no concuerdan con la hipótesis, el investigador la rechaza.

De lo contrario, el investigador concluye que la hipótesis es cierta o que la muestra no logró detectar las diferencias entre el valor real y el valor hipotético de los parámetros de la población.

Examina los siguientes casos:

Es posible que un bioquímico desee determinar la sensibilidad de una nueva prueba para el diagnóstico del cáncer;
Un gerente de producción afirma que el número promedio de conjuntos defectuosos (que no cumplen con los estándares de calidad) producidos cada día es 25;
Un servidor de Internet puede necesitar verificar si los usuarios de computadoras en el país dedican, en promedio, más de 20 horas a navegar;
Un investigador médico puede plantear la hipótesis de que un nuevo fármaco es más eficaz que otro para combatir una enfermedad;
Un ingeniero eléctrico puede sospechar que las fallas eléctricas en las áreas urbanas son más frecuentes en las áreas rurales que en las urbanas.

Las pruebas de hipótesis estadísticas abordan los problemas anteriores con los datos obtenidos. Podemos ahora proponer la siguiente definición de hipótesis estadística.

Hipótesis Significado

Una hipótesis estadística es una declaración o suposición sobre uno o más parámetros poblacionales. Nuestro objetivo en la prueba de hipótesis es verificar si la hipótesis es cierta o no en función de datos de muestra.

El enfoque convencional para la prueba de hipótesis no es construir una única hipótesis sino formular dos hipótesis diferentes y opuestas.

Estas hipótesis deben construirse de manera que si se rechaza una hipótesis, se acepta la otra y viceversa. Estas dos hipótesis en una prueba estadística normalmente se denominan hipótesis nula y alternativa.

La hipótesis nula, denotada por H_oh, es la hipótesis a probar. La hipótesis alternativa, denotada por h₁ es la hipótesis que, en algún sentido, contradice la hipótesis nula.

Ejemplo 1

Un área actual de interés de investigación es la agregación familiar de factores de riesgo cardiovascular en general y de los niveles de lípidos en particular. Supongamos que se sabe que el nivel promedio de colesterol en los niños es de 175 mg/dl. Se identifica un grupo de hombres que han muerto por enfermedades cardíacas durante el último año y se miden los niveles de colesterol de sus hijos.

Queremos verificar si

El nivel medio de colesterol de estos niños es de 175 mg/dl.
El nivel medio de colesterol de estos niños es superior a 175 mg/dl.

Este tipo de pregunta se formula en un marco de prueba de hipótesis especificando las hipótesis nula y alternativa. En el ejemplo anterior, la hipótesis nula es que el nivel promedio de colesterol de estos niños es de 175 mg/dl.

Esta es la hipótesis que queremos probar. La hipótesis alternativa es que el nivel medio de colesterol de estos niños es superior a 175 mg/dl. Las hipótesis subyacentes se pueden formular de la siguiente manera;

Hipótesis nula	h₀ : µ = 175
Hipótesis alternativa	h₁ : µ > 175

También suponemos que la distribución subyacente es normal bajo cualquiera de las hipótesis. Estas hipótesis se pueden escribir en términos más generales de la siguiente manera:

Hipótesis nula	h₀ : µ = µ₀
Hipótesis alternativa	h₁ : µ > µ₁

Podemos encontrar dos tipos de error al aceptar o rechazar una hipótesis nula. Podemos rechazar erróneamente una hipótesis nula verdadera. Esto conduce a un error, que llamamos error tipo I.

El segundo tipo de error, llamado error tipo II, ocurre cuando aceptamos una hipótesis nula cuando es falsa, es decir, cuando una alternativa es verdadera.

Cuando no se comete ningún error, llegamos a una decisión correcta. La decisión correcta se puede lograr aceptando una hipótesis nula verdadera o rechazando una hipótesis nula falsa. En la tabla adjunta se muestran cuatro posibles resultados con tipos de error asociados que cometemos en nuestra decisión:

Decisión	Ho es verdad	Hola es verdad
Rechazar h_oh	error tipo I P(error tipo I) = α	decisión correcta P(Decisión correcta) = 1 – ß
Aceptar h_oh	decisión correcta P(Decisión correcta) = 1-α	Error tipo II P(error tipo II) = ß

La probabilidad de cometer un error de tipo I generalmente se denota por a y comúnmente se la conoce como nivel de significancia de una prueba:

α = P (error tipo I) = P(rechazando H₀cuando h₀ es verdad )

La probabilidad de cometer un error tipo II suele denotarse por ß:

ß = P (error tipo II) = P (aceptar H₀ cuando es h₁ verdadero )

El complemento de ß, es decir, 1- ß, se conoce comúnmente como fuerza de una prueba.

1- ß = 1 – P = P (rechazando H₀ cuando h₁ es verdad )

¿Cuáles son los errores de tipo I y tipo II para los datos del Ejemplo #1?

Se cometerá el error tipo I si decidimos que los hijos de hombres que han muerto por enfermedades cardíacas tienen un colesterol promedio superior a 170 mg/dl cuando su nivel promedio de colesterol es de 175 mg/dl.

Se cometerá el error tipo II si decidimos que la descendencia tiene niveles de colesterol normales cuando, en realidad, sus niveles de colesterol están por encima de la media.

Nivel significativo

El nivel de significancia es la probabilidad crítica de elegir entre la hipótesis nula y la alternativa. El nivel de probabilidad es demasiado bajo para justificar el apoyo de la hipótesis nula.

El nivel de significancia se expresa habitualmente como un porcentaje, como 5% o 1%. Un nivel de significancia de, digamos, 5% es la probabilidad de rechazar la hipótesis nula si es cierta.

Cuando se acepta la hipótesis en cuestión en el nivel 5%, el estadístico corre el riesgo de que, a la larga, esté tomando una decisión equivocada sobre el 5% del momento.

Estadística de prueba

El Estadística de prueba (como un estimador) es una función de las observaciones de la muestra en las que se basará la decisión estadística. El región de rechazo (RR) Especifica los valores del estadístico de prueba para el cual se aplica la hipótesis nula. rechazado a favor de la hipótesis alternativa.

Si, para una muestra particular, el valor calculado del estadístico de prueba cae en RR, rechazamos la hipótesis nula. h_oh y aceptar la hipótesis alternativa h₁.

Si el valor del estadístico de prueba no cae en la región de rechazo (crítica), aceptamos Ho. La región distinta de la región de rechazo es la región de aceptación.

Tomar decisiones

Una decisión estadística es rechazar o aceptar la hipótesis nula. La decisión dependerá de si el valor calculado del estadístico de prueba se encuentra en la región de rechazo o en la región de aceptación.

Supongamos que la hipótesis se está probando a un nivel de significancia de 5% y los resultados observados tienen probabilidades inferiores a 5%. En ese caso, consideramos significativa la diferencia entre las estadísticas de la muestra y el parámetro desconocido.

prueba de hipótesis toma de decisión ejemplo 1

En otras palabras, creemos que el resultado de la muestra es tan raro que no puede explicarse únicamente por la variación aleatoria. Luego rechazamos la hipótesis nula y afirmamos que las observaciones de la muestra son inconsistentes con la hipótesis nula.

prueba de hipótesis toma de decisiones ejemplo 2

Por otro lado, si a un nivel de significancia de 5%, el conjunto de valores observados tiene una probabilidad de más de 5%, damos una razón de que la diferencia entre el resultado de la muestra y el valor del parámetro desconocido puede explicarse por la variación aleatoria y por lo tanto no es estadísticamente significativo.

En consecuencia, decidimos no rechazar la hipótesis nula y afirmamos que las observaciones de la muestra no son inconsistentes con la hipótesis nula.

Prueba de una y dos colas

Una prueba de una cola es una prueba en la que se permite que los valores del parámetro que se está estudiando (en nuestro ejemplo anterior, el nivel medio de colesterol) bajo la hipótesis alternativa sean mayores o menores que los valores del parámetro bajo la hipótesis nula. hipótesis, pero no ambas.

Es decir, formulamos hipótesis nulas y alternativas para una prueba de una cola de la siguiente manera:

Hipótesis nula	h₀ : µ = µ₀
Hipótesis alternativa	h₁ : µ < µ₀ o μ > μ₀

Una prueba de dos colas es una prueba en la que se permite que los valores del parámetro que se estudia bajo la hipótesis alternativa sean mayores o menores que los valores del parámetro bajo la hipótesis nula.

Formulamos las hipótesis bajo la prueba de dos colas de la siguiente manera:

Hipótesis nula	h₀ : µ = µ₀
Hipótesis alternativa	h₁ : µ ≠ µ₁

Es muy importante darnos cuenta de si estamos interesados en una prueba de una o dos colas en una aplicación particular.

Valor p y su interpretación

Hay dos enfoques para probar una hipótesis estadística: el método del valor crítico y el método de los 72 valores.

El enfoque general en el que calculamos una estadística de prueba y determinamos el resultado de una prueba comparando la estadística de prueba con un valor crítico determinado por el error tipo I se denomina método de prueba de hipótesis del valor crítico.

El valor p para cualquier prueba de hipótesis es el nivel alfa (a) en el que seríamos indiferentes entre aceptar o rechazar la hipótesis nula dados los datos de muestra disponibles.

Es decir, el valor es el nivel en el que el valor dado del estadístico de prueba (como t, F, chi-cuadrado) estaría en el límite entre las regiones de aceptación y rechazo.

El valor p también se puede considerar como la probabilidad de obtener un estadístico de prueba tan extremo o más extremo que el estadístico de prueba real obtenido, dado que la hipótesis nula es verdadera.

Los programas de análisis de datos estadísticos suelen calcular los valores p durante la ejecución de la prueba de hipótesis. Las reglas de decisión que siguen la mayoría de los investigadores al exponer sus resultados son las siguientes:

Si el pag-el valor es inferior a 0,01, los resultados son muy significativos.
Si el valor de p está entre 0,01 y 0,05, los resultados se consideran estadísticamente significativos.
Si el valor p está entre 0,05 y 0,10, los resultados sólo tienden a la significación estadística.
Si el valor p es mayor que 0,10, los resultados se consideran insignificantes..

Pasos en una prueba estadística

Cualquier prueba estadística de hipótesis funciona de manera similar y está compuesta por los mismos elementos esenciales. El procedimiento general para una prueba estadística es el siguiente:

Plantee la hipótesis nula (H_oh) y su alternativa (H_t). Es una prueba de una cola si la hipótesis alternativa establece la dirección de la diferencia. Si no se da ninguna dirección de diferencia, se trata de una prueba de dos colas.
Elija el nivel de significancia deseado. Si bien α=0,05 y α=0,01 son los más comunes, también se utilizan muchos otros.
Calcule el estadístico de prueba apropiado de los datos de la muestra (normal, t).
Encuentre el valor crítico utilizando tablas integrales normales correspondientes a la región crítica establecida.
Con los valores críticos determinados en el paso 4, compare la estadística de prueba calculada en el paso 3.
Tomar la decisión: rechazar la hipótesis nula si el estadístico de prueba calculado cae en la región crítica y aceptar la alternativa (o suspender la decisión)

Algunas pruebas de significancia utilizadas comúnmente

Esta sección proporciona una descripción general de algunas pruebas estadísticas representativas de la amplia gama disponible para los investigadores.

Esta sección reconoce dos clases generales de pruebas de significancia: paramétricas y no paramétricas.

Los procedimientos estadísticos que requieren la especificación de la distribución de probabilidad de la población se denominan pruebas paramétricas.

Por el contrario, los procedimientos no paramétricos son enfoques sin distribución que no requieren especificación de la distribución de la población subyacente.

Las pruebas paramétricas son más poderosas porque sus datos se derivan de mediciones de intervalos y razones.

Las pruebas no paramétricas se utilizan para probar hipótesis con datos nominales y ordinales. Nuestro objetivo en este texto es discutir principalmente las pruebas paramétricas de uso común.

Los supuestos para las pruebas paramétricas incluyen lo siguiente:

Las observaciones deben ser independientes.
Las observaciones se extraen de poblaciones normales.
Las poblaciones deben tener variaciones iguales.
Los niveles de medición deben ser al menos de intervalo.

Al intentar elegir una prueba de significancia particular, se deben considerar al menos tres puntos:

¿La prueba involucra una muestra, dos muestras o k-muestras?
¿Los casos individuales de las muestras son independientes o dependientes?
¿A qué niveles de medición se refieren los datos: nominal, ordinal, de intervalo o de razón?

Teniendo en cuenta las consultas anteriores, analizaremos algunas pruebas de significancia comunes. Estos incluyen, entre otros.

las pruebas normales
las pruebas t
La prueba de chi-cuadrado
La prueba F

¿Cuál es el objetivo principal de la prueba de hipótesis en estadística?

El objetivo principal de las pruebas de hipótesis en estadística es hacer inferencias sobre parámetros poblacionales desconocidos basándose en la información contenida en los datos de muestra. Estas inferencias pueden expresarse como estimaciones de los parámetros o como pruebas de hipótesis sobre sus valores.

¿Cuáles son las dos hipótesis principales utilizadas en una prueba estadística?

Las dos hipótesis principales utilizadas en una prueba estadística son la hipótesis nula (Ho) y la hipótesis alternativa (H1). La hipótesis nula es la hipótesis que se va a probar, mientras que la hipótesis alternativa contradice la hipótesis nula en algún sentido.

¿En qué se diferencia una prueba de una cola de una prueba de dos colas?

Una prueba de una cola es una prueba en la que se permite que los valores del parámetro que se estudia bajo la hipótesis alternativa sean mayores o menores que los valores del parámetro bajo la hipótesis nula, pero no ambos. Una prueba de dos colas permite que los valores del parámetro bajo la hipótesis alternativa sean mayores y menores que los valores bajo la hipótesis nula.

¿Cuál es el nivel de significancia en la prueba de hipótesis?

El nivel de significancia es la probabilidad crítica de elegir entre la hipótesis nula y la alternativa. Representa el nivel de probabilidad que es demasiado bajo para justificar el apoyo de la hipótesis nula. Los niveles de significación comunes incluyen 5% o 1%.

¿Qué son los errores tipo I y tipo II en la prueba de hipótesis?

Un error de tipo I ocurre cuando se rechaza erróneamente una hipótesis nula verdadera. Un error de tipo II ocurre cuando se acepta erróneamente una hipótesis nula falsa. La probabilidad de cometer un error de tipo I se denota por α, y la probabilidad de cometer un error de tipo II se denota por ß.

¿Cómo se utiliza el valor p en la prueba de hipótesis?

El valor p es la probabilidad de obtener un estadístico de prueba tan extremo o más extremo que el estadístico de prueba real obtenido, dado que la hipótesis nula es verdadera. Ayuda a determinar la importancia de los resultados. Si el valor p es menor que el nivel de significancia elegido, se rechaza la hipótesis nula.

¿Cuáles son algunas pruebas comunes de significancia en estadística?

Algunas pruebas comunes de significancia incluyen las pruebas normales, las pruebas t, la prueba de chi-cuadrado y la prueba F. La elección de la prueba depende de factores como el número de muestras, la independencia de los casos y el nivel de medición de los datos.