Prueba de hipótesis (estadística)

De Wikiversidad

Es un procedimiento estadístico que permite aceptar o rechazar una afirmación hecha con respecto a un fenómeno o suceso.

El procedimiento consta de seis (6) pasos

Tipos de Hipótesis[editar]

Se les denomina así a los supuestos (hipótesis) realizados con respecto a un parámetro o estadístico (media, proporción, entre otros).

En este paso se definen dos tipos de hipótesis:

  • Ho: Hipótesis nula
  • H1: Hipótesis alterna (de la cual se sospecha pudiera ser cierta, es planteada por el investigador)

Planteamiento con una variable[editar]

Este tipo de desarrollo va de la forma: "¿Se podría afirmar que el promedio de tiempo que se demora una persona en vestirse es de 10 minutos?".

En el cual se desea averiguar de una variable si la cantidad inducida es correcta o falsa.

Dependiendo de cómo se plantee la incógnita, se pueden distinguir tres casos:

CASO I CASO II CASO III
*Ho: U = 10 min
*H1: U 10 min
*Ho: U = 10 min
*H1: U > 10 min
*Ho: U = 10 min
*H1: U < 10 min
El tiempo promedio que se demora una persona en vestirse no es igual o es diferente a 10 minutos El tiempo promedio que se demora una persona en vestirse es más o superior a 10 minutos El tiempo promedio que se demora una persona en vestirse es menos o inferior a 10 minutos

Planteamiento con dos variables o por comparación[editar]

Este tipo de desarrollo va de la forma: "¿Se podría afirmar que las ganancias de las empresas medianas han crecido este año con respecto al año anterior?".

En el cual se compara un valor predefinido con respecto a una suposición entre una variable con otra variable para determinar si esta es correcta o falsa.

Dependiendo de cómo se plantee la incógnita, se pueden distinguir tres casos:

CASO I CASO II CASO III
*Ho: U1 = U2
*H1: U1 U2
*Ho: U1 = U2
*H1: U1 > U2
*Ho: U1 = U2
*H1: U1 < U2
Las ganancias de las empresas medianas en este año no son iguales o son diferentes al año anterior Las ganancias de las empresas medianas en este año son más o superiores al año anterior Las ganancias de las empresas medianas en este año son menos o inferiores al año anterior

Nivel de significancia (α)[editar]

Se le conoce así al error máximo adoptado al momento de rechazar la hipótesis nula (Ho) cuando es verdadera.

Dependiendo del tipo de significación que se da al estudio, hay tres grados:

  • α = 0.01 → Demasiado significativo
  • α = 0.05 → Significativo
  • α = 0.10 → Poco significativo

Región de aceptación y rechazo[editar]

Cuando...
H1: H1: < H1: >
Área de aceptación y rechazo desigual
Área de aceptación y rechazo desigual
Área de aceptación y rechazo menor
Área de aceptación y rechazo menor
Área de aceptación y rechazo mayor
Área de aceptación y rechazo mayor

Valor de la distribución 'Z' o 't'[editar]

Véase: Tabla de la distribución t-Student para valores tipo " t "

En este paso se procede a ubicar el intervalo de confianza para su próxima colocación en el gráfico de "aceptación y rechazo".

Hay dos formas de encontrar dicho valor: mediante la tabla " Z " o la tabla " t ".

Para definir cuál es la tabla en la que se buscará la información, se debe de considerar el número de datos con los que se cuenta.

  • Si la cantidad de datos sobrepasa o es igual a 30, se usará la tabla " Z "
  • Si la cantidad de datos son menores a 30, se usará la tabla " t ".

Ejemplo:

  • "De una muestra de 30 alumnos..." - Se usa la tabla Z.
  • "Se encuestó a 14 personas..." - Se usa la tabla t.

Determinar el intervalo de confianza[editar]

El intervalo de confianza es el punto que separa a la Región de Aceptación y Rechazo.

Una variable[editar]

Tabla Z[editar]

Para hallar el intervalo en esta tabla se sigue la siguiente fórmula:


Donde:

α = Nivel de significancia

Tabla t[editar]

Para hallar el intervalo en la tabla t-student se sigue la siguiente fórmula:

Para cuando H1 es " < " o " > " Para cuando H1 es " "






Donde:

α = Nivel de significancia
n = Cantidad de datos

Donde:

α = Nivel de significancia
n = Cantidad de datos


Dos variables[editar]

Tabla Z[editar]

Para hallar el intervalo en esta tabla se sigue la siguiente fórmula:

Para usar esta fórmula, tanto n1 y n2 tienen que tener un valor mayor o igual a 30

n1 ≥ 30
n2 ≥ 30

Donde:

α = Nivel de significancia

Tabla t[editar]

Para hallar el intervalo en la tabla t-student se sigue la siguiente fórmula:

Para usar esta fórmula, por lo menos n1 o n2 tiene que tener un valor inferior a 30

n1 < 30
n2 < 30






Donde:

α = Nivel de significancia
n = Cantidad de datos

Donde:

α = Nivel de significancia
n = Cantidad de datos

Estadística de prueba 'Z' o 't'[editar]

Una media o promedio[editar]

Para muestras mayores o igual a 30[editar]



Donde:

= Promedio parcial (de la muestra)
= Desviación poblacional total
= Valor de la hipótesis
= Número de datos

Para muestras menores a 30[editar]



Donde:

= Promedio parcial (de la muestra)
= Desviación de la muestra
= Valor de la hipótesis
= Número de datos .

Una proporción o porcentaje[editar]

Para muestras mayores o igual a 30[editar]



Donde:

= Proporción de la muestra

Se puede conseguir de la siguiente forma, si el problema no lo da

= Valor numérico de la muestra
= Proporción poblacional (total)
= Número de datos

Para muestras menores a 30[editar]



Donde:

= Proporción de la muestra

Se puede conseguir de la siguiente forma, si no el problema no lo da

= Valor numérico de la muestra
= Proporción poblacional (total)
= Número de datos


Diferencia de dos medias o promedios[editar]



Donde:

= Promedio de la primera variable
= Promedio de la segunda variable
= Porcentaje de la primera variable (si no se especifica es 100 (%))
= Porcentaje de la segunda variable (si no se especifica es 100 (%))
= Desviación de la primera variable
= Desviación de la segunda variable
= Número de datos de la primera variable(total)
= Número de datos de la segunda variable(total)


Diferencia de proporciones o porcentajes[editar]



donde:




Donde:

= Promedio de la primera variable en proporción (por ejemplo: 0.30)
= Promedio de la segunda variable en proporción

Se puede conseguir de la siguiente forma, si es un porcentaje
   o   

= Promedio de la primera variable en porcentaje (por ejemplo: 30 (%))
= Promedio de la segunda variable en porcentaje (por ejemplo: 30 (%))
= Porcentaje de la primera variable (si no se especifica es 100 (%))
= Porcentaje de la segunda variable (si no se especifica es 100 (%))
= Número de datos de la primera variable(total)
= Número de datos de la segunda variable(total)

Decisión[editar]