Cómo crear un intervalo de confianza para la diferencia de dos medias con desviaciones estándar desconocidos y / o muestras pequeñas

Usted puede encontrar un intervalo de confianza (IC) para la diferencia entre las medias, o medias, de dos muestras de población, aun cuando las desviaciones estándar poblacionales son desconocidas y / o los tamaños de las muestras son pequeños. El objetivo de muchas encuestas estadísticas y estudios es comparar dos poblaciones, como los hombres frente a las mujeres, bajas contra las familias de altos ingresos, y los republicanos contra demócratas. Cuando la característica que en comparación es numérico (por ejemplo, altura, peso, o los ingresos), el objeto de interés es la cantidad de diferencia en las medias (promedios) para las dos poblaciones.

Por ejemplo, es posible que desee comparar la diferencia en la edad media de los republicanos contra demócratas, o la diferencia de los ingresos medios de los hombres frente a las mujeres. Usted calcula la diferencia entre las medias de dos poblaciones,

image0.jpg

tomando una muestra de cada población (por ejemplo, muestra 1 y muestra 2) y usando la diferencia de las dos medias de las muestras

image1.jpg

más o menos un margen de error. El resultado es una intervalo de confianza para la diferencia de dos medias poblacionales,

image2.jpg

Hay dos situaciones en las que no se puede utilizar z * cuando se calcula el intervalo de confianza. La primera de ellas es si usted no sabe

image3.jpg

En este caso es necesario estimar con las desviaciones estándar de la muestra, s1 y s2. La segunda situación es cuando los tamaños de las muestras son pequeñas (menos de 30). En este caso no se puede estar seguro de si los datos provienen de una distribución normal.

En cualquiera de estas situaciones, un intervalo de confianza para la diferencia en los dos población significa es

image4.jpg

dónde t * es el valor crítico de la t-de distribución con n1 + n2 - 2 grados de libertad- n1 y n2 son los dos tamaños de muestra, respectivamente- y s1 y s2 son las dos desviaciones estándar de la muestra. Esta t *-valor se encuentra en la siguiente t-mesa junto a la intersección de la fila para df = n1 + n2 - 2 con la columna para el nivel de confianza que necesita, como se indica al ver la última fila de la tabla.

image5.jpg

Para calcular un IC para la diferencia entre dos medias poblacionales, haga lo siguiente:

  1. Determinar el nivel de confianza y grados de libertad (n1 + n2 - 2) y encontrar el adecuado t *-valor.

    Consulte lo anterior mesa.

  2. Identificar

    image6.jpg

    Identificar

    image7.jpg
  3. Encuentra la diferencia,

    image8.jpg

    entre las medias de las muestras.

  4. Calcular el intervalo de confianza usando la ecuación,

    image9.jpg

Suponga que desea estimar con una confianza del 95% de la diferencia entre las longitudes media (promedio) de las mazorcas de dos variedades de maíz dulce (que les permite crecer el mismo número de días en las mismas condiciones). Llame las dos variedades de maíz-e-stats (grupo 1) y Estadísticas-o-dulce (grupo 2). Suponga que usted no sabe las desviaciones estándar de la población, por lo que utilizar las desviaciones estándar de la muestra en su lugar - supongamos que resultan ser s1 = 0,40 y s2 = 0,50 pulgadas, respectivamente. Supongamos que los tamaños de las muestras, n1 y n2, son cada uno sólo 15.

  1. Para calcular la IC, primero tiene que encontrar la t * -valor en el t-de distribución con (15 + 15 - 2) = 28 grados de libertad. Utilizando el anterior t-mesa, nos fijamos en la fila por 28 grados de libertad y la columna que representa un nivel de confianza del 95% (ver las etiquetas en la última fila de la tabla) - que se cruzan y se ve t *28 = 2.048.

  2. Para ambos grupos, se tomó muestra aleatoria de 15 mazorcas, con la variedad de maíz-e-estadísticas promedio de 8,5 pulgadas y Estadísticas-o-dulce 7,5 pulgadas. Así que la información que se tiene es:

    image10.jpg
  3. La diferencia entre las medias de las muestras

    image11.jpg

    es 8,5-7,5 = 1 pulgada. Esto significa que el promedio para maíz-e-stats menos la media de Estadísticas-o-dulce es positivo, haciendo Maíz-e-stats la mayor de las dos variedades, en términos de esta muestra. ¿Es esa diferencia suficiente para generalizar a toda la población, sin embargo? Eso es lo que este intervalo de confianza va a ayudar a decidir.

  4. Utilizando el resto de la información que le dan, encontrar el intervalo de confianza para la diferencia en la duración media de la mazorca para las dos marcas:

    image12.jpg

    Su intervalo de confianza del 95% para la diferencia entre las longitudes medias de estas dos variedades de maíz dulce es de 1 pulgada, más o menos 0.9273 pulgadas. (El extremo inferior del intervalo es de 1 a 0,9273 = 0. 0727 pulgadas- el extremo superior es 1 + 0. 9273 = 1. 9.273 pulgadas.) Observe todos los valores en este intervalo son positivos. Eso significa maíz-e-estadísticas se estima en más de Estadísticas-o-dulce, sobre la base de sus datos.

    La tentación es decir, " Bueno, yo sabía de maíz Corn-e-stats era más larga, ya que su media de la muestra fue de 8,5 pulgadas y Stat-o-dulce era sólo 7,5 pulgadas de media. ¿Por qué aún necesito un intervalo de confianza "? Todos esos dos números te dicen es algo acerca de esos 30 espigas muestreadas. También es necesario tener en cuenta la variación utilizando el margen de error para poder decir algo sobre la totalidad de las poblaciones de maíz.


» » » » Cómo crear un intervalo de confianza para la diferencia de dos medias con desviaciones estándar desconocidos y / o muestras pequeñas