Creación de un intervalo de confianza para la diferencia de dos medias con desviaciones estándar conocidos

Si conoces las desviaciones estándar para dos muestras de población, entonces usted puede encontrar un intervalo de confianza (IC) de la diferencia entre sus medios, o promedios. El objetivo de muchas encuestas estadísticas y estudios es comparar dos poblaciones, como los hombres frente a las mujeres, bajas contra las familias de altos ingresos, y los republicanos contra demócratas. Cuando la característica que en comparación es numérico (por ejemplo, altura, peso, o los ingresos), el objeto de interés es la cantidad de diferencia en las medias (promedios) para las dos poblaciones.

Por ejemplo, es posible que desee comparar la diferencia en la edad media de los republicanos contra demócratas, o la diferencia de los ingresos medios de los hombres frente a las mujeres. Usted calcula la diferencia entre las medias de dos poblaciones,

image0.jpg

tomando una muestra de cada población (por ejemplo, muestra 1 y muestra 2) y usando la diferencia de las dos medias de las muestras

image1.jpg

más o menos un margen de error. El resultado es una intervalo de confianza para la diferencia de dos medias poblacionales,

image2.jpg

Si las dos desviaciones estándar poblacionales son conocidos, entonces la fórmula para un IC para la diferencia entre dos medias de población (promedios) es

image3.jpg

son la media y el tamaño de la primera muestra, y la desviación estándar de la primera población,

image4.jpg

se da (conocido);

image5.jpg

y n2 son la media y las dimensiones de la segunda muestra, y la desviación estándar de la segunda población,

image6.jpg

se da (conocido). Aquí z * es el valor apropiado de la distribución normal estándar para su nivel de confianza deseado. (Consulte la tabla siguiente para los valores de z * para ciertos niveles de confianza.)

z*-valores para los distintos niveles de confianza
Nivel de confianzaz * -valor
80%1.28
90%1.645 (por convenio)
95%1.96
98%2.33
99%2.58

Para calcular una CI para la diferencia entre dos medias poblacionales con desviaciones estándar conocidos, haga lo siguiente:

  1. Determinar el nivel de confianza y encontrar el adecuado z *-valor.

    Referirse a la tabla anterior.

  2. Identificar

    image7.jpg

    Identificar

    image8.jpg

  3. Encuentra la diferencia,

    image9.jpg

    entre las medias de las muestras.

  4. Cuadrado

    image10.jpg

    y se divide por n1- cuadrado

    image11.jpg

    y se divide por n2.

    Añadir los resultados juntos y sacar la raíz cuadrada.

  5. Multiplique su respuesta del Paso 4 por z *.

    Esta respuesta es el margen de error.

  6. Llevar

    image12.jpg

    más o menos el margen de error para obtener el CI.

    El extremo inferior de la IC es

    image13.jpg

    menos el margen de error, mientras que el extremo superior de la CI es

    image14.jpg

    más el margen de error.

Suponga que desea estimar con una confianza del 95% de la diferencia entre la longitud media (promedio) de las mazorcas de dos variedades de maíz dulce (que les permite crecer el mismo número de días en las mismas condiciones). Llame a las dos variedades de maíz-e-estadísticas y Estadísticas-o-dulce. Supongamos por la investigación antes de que las desviaciones estándar de las poblaciones de maíz-e-estadísticas y Estadísticas-o-dulce son 0,35 pulgadas y 0,45 pulgadas, respectivamente.

  1. Porque quieres un intervalo de confianza del 95%, su z * es de 1.96.


  2. Suponga que su muestra aleatoria de 100 mazorcas de las medias de variedades de maíz-e-stats 8,5 pulgadas, y su muestra aleatoria de 110 mazorcas de promedios Estadísticas-o-dulce 7,5 pulgadas. Así que la información que se tiene es:

    image15.jpg
  3. La diferencia entre las medias de la muestra,

    image16.jpg

    desde el paso 2, es 8,5-7,5 = 1 pulgada. Esto significa que el promedio para maíz-e-stats menos la media de Estadísticas-o-dulce es positivo, haciendo Maíz-e-stats la mayor de las dos variedades, en términos de esta muestra. ¿Es esa diferencia suficiente para generalizar a toda la población, sin embargo? Eso es lo que este intervalo de confianza va a ayudar a decidir.

  4. Cuadrado

    image17.jpg

    (0.35) para obtener 0.1225- dividir por 100 para obtener 0,0012. Cuadrado

    image18.jpg

    (0.45) -divide por 110 para obtener 0,0018. La suma es 0.0012 + 0.0018 = 0.0030- la raíz cuadrada es 0,0554 pulgadas (si no hay redondeo se realiza).

  5. Multiplicar 1,96 veces 0,0554 para obtener 0.1085 pulgadas, el margen de error.

  6. Su intervalo de confianza del 95% para la diferencia entre las longitudes medias de estas dos variedades de maíz dulce es de 1 pulgada, más o menos 0.1085 pulgadas. (El extremo inferior del intervalo es de 1 a 0,1085 = 0,8915 pulgadas- el extremo superior es 1 + 0.1085 = 1.1085 pulgadas.) Observe todos los valores en este intervalo son positivos. Eso significa maíz-e-estadísticas se estima en más de Estadísticas-o-dulce, sobre la base de sus datos.

    Para interpretar estos resultados en el contexto del problema, se puede decir con una confianza del 95% que la variedad de maíz-e-stats es más largo, en promedio, que las estadísticas-o-dulce variedad, por algún lugar entre 0.8915 y 1.1085 pulgadas, con base en su muestra.

La tentación es decir, " Bueno, yo sabía de maíz Corn-e-stats era más larga, ya que su media de la muestra fue de 8,5 pulgadas y Stat-o-dulce era sólo 7,5 pulgadas de media. ¿Por qué aún necesito un intervalo de confianza "? Todos esos dos números te dicen es algo acerca de esos 210 espigas muestreadas. También es necesario tener en cuenta la variación utilizando el margen de error para poder decir algo sobre la totalidad de las poblaciones de maíz.

Tenga en cuenta que usted puede obtener un valor negativo para

image19.jpg

Por ejemplo, si usted hubiera cambiado las dos variedades de maíz, que habría conseguido -1 para esta diferencia. Se podría decir que las estadísticas-o-dulce promediaron una pulgada más corto que Corn-e-stats en la muestra (la misma conclusión indique otra cosa).

Si usted quiere evitar valores negativos para la diferencia de medias de la muestra, siempre que el grupo con la muestra más grande significa que su primer grupo - todas sus diferencias serán positivos.

Sin embargo, aunque el grupo con la media de la muestra más grande sirve como el primer grupo, a veces usted todavía obtener valores negativos en el intervalo de confianza. Supongamos que en el ejemplo anterior que la media muestral de maíz-e-stats fue de 7,6 pulgadas. Por lo tanto, la diferencia en la muestra significa es 0,1, y el extremo superior del intervalo de confianza es 0,1 + 0,1085 = 0,2085 mientras que el extremo inferior es 0,1 - 0,1085 = -0.0085. Esto significa que la verdadera diferencia es razonable en cualquier lugar de maíz-e-stats siendo hasta 0,2085 pulgadas más largo que STAT-o-dulce siendo 0,0085 pulgadas más largo. Es muy cerca de decir con seguridad que la variedad es más largo en promedio.




» » » » Creación de un intervalo de confianza para la diferencia de dos medias con desviaciones estándar conocidos