Cómo calcular la regresión lineal múltiple para seis sigma

¿Qué deben hacer los profesionales de Six Sigma ver con todas las situaciones en las que más de un X influye en un Y? Tu usas regresión lineal múltiple. Después de todo, ese tipo de situación es más común de lo que una sola variable que influye es. Cuando se trabaja para crear una ecuación que incluye más de una variable - como Y = F(X1, X2, . . ., Xn).

La forma general del modelo de regresión lineal múltiple es simplemente una extensión del modelo de regresión lineal simple Por ejemplo, si usted tiene un sistema en el X1 y X2 tanto contribuir a Y, el modelo de regresión lineal múltiple se convierte en

Yyo = # 946-0 + # 946-1X1 + # 946-11X12 + # 946-2X2 + # 946-22X22 + # 946-12X1X2 + # 949-

Esta ecuación presenta cinco tipos distintos de términos:

  • # 946-0: Este término es el efecto global. Establece el nivel de partida de todos los otros efectos, independientemente de lo que el X las variables se establecen en.

  • # 946-yoXyo: Los # 946-1X1 y # 946-2X2 piezas son el efectos principales términos de la ecuación. Al igual que en el modelo de regresión lineal simple, estos términos capturan el efecto lineal cada Xyo tiene en la salida Y. La magnitud y dirección de cada uno de estos efectos son capturados en The Associated # 946-yo coeficientes.

  • # 946-iiXyo2: # 946-11X12 y # 946-22X22 son los segunda orden o efectos cuadrados para cada una de las Xs. Debido a que la variable se eleva a la segunda potencia, el efecto es cuadrática en lugar de lineal. La magnitud y dirección de cada uno de estos efectos de segundo orden son indicadas por el asociado # 946-ii coeficientes.

  • # 946-12X1X2: Este efecto se denomina efecto de interacción. Este término permite que las variables de entrada que tienen un efecto interactivo o combinado en el resultado Y. Una vez más, la magnitud y la dirección del efecto de interacción son capturados en el # 946-12 coeficiente.


  • # 949-: Este cuentas plazo para toda la variación aleatoria que los otros términos no pueden explicar. # 949- es una distribución normal con su centro en cero.

La ecuación de regresión lineal múltiple puede caber mucho más que un simple línea- puede acomodar curvas, superficies tridimensionales y relaciones incluso abstractas en n-espacio dimensional! Regresión lineal múltiple puede manejar cualquier cosa que lanzar en él. El proceso para la realización de regresión lineal múltiple sigue el mismo patrón que la regresión lineal simple hace:

  1. Reunir los datos para el Xs y la Y.

  2. Estimar las múltiples coeficientes de regresión lineal.

    Cuando se tiene más de un X variables, las ecuaciones para derivar la # 946-S se vuelven muy complejas y muy tedioso. Usted definitivamente quiere utilizar una herramienta de software de análisis estadístico para calcular estas ecuaciones automáticamente. los # 946-S acaba de estallar a la derecha hacia fuera. De lo contrario, ir a comprar una caja de lápices número 2 y subirse las mangas!

  3. Compruebe los valores residuales para confirmar que cumplen los supuestos iniciales del modelo de regresión lineal múltiple.

    Comprobar que los residuos son normales es críticamente importante. Si la variación de los residuos no está centrada en cero y la variación no es aleatoria y normal, no se han cumplido los supuestos de partida del modelo de regresión lineal múltiple, y el modelo es válido.


  4. Realizar pruebas estadísticas para ver qué términos de los varios términos de ecuación de regresión lineal son significativos (y deben mantenerse en el modelo) y que son insignificantes (y deben ser eliminados).

    Algunos términos en la ecuación de regresión múltiple no son significativas. Te das cuenta de cuáles por la realización de una F prueba para cada término de la ecuación. Cuando la contribución variación de un término de la ecuación es pequeño comparado con la variación residual, ese término no pasará el F prueba, y usted puede quitarlo de la ecuación.

    Su objetivo es simplificar la ecuación de regresión tanto como sea posible al tiempo que maximiza la R2 métrica de ajuste. En general, más simple es siempre mejor. Así que si usted encuentra dos ecuaciones de regresión que ambos tienen la misma R2 valor, que desea establecerse en el que está con los términos más simples, menor cantidad.

    Por lo general, los términos de orden superior son los primeros en irse. Sólo hay menos posibilidades de un término al cuadrado o un término de interacción estadísticamente significativa.

  5. Calcular el coeficiente de determinación definitiva R2 para el modelo de regresión lineal múltiple.

    Utilizar el R2 métrica para cuantificar qué parte de la variación observada su ecuación final explica.

Con un buen software de análisis cada vez más accesible, el poder de regresión lineal múltiple está disponible a un público cada vez mayor. Muchas de las herramientas de software de análisis estadístico más sofisticados algoritmos siquiera han automatizados que buscar a través de las diversas combinaciones de términos de la ecuación al tiempo que maximiza R2.




» » » » Cómo calcular la regresión lineal múltiple para seis sigma