Seminario 2. Herramientas clásicas de control de calidad

Fecha de publicación

23 de febrero de 2024

Fecha de modificación

12 de marzo de 2024

Importante

Este es un documento dinámico. Carga una versión de R, lo que supone que la primera vez puede tardar un poco en mostrarse. Una vez se ha cargado, se ejecutarán todos los cálculos para mostrar los resultados de los problemas.

Puedes probar a hacer cambios en las instrucciones para ver como funcionan. Solo tienes que pulsar el botón Run code tras hacer los cambios.

Ejercicio 1 Se toman nueve medidas de la temperatura de un horno en lotes sucesivos en una empresa panificadora (unidades en °C): 153, 155, 148, 151, 157, 149, 154, 150, 159.

Calcular:

  1. La media de la muestra.
  2. la desviación estándar de la muestra.

(Adaptado de Montgomery (2009))

Solución.

a.

Calculamos la media aritmética con R:

b.

El cálculo de la desviación estándar es:

Nota

R calcula la desviación estándar de la muestra con la instrucción sd y no la de la población.

Solución

a. 152.9 °C

b. 3.7 °C

Ejercicio 2 Se han hecho distintas medidas del volumen de zumo de naranja envasado durante una semana, obteniéndose los siguientes resultados en mL:

1001, 1002, 1000, 999, 990, 998, 1000, 1003, 1008, 1000, 993, 1000, 999, 1001, 994, 1000, 998, 998, 1004, 1003, 991, 1007, 998, 997, 1001, 994, 1003, 999, 1000, 1004, 997, 1008, 992, 1002, 1000, 996, 1002, 1000, 999, 1004, 1008, 990, 989, 990, 991, 1000, 999, 997, 999, 1000, 998, 996, 1003, 1000, 1004, 995, 998, 1000, 998, 1001, 994, 1003, 1001, 998, 1003, 1007, 994

Contesta las siguientes preguntas:

  1. Representar el histograma de frecuencias.

  2. Calcular la media y la desviación estándar.

  3. Añadir al histograma la función de distribución normal con la media y desviación estándar calculadas en el apartado anterior. Añadir rectas que muestren la posición de la media y ±σ.

  4. Comentar los resultados teniendo en cuenta el gráfico anterior y que el volumen nominal que aparece en la etiqueta de los envases es de 1 L.

Solución.

a.

Dibujamos el histograma con R incluyendo los nombres de los ejes y el título:

Si deseamos el histograma normalizado:

b.

La media es:

La desviación estándar es:

c.

En primer lugar dibujaremos el histograma normalizado:

A continuación añadimos la función de distribución normal

Por último incluimos las rectas que muestran la posición de la media y ±σ:

Ejercicio 3 En el departamento de control de calidad de una empresa se tienen datos de la dureza de un producto en función del porcentaje de un ingrediente de la materia prima:

Porcentaje del ingrediente Dureza media
0.52 26.2
0.58 25.4
0.66 24.2
0.18 22.7
1.00 30.0
0.71 26.9
0.87 27.0
0.36 25.3
0.62 25.6
0.73 27.3
0.76 28.7
0.40 24.6
0.24 22.4
0.94 31.0
0.94 29.8
0.90 30.3
0.52 25.1
0.45 23.5
0.73 28.4
0.28 23.6
0.45 26.2
0.38 21.9
0.67 25.4
0.37 23.6
1.03 28.4
0.29 23.9
0.70 24.4
0.58 25.1
0.59 26.5
0.20 24.1
0.18 20.1
0.21 23.5
0.45 26.4
0.93 31.8
0.70 27.2
0.41 23.3
0.40 26.4
0.65 26.4
0.63 27.1
0.87 30.5
0.18 21.4
0.88 29.5
0.44 23.2
0.94 30.1
1.13 28.6
0.25 27.7
0.27 22.5
0.60 25.8
0.76 28.4
0.62 28.3
0.11 20.1
0.99 29.4
0.07 19.8
0.93 27.7
0.97 30.0
0.76 27.0
0.10 22.8
0.69 28.1
0.35 24.5
0.54 25.0
0.65 26.0
0.96 27.0
0.85 29.4
1.07 30.5
0.37 20.4
0.42 25.6
1.09 29.2
0.72 27.3
0.35 23.8
1.10 30.7
0.18 22.7
0.18 21.6
0.40 22.1
0.36 23.9
0.58 27.6
0.32 21.8
0.30 22.4
0.80 29.0
1.11 29.6
0.18 23.1
0.42 25.4
0.71 24.4
0.52 24.3
0.95 30.5
0.36 23.1
0.62 29.2
0.65 26.3
0.93 28.5
0.11 24.0
0.65 28.1
0.82 29.0
0.79 27.3
0.36 24.4
0.08 28.0
0.21 20.2
0.91 31.5
0.79 27.1
0.29 21.8
0.92 30.0
1.11 29.8

Contestar a las siguientes preguntas:

  1. Representar gráficamente los datos. El gráfico debe tener título y los títulos de los ejes.

  2. ¿Sería posible asumir un modelo lineal para correlacionar ambos parámetros? Añadir al gráfico el ajuste lineal y calcular el coeficiente de correlación.

  3. Dibujar un gráfico de residuos para verificar la bondad del ajuste.

Solución.

a.

Representación de los datos experimentales:

b.

Realizamos el ajuste lineal, tomando la dureza media como variable dependiente y el porcentaje de ingrediente como variable independiente:

Podemos obtener el coeficiente de correlación y otros resultados estadísticos:

También podemos añadir fácilmente la recta de regresión a los puntos experimentales:

c.

No es necesario que calculemos los residuos, ya que R los tiene calculados:

La representación del gráfico de residuos queda así:

Comprobamos que los puntos están distribuidos aleatoriamente alrededor del 0. Parece que el ajuste es correcto.

Ejercicio 4 En el control de calidad de vino embotellado en botellas de 750 ml, se han encontrado a lo largo de un año distintos tipos de defectos que han llevado al reprocesado del producto un buen número de veces, acarreando pérdidas económicas para la bodega:

Defecto Frecuencia Pérdidas anuales
Etiquetas mal pegadas 20 4500 €
Taponado incorrecto 15 1750 €
Capsulado incorrecto 35 1000 €
Exceso o defecto de volumen 14 2250 €
Botellas manchadas 50 1750 €
Varios 7 4926 €

El coste de las acciones a tomar para evitar en el futuro estos fallos son:

  • Reparación de la etiquetadora: 1500 €
  • Reparación de la taponadora: 3500 €
  • Reparación de la capsuladora: 2800 €
  • Reparación de la llenadora: 7200 €
  • Un empleado más para el control de botellas antes del llenado: 13000 €/año

A todas las acciones se les supondrá el mismo tiempo de eliminación porque pueden llevarse a cabo en periodos en los que no se está embotellando el vino.

La probabilidad de éxito es la siguiente:

  • Reparación de la etiquetadora: 0.95
  • Reparación de la taponadora: 0.95
  • Reparación de la capsuladora: 0.95
  • Reparación de la llenadora: 0.99
  • Un empleado más para el control de botellas antes del llenado: 0.99

Con todos estos datos, construir un diagrama de Pareto y calcular el índice de prioridad. Interpretar los resultados.

Solución. Para dibujar el diagrama de Pareto, empezamos definiendo la variable con las frecuencias y los nombres de cada causa:

A continuación representamos el diagrama de Pareto (para lo que utilizarmos el paquete de R qcc:

Calcularemos el índice de prioridad para cada una de las causas estudiadas. No tiene sentido estudiar “Varios”, ya que engloba diferentes causas de las que no tenemos datos.

Creamos las variables con las pérdidas, inversiones y probabilidades asociadas a cada una de las causas:

Ya solo queda calcular el índice de prioridad:

Podemos mostrar los nombres de las causas y su IP asociado:

Comprobamos que la causa que tiene una mayor prioridad son las Etiquetas mal pegadas, por lo que debería ser la primera causa a solucionar.

Ejercicio 5 Dibujar un diagrama de Ishikawa en uno de los casos siguientes:

  • En una empresa de elaboración de helados se repite muy a menudo un problema de crecimiento microbiano en los helados de una de las líneas de fabricación. El objetivo del diagrama es disponer de una herramienta para determinar las principales causas de ese problema.
  • Tras la graduación queréis abrir una empresa de servicios y deseáis utilizar el diagrama para planificar todo lo que debéis tener en cuenta para tener éxito.
  • Las causas de la obesidad.

Ejercicio 6 En una fábrica de extrusores industriales se producen defectos al azar en los equipos. Estos defectos ocurren según una distribución de Poisson con λ = 0.02.

  1. ¿Cuál es la probabilidad de que se produzca exactamente un defecto en un equipo?
  2. ¿Cuál es la probabilidad de que un extrusor tenga uno o más defectos?
  3. Se mejora el proceso, de manera que se reduce la tasa de defectos a λ = 0.01. ¿Qué efecto tiene sobre la probabilidad de que un equipo tenga uno o más defectos?

(Adaptado de Montgomery (2009))

Solución.

a.

La probabilidad de que se produzca un defecto será:

\[\sf P(x=1) = p(1, 0.01) = \mathrm{e}^{-0.01} \frac{0.02^1}{1!}\]

donde \(p\) es la función de frecuencia de Poisson.

Realizamos el cálculo:

También podríamos haber utilizado la función de Poisson de R, dpois:

Naturalmente, se obtiene el mismo resultado.

b.

La probabilidad de que se produzca uno o más defectos es:

\[\sf P(X \ge 1) = 1- P(x=0) = 1- p(0, 0.02)\]

c. 

Si se reduce la tasa de defectos a 0.01, la probabilidad de tener uno o más defectos es:

Ejercicio 7 El panel electrónico de control de una planta de pasteurización de leche se fabrica en lotes de tamaño N = 25. El procedimiento de aceptación que utiliza el comprador para asegurarse que los paneles son correctos consiste en seleccionar cinco paneles al azar del lote (sin reemplazo) y verificar su funcionamiento. El lote se acepta en el caso de que ninguno de los paneles sea disconforme. Contestar a las siguientes preguntas:

  1. Si el lote contiene dos unidades disconformes, ¿cuál es la probabilidad de aceptar el lote?
  2. Calcular la probabilidad del apartado anterior utilizando la aproximación binomial. ¿Es esta aproximación satisfactoria? ¿Por qué o por qué no?
  3. Suponer que el tamaño del lote es N = 150. ¿Sería la aproximación binomial satisfactoria en este caso?
  4. Suponer que el comprador rechazará el lote si encuentra una o más unidades no conformes en una muestra de tamaño n. Calcular el tamaño de muestra para que la probabilidad de rechazar un lote que contenga cinco o más paneles disconformes sea igual o superior a 0.95.

(Adaptado de Montgomery (2009))

Solución. Datos del problema:

  • Tamaño del lote: N = 25
  • Tamaño de la muestra: n = 5
  • Criterio de aceptación: c = 0

a.

El lote tiene dos unidades disconformes, es decir, D = 2.

Calcularemos la probabilidad de aceptar el lote será:

\[P(X=0) = h (0, 25, 2, 5) = \frac{\binom{2}{0} \binom{25-2}{5-0}}{\binom{25}{5}}\]

Utilizando la función dhyper de R, la función de probabilidad hipergeométrica;

b.

La fracción de unidades no conformes del lote es:

\[\sf p = \frac{D}{N} = \frac{2}{25}\]

La probabilidad de aceptar un lote utilizando la aproximación binomial es:

\[\sf P(X=0) = b(0, n, p)\]

donde b es la función binomial.

Comprobamos que el error cometido con la aproximación binomial es de un 4 %, es decir, es demasiado elevado para ser aceptable. Era un resultado esperable, ya que 5/25 = 1/5 > 1/10.

c.

Repetimos el apartado anterior, pero para N = 150. En primer lugar realizamos el cálculo con la función hipergeométrica:

A continuación lo realizamos con la aproximación binomial:

En este caso, el error cometido es menor de un 0.1 %, lo que se considera aceptable

d.

En este caso, el tamaño del lote vuelve a ser el del apartado., N = 25, y el número de unidades disconformes es de 5 o más.

Tenemos que calcular esta probabilidad:

\[P(X \ge 1| D\ge 5) = 1- P(X=0| D\ge 5) = 1-H(0, 25, 5, n) =0.95\]

donde no conocemos n, el tamaño de muestra.

Planteamos el cálculo y vamos ensayando valores de n hasta que la probabilidad obtenida es mayor o igual a 0.95:

Obtenemos las siguientes probabilidades de rechazar el lote:

n P
10 0.943
11 0.962

El tamaño de la muestra deberá ser de 11 unidades.

Referencias

Montgomery, Douglas, C. 2009. Introduction to Statistical Quality Control, Sixth Edition. John Wiley & Sons.