Pr‡ctica 5
Introducci—n
En esta pr‡ctica emplearemos distintas tŽcnicas vistas anteriormente como el an‡lisis de datos, inferencia, ANOVA, regresi—n o control estad’stico de calidad. Se pretende dar una visi—n de conjunto de lo estudiado y constituye una pr‡ctica en la metodolog’a a seguir en la resoluci—n de problemas pr‡cticos de Estad’stica.
Problemas
Se sospecha que una m‡quina de servir cafŽs no funciona correctamente, porque muchos de los clientes se quejan de que no cae suficiente cafŽ en el vaso y otros de que hay demasiado azœcar. Para comprobar el funcionamiento de la m‡quina, se analizan cuatro cafŽs cada hora, con los resultados en las variables: CafŽ (contenido de cafŽ en ml), Azœcar (contenido de azœcar en gr), Momento (momento del d’a en que se recoge el cafŽ, ma–ana = 1, mediod’a = 2, tarde = 3) y Hora (hora del d’a en que se recoge el cafŽ).
Una vez hecha la prueba, se lleva la m‡quina al taller de reparaciones y se le ajusta en cuanto al contenido de cafŽ en cada vaso. DespuŽs, se hace otra prueba, para ver si hace los cafŽs demasiado dulces o no. Controlando la cantidad de cafŽ que ha salido, se miden los gramos de azœcar que ha a–adido, obteniendo los datos (el cafŽ en mililitros y el azœcar en gramos) que se recogen en las variables: Cafe2, Azucar2.
ANçLISIS DESCRIPTIVO DE LOS DATOS
A) Calcula para las variables CafŽ y Azucar, los siguientes estad’sticos: media, mediana, desviaci—n t’pica, valor m’nimo, m‡ximo, rango, cuartiles inferior y superior y rango intercuart’lico. Comenta los resultados obtenidos.

B) Realiza un histograma de frecuencias para las variables anteriores, CafŽ y Azucar, y comenta si se distribuyen segœn alguna distribuci—n que conozcas (normal, uniforme,...)


Hemos comprobado mediante un contraste de la bondad del ajuste en el StatGraphics que las dos variables, CafŽ y Azucar siguen una distribuci—n normal, ya que los p-valores obtenidos son mayores que 0. 05.
C) Realiza el diagrama de cajas de las variables CafŽ y Azucar, agrupando los datos segœn el momento (variable Momento) del d’a a que corresponden: ma–ana (hasta las 11 incluida), mediod’a (de 12 a 16 incluidas), tarde (a partir de las 17). Comenta las diferencias que observes.



El Azœcar es igual a lo largo del d’a, y en el CafŽ baja la media, es decir, se consume menos cafŽ a medida que pasa el d’a. Vemos que existe una mayor variaci—n por la tarde, consecuencia de esta disminuci—n del consumo.
INFERENCIA Y ANOVA
D) Comprueba la normalidad de las variables Azucar y Azucar2, con los tests vistos en el tema2. DespuŽs, comprueba si hay diferencias significativas entre las medias de las variables Azucar y Azucar2, comprobando previamente si sus varianzas difieren (usa a = 0.05).
Ya hemos comprobado en el apartado B) que la variable Azucar proviene de una distribuci—n Normal. En el caso de Azucar2 hemos realizado el mismo an‡lisis y hemos obtenido el mismo resultado.
A continuaci—n comprobaremos si sus varianzas difieren mediante la construcci—n de la tabla ANOVA.

El StatAdvisor nos dice que no hay diferencia entre las variables con un 95% de confianza.
A continuaci—n comprobamos si hay diferencias significativas entre las medias.
Nos dice que no podemos rechazar que las medias sean iguales.
E) A partir de los resultados obtenidos hasta ahora, y considerando como aceptable que el contenido de cafŽ estŽ entorno a 100ml y el azœcar alrededor de 10gr:
E.i) calcula el intervalo de confianza al 90% para la media de CafŽ, y razona si tienen raz—n los clientes que se quejan porque se sirve, segœn ellos, poco cafŽ. Realiza el mismo estudio segœn los tres momentos del d’a: determina si existe diferencia entre las tres medias y calcula los intervalos de confianza para las medias (recuerda, opci—n: confidence intervals pooleds).
Intervalo de confianza para CafŽ:

Intervalo de confianza para CafŽ en Momento 1:

Intervalo de confianza para CafŽ en Momento 2:

Intervalo de confianza para CafŽ en Momento 3:

Excepto en el Momento 3, es decir, por la tarde, obtenemos resultados aceptables para CafŽ.
E.ii) calcula el intervalo de confianza al 90% para la media de Azucar, y razona si tienen raz—n los clientes que se quejan porque el cafŽ es demasiado dulce. Realiza el mismo estudio segœn los tres momentos del d’a.
Intervalo de confianza para Azucar:

Intervalo de confianza para Azucar en Momento 1:

Intervalo de confianza para Azucar en Momento 2:

Intervalo de confianza para Azucar en Momento 3:

Obtenemos resultados aceptables para Azucar en todos los momentos.
E.iii) Segœn los datos obtenidos, Àpiensas que se seguir‡n quejando una vez ajustada la m‡quina?


Los resultados son aceptables para Cafe2 y Azucar2.
REGRESIîN
F) Calcula la recta de regresi—n Azucar2 sobre Cafe2 y represŽntala. ÀLa relaci—n entre ambas variables es positiva o negativa? Razona tu respuesta.


La relaci—n ser‡ positiva porque la pendiente de la gr‡fica es positiva.
ÀC—mo es la calidad del ajuste? Razona tu respuesta.
La calidad del ajuste la
comprobamos mediante
. Tiene buena
calidad a causa de que los puntos no est‡n muy dispersos; pero crecen y
decrecen segœn intervalos, por lo cual obtenemos una calidad irregular.
CONTROL DE CALIDAD
G) Supongamos que las variables CafŽ y Azucar, corresponden a muestras de un plan de control de calidad:
G.i) ÀQuŽ gr‡ficas de control usar’as?
Se trata de variables cuantitativas distribuidas normalmente, por tanto utilizaremos las gr‡ficas de medias y recorridos.
G.ii) Dibuja las gr‡ficas de control apropiadas para ambas variables, comentando las anomal’as que detectes.
Para CafŽ:


En cafŽ empieza el d’a por encima de la media y va bajando progresivamente. Observamos rachas en la gr‡fica de medias, lo cual nos puede indicar cambios en la media. En este caso que se consume menos cafŽ a medida que pasa el dia.
Y para Azucar:


Est‡n todos los datos dentro de los l’mites superior e inferior. Vemos que hay inestabilidad, es decir, grandes fluctuaciones.
G.iii) Haz un estudio de capacidad para la variable CafŽ (aunque el proceso no estŽ bajo control). Supongamos que las indicaciones eran que se deb’a suministrar una media de 100ml de cafŽ en cada vaso, con un margen de tolerancia de hasta 10ml en cada sentido. Calcula los ’ndices que conozcas y determina si el proceso es capaz.

Obtenemos que el ICP es menor que 1, lo cual indica muchas unidades defectuosas, igual que el ICPk, el cual tambiŽn es menor que 1.