Esta entrada contine el enunciado y resolución completa del segundo parcial de probabilidad y estadítica de UTN-FRBA tomado el día 29-06-2016. Es un parcial redactado por la profesora Fanny Kaliman.
Ejercicio 1 – Sobre intervalo de confianza para la media poblacional
Ítem a
La variable principal es \(X\): peso de una bolsa de papas que sale al mercado (en kg).
Nos dicen que la distribución de \(X\) es normal (“sabiendo que el peso de las bolsas sigue una distribución normal”). Desconocemos la varianza poblacional.
Como (1) X tiene distribución normal y (2) se desconoce la varianza poblacional, el estadístico que usamos es:
\[\frac{{\bar X – \mu }}{{\frac{S}{{\sqrt n }}}} \sim {t_{n – 1}}\]
Lo cual nos lleva a la siguiente fórmula de intervalo de confianza para la media \(\mu \) con nivel de confianza \(1 – \alpha \):
\[I{C_{\mu ,1 – \alpha }} = \bar x \pm {t_{n – 1;1 – \frac{\alpha }{2}}}.\frac{S}{{\sqrt n }}\]
La media muestral y el desvío estándar muestral los podemos obtener con calculadora a partir de los datos:
\[\bar x = 109,375\;\;\;\;s = 3,96\]
El valor de la variable \(t\) es:
\[{t_{7;0,975}} = 2,365\]
Reemplazando en la fórmula del intervalo de confianza para la media:
\[I{C_{\mu ;0,95}} = 109,375 \pm 2,365.\frac{{3,96}}{{\sqrt 8 }}\]
\[I{C_{\mu ;0,95}} = 109,375 \pm 3,312\]
\[I{C_{\mu ;0,95}} = \left( {106,06\;;\;\;112,69} \right)\]
Ítem b
En este ítem se supone que es conocido el desvío estándar poblacional: \(\sigma = 3,9\).
Eso cambia las condiciones, y el estadístico que vamos a usar. Cómo (1) \(X\) tiene distribución normal y (2) el desvío estándar poblacional es conocido entonces:
\[\frac{{\bar X – \mu }}{{\frac{\sigma }{{\sqrt n }}}} \sim N\left( {0,1} \right)\]
Luego la fórmula para el intervalo de confianza de la media (con nivel de confianza \(1 – \alpha \)) queda:
\[I{C_{\mu ,1 – \alpha }} = \bar x \pm {z_{1 – \frac{\alpha }{2}}}.\frac{\sigma }{{\sqrt n }}\]
Dónde el error es \({z_{1 – \frac{\alpha }{2}}}.\frac{\sigma }{{\sqrt n }}\).
Entonces la longitud del intervalo es:
\[Longitud\;del\;IC = 2.{z_{1 – \frac{\alpha }{2}}}.\frac{\sigma }{{\sqrt n }}\]
Reemplazando por:
- \(\sigma = 3,9\)
- \({z_{0,975 = 1,96}}\)
- \(Longitud\;del\;IC = 4\)
Podemos despejar \(n\):
\[4 = 2.1,96.\frac{{3,9}}{{\sqrt n }}\;\]
\[ \Rightarrow \;\;n = {\left( {\frac{{1,96\;.\;3,9}}{2}} \right)^2}\;\;\]
\[\; \Rightarrow \;\;n = 14,6\]
Cómo \(n\) debe ser u número entero redondeamos al enero superior para garantizar que el error sea inferior al pedido. Entonces \(n = 15\).
Pero se pregunta “cuantas bolsas adicionales debe pesar el inspector”. Entonces:
\[15 – 8 = 7\]
Se deben pesar 7 bolsas adicionales.
Ejercicio 2 – Prueba de hipótesis sobre una proporción poblacional
Ítem a
Paso 1: Definir la variable
La variable es:
\({X_i}:\left\{ {\begin{array}{*{20}{c}}{0\;\;\;\;si\;el\;trabajo\;i\;no\;se\;entrega\;a\;término}\\{1\;\;\;si\;el\;trabajo\;i\;se\;entrega\;a\;término}\end{array}} \right.\)
\({X_i}\) es una variable Bernoulli, con probabilidad de éxito \(p\) desconocida.
Paso 2: Establecer las hipótesis
\[{H_0}:p = 0,9\]
\[{H_1}:p < 0,9\]
Paso 3: Establecer un estadístico de prueba
\[{e_p} = \frac{{\hat p – p}}{{\sqrt {\frac{{p\left( {1 – p} \right)}}{n}} }} \approx N\left( {0,1} \right)\]
Paso 4: Seleccionar un nivel de significación
\[\alpha = 0,05\]
Paso 5: Determinar zona de rechazo y regla de decisión
\[{z_{0,05}} = – 1,645\]
- Zona de rechazo: \({e_{p,obs}} \le – 1,645\)
- Zona de no rechazo: \({e_{p,obs}} > – 1,645\)
Regla de decisión:
- Rechazamos \({H_0}\) si \({e_{p,obs}} \le – 1,645\)
- No rechazamos \({H_0}\) si \({e_{p,obs}} > – 1,645\)
Paso 6: Calcular el valor observado del estadístico de prueba
La proporción muestral de éxitos es:
\[\hat p = \frac{{790}}{{900}} = 0,87777\]
Entonces bajo la suposición de que \({H_0}\) es verdadera (\(p = 0,9\)):
\[{e_{p,obs}} = \frac{{\frac{{790}}{{900}} – 0,9}}{{\sqrt {\frac{{0,9.0,1}}{{900}}} }} = \frac{{ – 0,022}}{{0,01}} = – 2,22\]
Paso 7: Concluir
Cómo \( – 2,22 \in Zona\;de\;rechazo\) entonces decidimos rechazar la hipótesis nula a favor de la hipótesis alternativa.
Con un nivel de significación del 5% se puede afirmar que hay evidencia suficiente para rechazar la hipótesis nula (que afirma que \(p = 0,9)\), a favor de la hipótesis alternativa que afirma que \(p < 0,9\). Con nivel del 5% hay evidencias para afirmar que el auditor tiene razón.
Ítem b
El valor \(p\) en este ejercicio sería:
\[valor – p = P\left( {Z < – 2,22} \right) = 0,01314\]
Si el nivel de significación fuera \(1\% = 0,01\) no se rechazaría la hipótesis nula (porque el valor p sería superior a \(\alpha \)).
Ejercicio 3 – Regresión lineal
Usando una calculadora científica en modo estadístico podemos introducir los datos y obtener los coeficientes de la recta de regresión muestral:
\[a = 253,47\]
\[b = – 72,5\]
\[r = 0,974\]
\[ \Rightarrow {\hat y_i} = 253,47.{x_i} – 72,5\]
Con la ecuación de la recta podemos estimar (puntualmente) el módulo de ruptura promedio para una pieza cuya gravedad específica es \(0,45\):
\[ \Rightarrow {\hat y_i}\left( {{x_i} = 0,45} \right) = 253,47.0,45 – 72,5 = 41,56\]
Ítem b
Cómo \(r = 0,974\) podemos decir que:
- INTENSIDAD: es una relación lineal “fuerte” (porque \(\left| r \right|\) toma un valor cercano a 1).
- SENTIDO: es una relación lineal de sentido positivo (porque \(r > 0\)).
Teórico 1 – Estimación
Ítem a
Falso.
Sabemos que la media muestral es un estimador insesgado de la media poblacional.
Demostración:
\[E\left( {\bar X} \right) = E\left( {\frac{1}{n}\mathop \sum \limits_{i = 1}^n {X_i}} \right) = \frac{1}{n}.E\left( {\mathop \sum \limits_{i = 1}^n {X_i}} \right) = \frac{1}{n}\mathop \sum \limits_{i = 1}^n E\left( {{X_i}} \right) = \frac{1}{n}.n.\mu = \mu \]
Ítem b
El desvío estándar de \(\hat p\) sí es igual a \(\sqrt {\frac{{p\left( {1 – p} \right)}}{n}} \), pero su relación con \(n\) NO es de proporcionalidad inversa.
Demostración:
\[Var\left( {\hat p} \right) = Var\left( {\frac{{\mathop \sum \nolimits_{i = 1}^n {X_i}}}{n}} \right) = \frac{1}{{{n^2}}}Var\left( {\mathop \sum \limits_{i = 1}^n {X_i}} \right) = \frac{1}{{{n^2}}}\mathop \sum \limits_{i = 1}^n Var\left( {{X_i}} \right) = \frac{1}{{{n^2}}}np\left( {1 – p} \right)\]
Es cierto que cuando \(n\) aumenta disminuye el desvío estándar de \(\hat p\). Pero la relación no es de proporcionalidad inversa.
Entonces la afirmación completa es falsa.
Teórico 2 – Regresión lineal
Ítem a
El coeficiente de determinación en una regresión de Y dado X se define cómo:
\[{r^2} = \frac{{S{C_{regresión}}}}{{S{C_{total}}}}\]
O también
\[{r^2} = \frac{{S_{xy}^2}}{{{S_{xx}}{S_{yy}}}}\]
Y se interpreta cómo el porcentaje de la variación de la variable \(Y\) que se puede explicar por la regresión lineal con \(X\).
Ítem b
i) \({r^2} = 0,8\), significa que el \(80\% \) de la variación de \(Y\) se puede explicar por la regresión lineal con \(X\).
ii) \({r^2} = 0\), significa que \(0\% \) de la variación de \(Y\) se puede explicar por la regresión lineal con \(X\).
En el Teórico 1-a, sería Falso si es insesgado.
Hola! Tenés Razón, es FALSO. Ahí lo corregí. Gracias y saludos!
Hola, puede ser que en la resolución del punto 3, los valores de a y b, estén invertidos?
Además, la calculadora, debería estar en regresión lineal, siendo que en la primer oración dice en modo estadístico, no?
Saludos y muy buena la página!
Hola Gabriel ! Gracias por el comentario 🙂
Dependiendo el libro/apunte/calculadora puede ser que refieran con A y con B a la pendiente o a la ordenada de la recta. Así que hay que prestar atención a cómo lo toma la herramienta que usás. No está super estandarizado que letra usar para qué parámetro.
Sí, la calculadora tiene que estar en el modo estadístico específico para regresión lineal. Eso también varía mucho de dispositivo a dispositivo.
Saludos!
Hola. Tengo una consulta, teórico 1) b). ¿Por qué el desvío de ^p no es inversamente proporcional a n? Yo hubiera dicho que sí porque al aumentar n, disminuye ^p, pero no es así según la resolución y no puedo deducir por qué. Gracias desde ya.
Saludos.
Estela,
Son “inversas” en el sentido de que una aumenta la otra disminuye.
Pero el concepto de “inversamente proporcional” es más específico.
Una variable X es inversamente proporcional con otra Y si y sólo si cumplen esta condición:
\(X.Y = cte\). Es decir que el producto entre las dos es constante. Esto implica que si una aumenta en un factor \(m\) la otra se reduce según ese mismo factor. (Por ejemplo, una se triplica y la otra se reduce a la tercera parte.)
No se cumple que el desvío de \(\hat p\) sea inversamente proporcional a \(n\). Sino que es inversamente proporcional a la raíz de \(n\):
\(\;Des\left( {\hat p} \right) = \sqrt {\frac{{p.\left( {1 – p} \right)}}{n}} \)
“Pasamos” \(\sqrt n \) multiplicando al otro lado:
\(\;Des\left( {\hat p} \right).\sqrt n = \sqrt {p.\left( {1 – p} \right)} = cte\)
¿Se entiende?
Clarísimo. ¡Muchas gracias!
Muchísimas gracias por la resolución, me aclaró algunos conceptos que permenecían en el eter. Saludos!