K
Probabilidad y Estadística 2020 Andalucia

Inferencia estadística: tamaño muestral y distribución de la media

EJERCICIO 8 La renta anual de los hogares andaluces, en miles de euros, se distribuye según una ley Normal con desviación típica $5$ y media desconocida $\mu$. a) (1 punto) Si se desea que en el $99 \%$ de las posibles muestras del mismo tamaño, elegidas de entre los hogares andaluces, la media muestral no difiera de la renta media anual poblacional de dichos hogares en más de una unidad, ¿cuál debe ser el tamaño mínimo de las muestras? b) (0.5 puntos) Si se consideran muestras de hogares andaluces de tamaño 100, ¿qué distribución de probabilidad sigue la variable aleatoria “Renta media anual muestral”? c) (1 punto) Suponiendo que la renta media anual poblacional de los hogares andaluces es $\mu = 24$, ¿cuál es la probabilidad de que en una muestra de tamaño 100 la renta media anual muestral sea superior a 25?
Paso 1
Identificación de datos y valor crítico
**a) (1 punto) Si se desea que en el $99 \%$ de las posibles muestras del mismo tamaño, elegidas de entre los hogares andaluces, la media muestral no difiera de la renta media anual poblacional de dichos hogares en más de una unidad, ¿cuál debe ser el tamaño mínimo de las muestras?** Primero, identificamos los datos del enunciado: - Desviación típica poblacional: $\sigma = 5$. - Nivel de confianza: $1 - \alpha = 0.99$ (es decir, $99 \%$). - Error máximo admisible: $E = 1$ (ya que la media muestral no debe diferir de la poblacional en más de una unidad). Para calcular el tamaño muestral, necesitamos el valor crítico $z_{\alpha/2}$ correspondiente al $99 \%$: 1. $\alpha = 1 - 0.99 = 0.01$ 2. $\alpha/2 = 0.005$ 3. Buscamos en la tabla de la Normal $N(0, 1)$ el valor cuya probabilidad acumulada sea $1 - 0.005 = 0.995$. Consultando las tablas, vemos que el valor está entre $2.57$ y $2.58$. Tomamos el valor medio o el más preciso: $$z_{\alpha/2} = 2.575$$ 💡 **Tip:** Recuerda que para los niveles de confianza más habituales, los valores críticos son: $90 \% \to 1.645$, $95 \% \to 1.96$ y $99 \% \to 2.575$.
Paso 2
Cálculo del tamaño mínimo de la muestra
Utilizamos la fórmula del error máximo para el intervalo de confianza de la media: $$E = z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$$ Sustituimos los valores conocidos y despejamos $n$: $$1 = 2.575 \cdot \frac{5}{\sqrt{n}}$$ $$\sqrt{n} = 2.575 \cdot 5$$ $$\sqrt{n} = 12.875$$ $$n = (12.875)^2 = 165.765625$$ Como el tamaño de la muestra debe ser un número entero y buscamos el mínimo para no superar ese error, debemos redondear siempre al entero superior. ✅ **Resultado:** $$\boxed{n \ge 166 \text{ hogares}}$$
Paso 3
Distribución de la media muestral
**b) (0.5 puntos) Si se consideran muestras de hogares andaluces de tamaño 100, ¿qué distribución de probabilidad sigue la variable aleatoria “Renta media anual muestral”?** Sabemos que la población original sigue una distribución normal $X \sim N(\mu, \sigma)$. Según la teoría del muestreo, la distribución de las medias muestrales $\bar{X}$ para muestras de tamaño $n$ sigue también una distribución normal: $$\bar{X} \sim N\left(\mu, \frac{\sigma}{\sqrt{n}}\right)$$ Datos: - Media poblacional: $\mu$ (desconocida). - Desviación típica poblacional: $\sigma = 5$. - Tamaño de la muestra: $n = 100$. Calculamos la desviación típica de la media muestral (error estándar): $$\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}} = \frac{5}{\sqrt{100}} = \frac{5}{10} = 0.5$$ 💡 **Tip:** Si la población es normal, la media muestral siempre es normal independientemente del tamaño de $n$. Si no lo fuera, necesitaríamos $n \gt 30$ para aplicar el Teorema Central del Límite. ✅ **Resultado:** $$\boxed{\bar{X} \sim N(\mu, 0.5)}$$
Paso 4
Cálculo de probabilidad con la media muestral
**c) (1 punto) Suponiendo que la renta media anual poblacional de los hogares andaluces es $\mu = 24$, ¿cuál es la probabilidad de que en una muestra de tamaño 100 la renta media anual muestral sea superior a 25?** Bajo el supuesto de que $\mu = 24$, la distribución de la media muestral del apartado anterior es: $$\bar{X} \sim N(24, 0.5)$$ Queremos calcular $P(\bar{X} \gt 25)$. Para ello, tipificamos la variable a una normal estándar $Z \sim N(0, 1)$ usando $Z = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}}$: $$P(\bar{X} \gt 25) = P\left(Z \gt \frac{25 - 24}{0.5}\right)$$ $$P(Z \gt \frac{1}{0.5}) = P(Z \gt 2)$$ Como las tablas muestran la probabilidad acumulada hacia la izquierda, aplicamos la propiedad del complementario: $$P(Z \gt 2) = 1 - P(Z \le 2)$$ Buscamos el valor $2.00$ en la tabla de la normal estándar: $$P(Z \le 2) = 0.9772$$ $$P(\bar{X} \gt 25) = 1 - 0.9772 = 0.0228$$ 💡 **Tip:** Tipificar consiste en restar la media y dividir por la desviación típica de la distribución que estamos usando (en este caso, la de la media muestral). ✅ **Resultado:** $$\boxed{P(\bar{X} \gt 25) = 0.0228}$$
Vista Previa