Probabilidad y Estadística 2016 Andalucia
Muestreo estratificado y distribución muestral de medias
EJERCICIO 4
a) (1.25 puntos) Se desea tomar una muestra aleatoria estratificada de las personas mayores de edad de un municipio, cuyos estratos son los siguientes intervalos de edades, en años: de 18 a 30, de 31 a 45, de 46 a 60 y mayores de 60. En el primer intervalo hay 7500 personas, en el segundo hay 8400, en el tercero 5700 y en el cuarto 3000. Calcule el tamaño de la muestra total y su composición, sabiendo que el muestreo se hace con afijación proporcional y se han elegido al azar 375 personas del primer estrato.
b) (1.25 puntos) Dada la población $\{2, 4, 6\}$ construya todas las muestras posibles de tamaño 2, que se puedan formar mediante muestreo aleatorio simple, y halle la varianza de las medias muestrales de todas las muestras.
Paso 1
Identificar los datos del muestreo estratificado
**a) (1.25 puntos) Se desea tomar una muestra aleatoria estratificada de las personas mayores de edad de un municipio, cuyos estratos son los siguientes intervalos de edades, en años: de 18 a 30, de 31 a 45, de 46 a 60 y mayores de 60. En el primer intervalo hay 7500 personas, en el segundo hay 8400, en el tercero 5700 y en el cuarto 3000. Calcule el tamaño de la muestra total y su composición, sabiendo que el muestreo se hace con afijación proporcional y se han elegido al azar 375 personas del primer estrato.**
Primero, anotamos el tamaño de cada estrato poblacional ($N_i$) y el tamaño del primer estrato de la muestra ($n_1$):
- Estrato 1 ($N_1$): $7500$ personas. Muestra ($n_1$): $375$.
- Estrato 2 ($N_2$): $8400$ personas.
- Estrato 3 ($N_3$): $5700$ personas.
- Estrato 4 ($N_4$): $3000$ personas.
Calculamos la población total ($N$):
$$N = N_1 + N_2 + N_3 + N_4 = 7500 + 8400 + 5700 + 3000 = 24600$$
💡 **Tip:** En el muestreo aleatorio estratificado con afijación proporcional, el tamaño de la muestra de cada estrato es proporcional al tamaño de dicho estrato en la población.
Paso 2
Calcular la constante de proporcionalidad y la muestra total
La condición de afijación proporcional establece que:
$$\frac{n_1}{N_1} = \frac{n_2}{N_2} = \frac{n_3}{N_3} = \frac{n_4}{N_4} = \frac{n}{N}$$
Donde $n$ es el tamaño de la muestra total. Usamos los datos del primer estrato para hallar la constante de proporcionalidad ($k$):
$$k = \frac{n_1}{N_1} = \frac{375}{7500} = 0.05$$
Ahora podemos hallar el tamaño de la muestra total ($n$):
$$n = N \cdot k = 24600 \cdot 0.05 = 1230$$
✅ **Resultado (Muestra total):**
$$\boxed{n = 1230 \text{ personas}}$$
Paso 3
Determinar la composición de la muestra
Calculamos el número de personas a seleccionar de cada uno de los estratos restantes multiplicando su población por la constante $k=0.05$:
- Estrato 2: $n_2 = N_2 \cdot 0.05 = 8400 \cdot 0.05 = 420$
- Estrato 3: $n_3 = N_3 \cdot 0.05 = 5700 \cdot 0.05 = 285$
- Estrato 4: $n_4 = N_4 \cdot 0.05 = 3000 \cdot 0.05 = 150$
Comprobamos que la suma sea correcta: $375 + 420 + 285 + 150 = 1230$.
✅ **Resultado (Composición):**
$$\boxed{n_1=375, n_2=420, n_3=285, n_4=150}$$
Paso 4
Construir todas las muestras posibles de tamaño 2
**b) (1.25 puntos) Dada la población $\{2, 4, 6\}$ construya todas las muestras posibles de tamaño 2, que se puedan formar mediante muestreo aleatorio simple, y halle la varianza de las medias muestrales de todas las muestras.**
En el muestreo aleatorio simple (MAS) de una población finita para el estudio de medias muestrales, se considera que el muestreo es con reemplazamiento y el orden importa.
Las muestras posibles de tamaño $n=2$ son:
$$(2, 2), (2, 4), (2, 6), (4, 2), (4, 4), (4, 6), (6, 2), (6, 4), (6, 6)$$
Existen un total de $3^2 = 9$ muestras posibles.
💡 **Tip:** El número de muestras con reemplazamiento es $N^n$, donde $N$ es el tamaño de la población y $n$ el de la muestra.
Paso 5
Calcular las medias muestrales
Calculamos la media de cada una de las 9 muestras $(\bar{x} = \frac{x_1 + x_2}{2})$:
1. $(2, 2) \to \bar{x} = 2$
2. $(2, 4) \to \bar{x} = 3$
3. $(2, 6) \to \bar{x} = 4$
4. $(4, 2) \to \bar{x} = 3$
5. $(4, 4) \to \bar{x} = 4$
6. $(4, 6) \to \bar{x} = 5$
7. $(6, 2) \to \bar{x} = 4$
8. $(6, 4) \to \bar{x} = 5$
9. $(6, 6) \to \bar{x} = 6$
Resumen de las medias muestrales y sus frecuencias:
$$\begin{array}{c|c|c|c|c|c}
\bar{x}_i & 2 & 3 & 4 & 5 & 6 \\ \hline
f_i & 1 & 2 & 3 & 2 & 1
\end{array}$$
Paso 6
Hallar la varianza de las medias muestrales
Calculamos primero la media de todas estas medias muestrales (esperanza de la media muestral, $\mu_{\bar{x}}$):
$$\mu_{\bar{x}} = \frac{\sum \bar{x}_i \cdot f_i}{n_{total}} = \frac{2\cdot 1 + 3\cdot 2 + 4\cdot 3 + 5\cdot 2 + 6\cdot 1}{9} = \frac{2+6+12+10+6}{9} = \frac{36}{9} = 4$$
Ahora calculamos la varianza de las medias muestrales ($\sigma_{\bar{x}}^2$):
$$\sigma_{\bar{x}}^2 = \frac{\sum (\bar{x}_i^2 \cdot f_i)}{9} - (\mu_{\bar{x}})^2$$
$$\sum (\bar{x}_i^2 \cdot f_i) = 2^2\cdot 1 + 3^2\cdot 2 + 4^2\cdot 3 + 5^2\cdot 2 + 6^2\cdot 1$$
$$= 4 + 18 + 48 + 50 + 36 = 156$$
$$\sigma_{\bar{x}}^2 = \frac{156}{9} - 4^2 = \frac{156}{9} - 16 = \frac{156 - 144}{9} = \frac{12}{9} = \frac{4}{3}$$
💡 **Tip:** También se puede comprobar usando la propiedad $\sigma_{\bar{x}}^2 = \frac{\sigma^2}{n}$. La varianza de la población $\{2, 4, 6\}$ es $\frac{8}{3}$. Así, $\sigma_{\bar{x}}^2 = \frac{8/3}{2} = \frac{4}{3}$.
✅ **Resultado (Varianza):**
$$\boxed{\sigma_{\bar{x}}^2 = \frac{4}{3} \approx 1.333}$$