Probabilidad y Estadística 2020 Andalucia
Muestreo estratificado y distribución de medias muestrales
EJERCICIO 7
a) (1 punto) Una población de $25\,000$ personas se ha dividido en cuatro estratos con tamaños $15\,000$, $5\,000$, $3\,000$ y $2\,000$ personas respectivamente. En esa población se ha realizado un muestreo estratificado con afijación proporcional, en el que se han elegido al azar 36 personas del tercer estrato. Determine el tamaño de la muestra total obtenida con este muestreo y su composición.
b) (1.5 puntos) Dada la población $P = \{2, 4, 6\}$, construya todas las muestras posibles de tamaño 2 que se puedan formar mediante muestreo aleatorio simple y halle la desviación típica de las medias muestrales obtenidas con todas esas muestras.
Paso 1
Definir la afijación proporcional
**a) (1 punto) Una población de $25\,000$ personas se ha dividido en cuatro estratos con tamaños $15\,000$, $5\,000$, $3\,000$ y $2\,000$ personas respectivamente. En esa población se ha realizado un muestreo estratificado con afijación proporcional, en el que se han elegido al azar 36 personas del tercer estrato. Determine el tamaño de la muestra total obtenida con este muestreo y su composición.**
En un muestreo estratificado con afijación proporcional, el tamaño de la muestra de cada estrato ($n_i$) debe ser proporcional al tamaño de dicho estrato en la población ($N_i$). Esto se expresa mediante la siguiente relación:
$$\frac{n_1}{N_1} = \frac{n_2}{N_2} = \frac{n_3}{N_3} = \frac{n_4}{N_4} = \frac{n}{N}$$
Donde:
- $N = 25\,000$ es el tamaño total de la población.
- $n$ es el tamaño total de la muestra que queremos hallar.
- $N_1=15\,000, N_2=5\,000, N_3=3\,000, N_4=2\,000$ son los tamaños de los estratos.
- $n_3 = 36$ es el tamaño de la muestra del tercer estrato.
💡 **Tip:** La afijación proporcional garantiza que cada estrato esté representado en la muestra en la misma proporción que en la población original.
Paso 2
Calcular la constante de proporcionalidad y el tamaño total de la muestra
Utilizamos los datos conocidos del tercer estrato para hallar la constante de proporcionalidad (razón de muestreo):
$$\text{Razón} = \frac{n_3}{N_3} = \frac{36}{3\,000} = 0.012$$
Ahora, podemos despejar el tamaño total de la muestra ($n$) usando la población total $N$:
$$\frac{n}{N} = 0.012 \implies n = N \cdot 0.012 = 25\,000 \cdot 0.012 = 300$$
✅ **Resultado (tamaño de la muestra):**
$$\boxed{n = 300 \text{ personas}}$$
Paso 3
Determinar la composición de la muestra
Calculamos el tamaño de muestra para el resto de los estratos aplicando la misma proporción ($0.012$):
- Estrato 1: $n_1 = N_1 \cdot 0.012 = 15\,000 \cdot 0.012 = 180$
- Estrato 2: $n_2 = N_2 \cdot 0.012 = 5\,000 \cdot 0.012 = 60$
- Estrato 4: $n_4 = N_4 \cdot 0.012 = 2\,000 \cdot 0.012 = 24$
**Comprobación:** La suma de las partes debe ser igual al total: $180 + 60 + 36 + 24 = 300$. Es correcto.
✅ **Resultado (composición):**
$$\boxed{\text{Estrato 1: 180; Estrato 2: 60; Estrato 3: 36; Estrato 4: 24}}$$
Paso 4
Construir las muestras posibles
**b) (1.5 puntos) Dada la población $P = \{2, 4, 6\}$, construya todas las muestras posibles de tamaño 2 que se puedan formar mediante muestreo aleatorio simple y halle la desviación típica de las medias muestrales obtenidas con todas esas muestras.**
En un muestreo aleatorio simple (con reemplazamiento), el número total de muestras posibles de tamaño $n=2$ de una población de tamaño $N=3$ es $N^n = 3^2 = 9$.
Las muestras posibles son:
- $(2, 2)$
- $(2, 4)$
- $(2, 6)$
- $(4, 2)$
- $(4, 4)$
- $(4, 6)$
- $(6, 2)$
- $(6, 4)$
- $(6, 6)$
💡 **Tip:** En los ejercicios de selectividad, cuando la población es tan pequeña, "muestreo aleatorio simple" implica que el orden importa y que se pueden repetir elementos (con reposición).
Paso 5
Calcular las medias muestrales y su distribución
Calculamos la media $\bar{x} = \frac{x_1 + x_2}{2}$ para cada muestra:
- $(2, 2) \to \bar{x} = 2$
- $(2, 4) \to \bar{x} = 3$
- $(2, 6) \to \bar{x} = 4$
- $(4, 2) \to \bar{x} = 3$
- $(4, 4) \to \bar{x} = 4$
- $(4, 6) \to \bar{x} = 5$
- $(6, 2) \to \bar{x} = 4$
- $(6, 4) \to \bar{x} = 5$
- $(6, 6) \to \bar{x} = 6$
Resumimos los valores de las medias muestrales y sus frecuencias ($f_i$):
$$\begin{array}{c|c|c|c|c|c}
\bar{x}_i & 2 & 3 & 4 & 5 & 6 \\ \hline
f_i & 1 & 2 & 3 & 2 & 1
\end{array}$$
El número total de datos es $N = 9$.
Paso 6
Calcular la desviación típica de las medias muestrales
Primero calculamos la media de todas las medias muestrales (esperanza matemática $\mu_{\bar{x}}$):
$$\mu_{\bar{x}} = \frac{\sum \bar{x}_i \cdot f_i}{N} = \frac{2(1) + 3(2) + 4(3) + 5(2) + 6(1)}{9} = \frac{2+6+12+10+6}{9} = \frac{36}{9} = 4$$
Calculamos ahora la varianza de las medias muestrales ($\sigma^2_{\bar{x}}$):
$$\sigma^2_{\bar{x}} = \frac{\sum \bar{x}_i^2 \cdot f_i}{N} - \mu_{\bar{x}}^2$$
$$\sigma^2_{\bar{x}} = \frac{2^2(1) + 3^2(2) + 4^2(3) + 5^2(2) + 6^2(1)}{9} - 4^2$$
$$\sigma^2_{\bar{x}} = \frac{4 + 18 + 48 + 50 + 36}{9} - 16 = \frac{156}{9} - 16 = \frac{52}{3} - 16 = \frac{52-48}{3} = \frac{4}{3}$$
Finalmente, la desviación típica es la raíz cuadrada de la varianza:
$$\sigma_{\bar{x}} = \sqrt{\frac{4}{3}} = \frac{2}{\sqrt{3}} \approx 1.1547$$
💡 **Tip:** Otra forma rápida de comprobarlo es usar que $\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}$, donde $\sigma$ es la desviación típica de la población original.
✅ **Resultado final:**
$$\boxed{\sigma_{\bar{x}} = \sqrt{\frac{4}{3}} \approx 1.155}$$