Probabilidad y Estadística 2021 Andalucia
Muestreo estratificado e Inferencia estadística
EJERCICIO 7
a) (1.25 puntos) Se desea tomar una muestra aleatoria estratificada de las personas de un municipio, cuyos estratos son los siguientes tramos de edad: de $0$ a $25$ años, de $26$ a $45$, de $46$ a $60$ y de $61$ años o más. En el primer tramo hay $15000$ personas, en el segundo hay $16800$, en el tercero $11400$ y en el cuarto $6000$. Sabiendo que el muestreo se hace con afijación proporcional y se han elegido al azar $375$ personas del primer tramo, calcule el tamaño de la muestra total y su composición.
b) (1.25 puntos) Dada la población $\{1, 3, 5\}$, establezca todas las muestras posibles de tamaño $2$ que se puedan formar mediante muestreo aleatorio simple y determine la media y la desviación típica de las medias muestrales obtenidas con todas estas muestras.
Paso 1
Análisis de la población y el factor de proporcionalidad
**a) (1.25 puntos) Se desea tomar una muestra aleatoria estratificada de las personas de un municipio, cuyos estratos son los siguientes tramos de edad: de $0$ a $25$ años, de $26$ a $45$, de $46$ a $60$ y de $61$ años o más. En el primer tramo hay $15000$ personas, en el segundo hay $16800$, en el tercero $11400$ y en el cuarto $6000$. Sabiendo que el muestreo se hace con afijación proporcional y se han elegido al azar $375$ personas del primer tramo, calcule el tamaño de la muestra total y su composición.**
Primero, sumamos el número total de personas en la población ($N$):
$$N = 15000 + 16800 + 11400 + 6000 = 49200$$
En un muestreo estratificado con **afijación proporcional**, el tamaño de la muestra en cada estrato ($n_i$) debe ser proporcional al tamaño de dicho estrato en la población ($N_i$). La constante de proporcionalidad $k$ es:
$$k = \frac{n_1}{N_1} = \frac{n_2}{N_2} = \frac{n_3}{N_3} = \frac{n_4}{N_4} = \frac{n}{N}$$
Como conocemos $n_1 = 375$ (muestra del primer estrato) y $N_1 = 15000$ (población del primer estrato), calculamos $k$:
$$k = \frac{375}{15000} = 0.025$$
💡 **Tip:** El valor de $k$ nos indica que vamos a seleccionar al $2.5\%$ de la población de cada estrato.
Paso 2
Cálculo del tamaño total y composición de la muestra
Ahora calculamos el tamaño de la muestra total ($n$) y el número de personas a elegir en los tramos restantes ($n_2, n_3, n_4$):
- **Tamaño total de la muestra ($n$):**
$$n = N \cdot k = 49200 \cdot 0.025 = 1230$$
- **Composición de la muestra:**
1. Tramo 2 ($26$-$45$ años): $n_2 = N_2 \cdot k = 16800 \cdot 0.025 = 420$
2. Tramo 3 ($46$-$60$ años): $n_3 = N_3 \cdot k = 11400 \cdot 0.025 = 285$
3. Tramo 4 ($61$ o más): $n_4 = N_4 \cdot k = 6000 \cdot 0.025 = 150$
Verificamos la suma: $375 + 420 + 285 + 150 = 1230$.
✅ **Resultado:**
$$\boxed{\text{Muestra total: } 1230 \text{ personas. Composición: } 375, 420, 285 \text{ y } 150 \text{ personas respectivamente.}}$$
Paso 3
Identificación de las muestras posibles
**b) (1.25 puntos) Dada la población $\{1, 3, 5\}$, establezca todas las muestras posibles de tamaño $2$ que se puedan formar mediante muestreo aleatorio simple y determine la media y la desviación típica de las medias muestrales obtenidas con todas estas muestras.**
En un muestreo aleatorio simple (con reposición), para una población de $N=3$ elementos y tamaño de muestra $n=2$, el número total de muestras posibles es $3^2 = 9$.
Las muestras posibles y sus respectivas medias ($\bar{x}$) son:
1. $(1, 1) \to \bar{x} = 1$
2. $(1, 3) \to \bar{x} = 2$
3. $(1, 5) \to \bar{x} = 3$
4. $(3, 1) \to \bar{x} = 2$
5. $(3, 3) \to \bar{x} = 3$
6. $(3, 5) \to \bar{x} = 4$
7. $(5, 1) \to \bar{x} = 3$
8. $(5, 3) \to \bar{x} = 4$
9. $(5, 5) \to \bar{x} = 5$
💡 **Tip:** Si el muestreo es aleatorio simple sobre una población pequeña, siempre se asume con reposición a menos que se indique lo contrario.
Paso 4
Cálculo de la media de las medias muestrales
Resumimos las medias obtenidas en una tabla de frecuencias para facilitar el cálculo de la media y la desviación típica:
$$\begin{array}{c|c|c|c}
\bar{x}_i & f_i & \bar{x}_i \cdot f_i & \bar{x}_i^2 \cdot f_i \\ \hline
1 & 1 & 1 & 1 \\
2 & 2 & 4 & 8 \\
3 & 3 & 9 & 27 \\
4 & 2 & 8 & 32 \\
5 & 1 & 5 & 25 \\ \hline
\sum & 9 & 27 & 93
\end{array}$$
Calculamos la **media de las medias muestrales** ($\mu_{\bar{x}}$):
$$\mu_{\bar{x}} = \frac{\sum \bar{x}_i \cdot f_i}{\sum f_i} = \frac{27}{9} = 3$$
💡 **Tip:** Recuerda que la media de todas las medias muestrales siempre coincide con la media de la población original: $\mu = (1+3+5)/3 = 3$.
Paso 5
Cálculo de la desviación típica de las medias muestrales
Para hallar la **desviación típica** ($\sigma_{\bar{x}}$), calculamos primero la varianza muestral ($\sigma_{\bar{x}}^2$):
$$\sigma_{\bar{x}}^2 = \frac{\sum \bar{x}_i^2 \cdot f_i}{\sum f_i} - \mu_{\bar{x}}^2 = \frac{93}{9} - 3^2 = \frac{31}{3} - 9 = \frac{31-27}{3} = \frac{4}{3} \approx 1.333$$
La desviación típica es la raíz cuadrada de la varianza:
$$\sigma_{\bar{x}} = \sqrt{\frac{4}{3}} = \frac{2}{\sqrt{3}} \approx 1.1547$$
✅ **Resultado:**
$$\boxed{\text{Media: } 3, \text{ Desviación típica: } 1.1547}$$