Probabilidad y Estadística 2009 Andalucia
Probabilidad condicionada e Inferencia estadística
EJERCICIO 3
Parte I
Una enfermedad afecta al 10% de la población. Una prueba de diagnóstico tiene las siguientes características: si se aplica a una persona con la enfermedad, da positivo en el 98% de los casos; si se aplica a una persona que no tiene la enfermedad, da positivo en el 6% de los casos. Se elige una persona, al azar, y se le aplica la prueba.
a) (1 punto) ¿Cuál es la probabilidad de que dé positivo?
b) (1 punto) Si no da positivo, ¿cuál es la probabilidad de que tenga la enfermedad?
Parte II
Se desea estimar la proporción de fumadores de una población mediante una muestra aleatoria.
a) (1 punto) Si la proporción de fumadores en la muestra es 0.2 y el error cometido en la estimación ha sido inferior a 0.03, con un nivel de confianza del 95%, calcule el tamaño mínimo de la muestra.
b) (1 punto) Si en otra muestra de tamaño 280 el porcentaje de fumadores es del 25%, determine, para un nivel de confianza del 99%, el correspondiente intervalo de confianza para la proporción de fumadores de esa población.
Paso 1
Organizar los datos en un árbol de probabilidad
**Parte I**
**a) (1 punto) ¿Cuál es la probabilidad de que dé positivo?**
Primero, definimos los sucesos:
- $E$: La persona tiene la enfermedad.
- $\bar{E}$: La persona no tiene la enfermedad (está sana).
- $+$: La prueba da resultado positivo.
- $-$: La prueba da resultado negativo.
Datos del enunciado:
- $P(E) = 0.10 \implies P(\bar{E}) = 0.90$
- $P(+|E) = 0.98 \implies P(-|E) = 0.02$
- $P(+|\bar{E}) = 0.06 \implies P(-|\bar{E}) = 0.94$
Representamos el árbol de probabilidades:
Paso 2
Cálculo de la probabilidad total
Para hallar $P(+)$, utilizamos el **Teorema de la Probabilidad Total**. Debemos sumar las probabilidades de todas las ramas que terminan en positivo:
$$P(+) = P(E) \cdot P(+|E) + P(\bar{E}) \cdot P(+|\bar{E})$$
Sustituimos los valores:
$$P(+) = 0.10 \cdot 0.98 + 0.90 \cdot 0.06$$
$$P(+) = 0.098 + 0.054$$
$$P(+) = 0.152$$
💡 **Tip:** Recuerda que la suma de las probabilidades que salen de un mismo nodo siempre debe ser 1.
✅ **Resultado:**
$$\boxed{P(+) = 0.152}$$
(o equivalentemente, un 15.2%)
Paso 3
Probabilidad condicionada (Teorema de Bayes)
**b) (1 punto) Si no da positivo, ¿cuál es la probabilidad de que tenga la enfermedad?**
Nos piden la probabilidad de que esté enfermo sabiendo que el resultado ha sido negativo: $P(E|-)$. Aplicamos el **Teorema de Bayes**.
$$P(E|-) = \frac{P(E \cap -)}{P(-)} = \frac{P(E) \cdot P(-|E)}{P(-)}$$
Primero calculamos $P(-)$ como el suceso contrario de $P(+)$:
$$P(-) = 1 - P(+) = 1 - 0.152 = 0.848$$
Ahora aplicamos la fórmula:
$$P(E|-) = \frac{0.10 \cdot 0.02}{0.848} = \frac{0.002}{0.848}$$
$$P(E|-) \approx 0.002358$$
✅ **Resultado:**
$$\boxed{P(E|-) \approx 0.00236}$$
(aproximadamente un 0.236%)
Paso 4
Cálculo del tamaño mínimo de la muestra
**Parte II**
**a) (1 punto) Si la proporción de fumadores en la muestra es 0.2 y el error cometido en la estimación ha sido inferior a 0.03, con un nivel de confianza del 95%, calcule el tamaño mínimo de la muestra.**
Datos:
- Proporción muestral: $\hat{p} = 0.2$
- Proporción complementaria: $\hat{q} = 1 - 0.2 = 0.8$
- Margen de error: $E \lt 0.03$
- Nivel de confianza: $1 - \alpha = 0.95$
1. Hallamos el valor crítico $z_{\alpha/2}$:
Para el 95%, $\alpha = 0.05$, luego $\alpha/2 = 0.025$. Buscamos en la tabla de la normal $P(Z \le z_{\alpha/2}) = 0.975$, obteniendo $z_{\alpha/2} = 1.96$.
2. Usamos la fórmula del error para la proporción:
$$E = z_{\alpha/2} \cdot \sqrt{\frac{\hat{p} \cdot \hat{q}}{n}}$$
Queremos que $E \lt 0.03$, por lo que despejamos $n$:
$$0.03 \gt 1.96 \cdot \sqrt{\frac{0.2 \cdot 0.8}{n}}$$
$$\left( \frac{0.03}{1.96} \right)^2 \gt \frac{0.16}{n}$$
$$n \gt \frac{1.96^2 \cdot 0.16}{0.03^2}$$
$$n \gt \frac{3.8416 \cdot 0.16}{0.0009} = \frac{0.614656}{0.0009} \approx 682.95$$
💡 **Tip:** Al pedir el tamaño mínimo para garantizar un error *inferior*, siempre debemos redondear hacia el siguiente entero superior.
✅ **Resultado:**
$$\boxed{n \ge 683 \text{ personas}}$$
Paso 5
Cálculo del intervalo de confianza para la proporción
**b) (1 punto) Si en otra muestra de tamaño 280 el porcentaje de fumadores es del 25%, determine, para un nivel de confianza del 99%, el correspondiente intervalo de confianza para la proporción de fumadores de esa población.**
Datos:
- Tamaño de muestra: $n = 280$
- Proporción muestral: $\hat{p} = 0.25 \implies \hat{q} = 0.75$
- Nivel de confianza: $1 - \alpha = 0.99 \implies \alpha = 0.01$
1. Hallamos el valor crítico $z_{\alpha/2}$ para el 99%:
$P(Z \le z_{\alpha/2}) = 1 - 0.005 = 0.995$. Mirando en las tablas, $z_{\alpha/2} \approx 2.575$ (o 2.58).
2. Calculamos el margen de error:
$$E = z_{\alpha/2} \cdot \sqrt{\frac{\hat{p} \cdot \hat{q}}{n}} = 2.575 \cdot \sqrt{\frac{0.25 \cdot 0.75}{280}}$$
$$E = 2.575 \cdot \sqrt{\frac{0.1875}{280}} \approx 2.575 \cdot \sqrt{0.0006696} \approx 2.575 \cdot 0.025877 \approx 0.0666$$
3. Construimos el intervalo $IC = (\hat{p} - E, \hat{p} + E)$:
$$IC = (0.25 - 0.0666, 0.25 + 0.0666)$$
$$IC = (0.1834, 0.3166)$$
✅ **Resultado:**
$$\boxed{IC = (0.1834, 0.3166)}$$
(o expresado en porcentaje: entre el 18.34% y el 31.66%)