El espacio de resultados Ω es el conjunto de posibles resultados de un experimento aleatorio. A los puntos ω∈Ω se les conoce como resultados muestrales, realizaciones o elementos.
Ejemplo: Si lanzamos una moneda dos veces entonces el espacio de resultados es:
Ω={AA,AS,SA,SS}
Un evento es un subconjunto del espacio muestral, los eventos usualmente se denotan por letras mayúsculas.
El evento: que la primer lanzamiento resulte águila es
A={AA,AS}
Eventos equiprobables
La probabilidad se puede ver como una extensión de la idea de proporción, o cociente de una parte con respecto a un todo. Si en la carrera de matemáticas del ITAM hay 300 estudiantes hombres y 700 mujeres, la proporción de hombres es:
300700+300=0.3
Ahora, supongamos que elegimos un estudiante al azar, la probabilidad de elegir una mujer es 0.7.
En el ejemplo hay un supuesto implícito en elegir al azar (o aleatoriamente), en este caso estamos suponiendo que todos los estudiantes tienen la misma probabilidad de ser elegidos, que nos lleva al siguiente concepto:
Eventos equiprobables. Si todos los elementos en el espacio de resultados tienen la misma oportunidad de ser elegidos entonces la probabilidad del evento A es el número de resultados en A dividido entre el número total de posibles resultados:
P(A)=#(A)#(Ω)
Por lo que solo hace falta contar.
Por ejemplo, la probabilidad de obtener AA si lanzamos una moneda dos veces es 1/4=0.25, y la probabilidad del evento que la primer lanzamiento resulte águila es 2/4=0.5.
Lanzamos un dado y anotamos el número de la cara superior, después lanzamos otro dado y anotamos el número de la cara superior.
¿Cuál es el espacio de resultados?
¿Cuál es la probabilidad de que la suma de los números sea 5?
¿Cuál es la probabilidad de que el segundo número sea mayor que el primero?
Repite las preguntas anteriores cuando lanzas 2 dados con n caras (n≥4).
Ejemplo: combinaciones
Un comité de 5 personas será seleccionado de un grupo de 6 hombres y 9 mujeres. Si la selección es aleatoria, ¿cuál es la probabilidad de que el comité este conformado por 3 hombres y 2 mujeres?
Hay (155) posibles comités, cada uno tiene la misma posibilidad de ser seleccionado. Por otra parte, hay (63)(92) posibles comités que incluyen 3 hombres y 2 mujeres, por lo tanto, la probabilidad que buscamos es:
(63)(92)(155)
y la función para calcular combinaciones en R es choose(n, r)
choose(6, 3) * choose(9, 2) / choose(15, 5)
#> [1] 0.24
Interpretación frecuentista de probabilidad
Ya tenemos una interpretación intuitiva de probabilidad pero nos deja abierta la pregunta de como interpretar probabilidades en aplicaciones. En el curso veremos dos interpretaciones de probabilidad: la interpretación frecuentista en la cuál las probabilidades se entienden como una aproximación matemática de frecuencias relativas cuando la frecuencia total tiende a infinito. La segunda interpretación es la subjetiva en la que un enunciado de probabilidad expresa la opinión de un individuo respecto a la certeza de que ocurra un evento.
Por ahora nos concentramos en la interpretación frecuentista. Una frecuencia relativa es una proporción que mide que tan seguido, o frecuente, ocurre una u otra cosa en una sucesión de observaciones. Pensemos en un experimento que se pueda repetir, por ejemplo, lanzar una moneda, lanzar un dado, el nacimiento de un bebé. Llamaremos ensayo a una repetición del experimento. Ahora, sea A un posible resultado del evento (obtener sol, obtener un 6, el bebé es niña), si A ocurre m veces en n ensayos, entonces la frecuencia relativa de A en n ensayos es m/n.
Supongamos que lanzamos una moneda 10 veces y obtenemos los siguientes resultados:
Una regla general, es que las frecuencias relativas basados en un número mayor de observaciones son menos fluctuantes comparado con las frecuencias relativas basadas en pocas observaciones. Este fenómeno se conoce como la ley empírica de los promedios:
geom_hline(yintercept = 0.5, color = "red", alpha = 0.5) +
geom_line(color = "darkgray") +
geom_point(size = 1.0) +
labs(y = "frecuencia relativa", title = "1000 volados", x = "lanzamiento")
Explicación paso a paso:
En la interpretación frecuentista, la probabilidad de un evento A es la estimación de la frecuencia relativa de A cuando el número de ensayos tiende a infinito. Si denotemos la proporción de veces que ocurre A en n ensayos por Pn(A), se espera que Pn(A) sea cercana a la probabilidad P(A) si n es grande:
Respuesta:
El espacio de resultados Ω es el conjunto de posibles resultados de un experimento aleatorio. A los puntos ω∈Ω se les conoce como resultados muestrales, realizaciones o elementos.
Ejemplo: Si lanzamos una moneda dos veces entonces el espacio de resultados es:
Ω={AA,AS,SA,SS}
Un evento es un subconjunto del espacio muestral, los eventos usualmente se denotan por letras mayúsculas.
El evento: que la primer lanzamiento resulte águila es
A={AA,AS}
Eventos equiprobables
La probabilidad se puede ver como una extensión de la idea de proporción, o cociente de una parte con respecto a un todo. Si en la carrera de matemáticas del ITAM hay 300 estudiantes hombres y 700 mujeres, la proporción de hombres es:
300700+300=0.3
Ahora, supongamos que elegimos un estudiante al azar, la probabilidad de elegir una mujer es 0.7.
En el ejemplo hay un supuesto implícito en elegir al azar (o aleatoriamente), en este caso estamos suponiendo que todos los estudiantes tienen la misma probabilidad de ser elegidos, que nos lleva al siguiente concepto:
Eventos equiprobables. Si todos los elementos en el espacio de resultados tienen la misma oportunidad de ser elegidos entonces la probabilidad del evento A es el número de resultados en A dividido entre el número total de posibles resultados:
P(A)=#(A)#(Ω)
Por lo que solo hace falta contar.
Por ejemplo, la probabilidad de obtener AA si lanzamos una moneda dos veces es 1/4=0.25, y la probabilidad del evento que la primer lanzamiento resulte águila es 2/4=0.5.
Lanzamos un dado y anotamos el número de la cara superior, después lanzamos otro dado y anotamos el número de la cara superior.
¿Cuál es el espacio de resultados?
¿Cuál es la probabilidad de que la suma de los números sea 5?
¿Cuál es la probabilidad de que el segundo número sea mayor que el primero?
Repite las preguntas anteriores cuando lanzas 2 dados con n caras (n≥4).
Ejemplo: combinaciones
Un comité de 5 personas será seleccionado de un grupo de 6 hombres y 9 mujeres. Si la selección es aleatoria, ¿cuál es la probabilidad de que el comité este conformado por 3 hombres y 2 mujeres?
Hay (155) posibles comités, cada uno tiene la misma posibilidad de ser seleccionado. Por otra parte, hay (63)(92) posibles comités que incluyen 3 hombres y 2 mujeres, por lo tanto, la probabilidad que buscamos es:
(63)(92)(155)
y la función para calcular combinaciones en R es choose(n, r)
choose(6, 3) * choose(9, 2) / choose(15, 5)
#> [1] 0.24
Interpretación frecuentista de probabilidad
Ya tenemos una interpretación intuitiva de probabilidad pero nos deja abierta la pregunta de como interpretar probabilidades en aplicaciones. En el curso veremos dos interpretaciones de probabilidad: la interpretación frecuentista en la cuál las probabilidades se entienden como una aproximación matemática de frecuencias relativas cuando la frecuencia total tiende a infinito. La segunda interpretación es la subjetiva en la que un enunciado de probabilidad expresa la opinión de un individuo respecto a la certeza de que ocurra un evento.
Por ahora nos concentramos en la interpretación frecuentista. Una frecuencia relativa es una proporción que mide que tan seguido, o frecuente, ocurre una u otra cosa en una sucesión de observaciones. Pensemos en un experimento que se pueda repetir, por ejemplo, lanzar una moneda, lanzar un dado, el nacimiento de un bebé. Llamaremos ensayo a una repetición del experimento. Ahora, sea A un posible resultado del evento (obtener sol, obtener un 6, el bebé es niña), si A ocurre m veces en n ensayos, entonces la frecuencia relativa de A en n ensayos es m/n.
Supongamos que lanzamos una moneda 10 veces y obtenemos los siguientes resultados:
lanzamientos_10 <- sample(c("A", "S"), 10, replace = TRUE)
lanzamientos_10
#> [1] "S" "A" "S" "S" "A" "S" "S" "A" "S" "A"
Podemos calcular las secuencia de frecuencias relativas de águila:
cumsum(lanzamientos_10 == "A") # suma acumulada de águilas
#> [1] 0 1 1 1 2 2 2 3 3 4
cumsum(lanzamientos_10 == "A") / 1:10
#> [1] 0.00 0.50 0.33 0.25 0.40 0.33 0.29 0.38 0.33 0.40
Una regla general, es que las frecuencias relativas basados en un número mayor de observaciones son menos fluctuantes comparado con las frecuencias relativas basadas en pocas observaciones. Este fenómeno se conoce como la ley empírica de los promedios:
n <- 1000
data_frame(num_lanzamiento = 1:n, lanzamiento = sample(c("A", "S"), n, replace = TRUE)) %>%
mutate(frec_rel = cummean(lanzamiento == "A")) %>%
ggplot(aes(x = num_lanzamiento, y = frec_rel)) +
geom_hline(yintercept = 0.5, color = "red", alpha = 0.5) +
geom_line(color = "darkgray") +
geom_point(size = 1.0) +
labs(y = "frecuencia relativa", title = "1000 volados", x = "lanzamiento")
Explicación paso a paso:
En la interpretación frecuentista, la probabilidad de un evento A es la estimación de la frecuencia relativa de A cuando el número de ensayos tiende a infinito. Si denotemos la proporción de veces que ocurre A en n ensayos por Pn(A), se espera que Pn(A) sea cercana a la probabilidad P(A) si n es grande:
Pn(A)≈P(A)