Distribución de probabilidad binomial y su implementación en R


Distribución Binomial
Si repetimos \(n\) veces de forma independiente un experimento Bernoulli de parámetro \(p\).
El espacio muestral \(\Omega\) estará formado por cadenas de \(E\)’s(exitos) y \(F\)’s(fracasos) de longitud \(n\), Consideremos la variable aleatoria.

$(\overbrace{EFFF\ldots EEF}^{n})=$ número de éxitos en la cadena

A la variable aleatoria anterior se le conoce como distribución binomial de parámetros \(n\) y \(p\), y lo denotaremos por \(X\equiv B(n,p).\)

¿Cómo identificamos una variable binomial?
Se puede decir que una variable aleatoria es binomial ( tiene una distribución binomial) siempre y cuando cumplan las siguientes 4 condiciones:
    $1.$ El experimento consiste en una serie de n experimentos más pequeños a los que llamaremos ensayos, donde n es fijado antes de realizar el experimento.

    $2.$ Cada ensayo puede resultar en dos eventos posibles (ensayos dicotómicos) los cuales son: éxito ($E$) y fracaso ($F$).

    $3.$ La probabilidad de éxito $P(E)$ es la misma en cada ensayo, esta probabilidad se denota por p.

    $4.$ Los intentos son independientes, es decir, el resultado de un intento no influye en el resultado de los demás.
Siendo $X$ el número total de éxitos en n intentos; si se cumplen las cuatro condiciones, $X$ tiene una distribución binomial con una probabilidad de éxito (en cada intento) igual a p.

Comprobando las condiciones de una distribución binomial

Experimento: Lanzar una moneda al aire 8 veces y contar el número de caras ($X$).
Pregunta: ¿$X$ tiene una distribución binomial?

    $1.$ ¿El número de intentos es fijo?
    se Lanza la moneda 8 veces, que es un número fijo. La condición 1 se cumple.

    $2.$ ¿Cada ensayo tiene solo dos resultados posibles ( éxito o fracaso) ?
    Cada lanzamiento da como resultado cara o cruz, y tenemos como objetivo contar el número de caras. Por lo tanto, E(éxito)=cara, y F(fracaso)=cruz. La condición 2 se cumple.

    $3.$ ¿Cada ensayo tiene la misma probabilidad de éxito?
    Si la moneda no está trucada, la probabilidad de éxito (cara) es $p=1/2$ para cada ensayo. También se sabe que $q= 1– 1/2 = 1/2$ es la probabilidad de fracaso (cruz) para cada ensayo. La condición 3 se cumple.

    $4.$ ¿Los ensayos son independientes?
    Partimos de que la moneda se lanza siempre de la misma forma, de manera que el resultado de un lanzamiento no afecta al resultado de loslanzamientos posteriores. La condición 4 se cumple.

Como la variable aleatoria $X$ [el número de éxitos(caras) que ocurren en diez intentos (lanzamientos)] cumple las cuatro condiciones, concluimos que tiene una distribución binomial con $n$ = 10 y $p = 1/2.$

Esta variable aleatoria no tiene distribución binomial

Experimento: Lanzar una moneda no trucada hasta que te salgan cuatro caras y contar el número de lanzamientos que tardamos en conseguirlo.
Pregunta: ¿$X$ tiene una distribución binomial?

En este caso $X$ =número de lanzamientos. Sin duda, esto parece una situación binomial:
  1. La condición 2 se cumple porque tienes éxito (cara) y fracaso (cruz) en cada lanzamiento.

  2. La condición 3 se cumple, ya que la probabilidad de éxito (cara) es la misma (0,5) para cada lanzamiento

  3. Además los lanzamientos son independientes, con lo que se cumple la condición 4.

  4. Sin embargo, $X$ no cuenta el número caras, sino el número de intentos necesarios para que salgan cuatro caras en total. Lo que es fijo es el número de éxitos ($X$), y no el número de intentos ($n$). La condición 1 no se cumple.

De manera que $X$ no tiene una distribución binomial en este caso.

Una vez que hayas identificado que $X$ tiene una distribución binomial (se cumplen las cuatro condiciones ), posiblemente quieras conocer la probabilidad de $X$.

Función de probabilidad de una binomial
La probabilidad binomial describe la variación de los resultados de un experimento aleatorio, es decir, las probabilidades de todos los resultados admisibles que podrían obtenerse una vez realizado el experimento aleatorio. Y viene dada por la ecuación: $$ P_{X}(x)=\left\{ \begin{array}{ll} {n\choose x}\cdot p^x \cdot(1-p)^{n-x} &\mbox{ si } x=0,1,\ldots,n\\ 0 & \mbox{ en otro caso} \end{array}\right.. $$
Donde:
  • $n$ es el número fijo de intentos.
  • $x$ es el número especificado de éxitos.
  • $n – x$ es el número de fracasos.
  • $p$ es la probabilidad de éxito en un intento cualquiera.
  • $1 – p$ es la probabilidad de fracaso en un intento cualquiera.

Distribución binomial en R

En R tenemos la función del paquete Rlab:
dbinom(x, size, prob)
El cual muestra los valores de la función de probabilidad de una variable con distribución binomial. Donde:
  • x es el valor de la variable para el cual queremos calcular la función de probabilidad.
  • prob es la probabilidad de éxito.
  • size el número de ensayos del experimento.


Ejemplo: número de bolas rojas extraídas de una urna con reposición


Tenemos una urna con \(100\) bolas de las cuales 40 son rojas y 60 son blancas. Extraemos al azar una bola, anotamos su color y la devolvemos a (reponemos en) la urna.
Supongamos que repetimos este proceso \(n=10\) reponiendo en cada ocasión la bola extraída.
Consideremos la variable aleatoria \(X\) como el número de bolas rojas extraídas (con reposición) en \(n=10\) repeticiones del mismo experimento de Bernoulli.
Bajo estas condiciones repetimos \(n=10\) veces el mismo experimento de Bernoulli con probabilidad de éxito (sacar bola roja) $$P(Roja)=P(Éxito)=p=\frac{40}{100}=0.4.$$
Así que la variable \(X\) que es el número de bolas rojas extraídas de la urna (con reposición) en \(n=10\) ocasiones sigue una ley binomial \(B(n=10,p=0.4).\)

Utilizaremos R para graficar la función de probabilidad


aux=rep(0,22)
aux[seq(2,22,2)]=dbinom(c(0:10),size=10,prob=0.4)
plot(x=c(0:10),y=dbinom(c(0:10),size=10,prob=0.4),
     ylim=c(0,1),xlim=c(-1,11),xlab="x",
     main="Función de probabilidad\n B(n=10,p=0.4)")
lines(x=rep(0:10,each=2),y=aux, type = "h", lty = 2,col="blue")

Retomando el ejemplo nos preguntamos:

¿Cuál es la probabilidad de que saquemos exactamente 4 rojas?

Solución

La probabilidad de sacar exactamente 4 rojas se expresa como \[ \begin{eqnarray*} P(x = 4)= {10\choose 4}\cdot 0.4^4\cdot (1-0.4)^{10-4}\\ \end{eqnarray*} =0.2508227. \]

Con R:


 dbinom(4,size=10,prob = 0.4)
 
[1] 0.2508227

¿Cuál es la probabilidad de que saquemos menos de 3 bolas rojas?

Solución

La probabilidad de sacar menos de 3 rojas se expresa como \[ \begin{eqnarray*} P(x < 3)&=& P(X=0)+P(X=1)+P(X=2)\\ &=& {10\choose 0}\cdot 0.4^0\cdot (1-0.4)^{10-0}+ {10\choose 1}\cdot 0.4^1\cdot (1-0.4)^{10-1}\\ &+&{10\choose 2}\cdot 0.4^2\cdot (1-0.4)^{10-2}\\ &=&0.1672898. \end{eqnarray*} \]

Con R:


 dbinom(0,10,0.4)+dbinom(1,10,0.4)+dbinom(2,10,0.4)
 
[1] 0.1672898


Te recomiendo el libro "INTRODUCCIÓN A LA TEORÍA DE LA PROBABILIDAD" de Miguel Angel García Alvarez para complementar el tema de distribución binomial.

Les dejo documentación acerca scipy.stats.binom , un modulo la biblioteca Scipy para implementar la distribución binomial en python. https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.binom.html

Publicar un comentario

0 Comentarios