Distribución Binomial

Unidad de Apoyo para el Aprendizaje

Iniciar

Introducción


La distribución binomial es uno de los modelos matemáticos que más se utilizan para calcular la probabilidad de éxito de un evento, siempre y cuando la variable a analizar sea discreta. Se relaciona con el experimento aleatorio de Bernoulli, nombrado así en honor de Jakob Bernoulli, matemático y científico suizo.

Utilizamos la distribución binomial en todos los eventos donde solamente hay dos resultados, por ejemplo, la definición del sexo de un bebé; el que nuestro equipo favorito gane o pierda algún partido; el que pase o repruebe un examen. Ahí, sin darnos cuenta, estamos haciendo uso de este concepto.

Si lo reflexionas detenidamente, su uso es más común de lo que se piensa. Considera cuántas veces en la vida diaria y en qué momento utilizas la distribución binomial; verás que son muchas más de las que te habías dado cuenta.



Collage de tres imágenes, un par de bebés, de los cuales no sabemos su sexo; un partido de futbol; y una persona resolviendo un examen.

El estudio de este tema te permitirá:

Calcular la distribución binomial mediante su fórmula, a fin de obtener la probabilidad de éxito o fracaso de algún evento de la vida diaria.

Conceptos básicos


La distribución binomial se relaciona con un experimento aleatorio conocido como experimento de Bernoulli, el cual tiene las siguientes características:



    El experimento está constituido por un número finito, n, de pruebas idénticas.
    Cada prueba tiene exactamente dos resultados posibles. A uno de ellos se le llama arbitrariamente éxito y al otro, fracaso.
    La probabilidad de éxito de cada prueba aislada es constante para todas las pruebas y recibe la denominacion de p.
    Por medio de la distribucion binomial tratamos de encontrar un número dado de éxitos en un número igual o mayor de pruebas.


Puesto que sólo hay dos resultados posibles, la probabilidad de fracaso, a la que podemos denominar q, está dada por la diferencia 1 – p, esto es, corresponde al complemento de la probabilidad de éxito, y como ésta última es constante, entonces también lo es la probabilidad de fracaso.

La probabilidad de x éxitos en n intentos está dada por la siguiente expresión:






Esta fórmula nos dice que la probabilidad de obtener x número de éxitos en n pruebas, está dada por la multiplicación de n combinaciones en grupos de x por la probabilidad de éxito elevada al número de éxitos deseado, y por la probabilidad de fracaso elevada al número de fracasos deseados.

Con el término combinaciones nos referimos al número de formas en que podemos extraer grupos de k objetos, tomados de una colección de n de ellos (n ≥ k); considerando que el orden en que se toman o seleccionan no establece diferencia alguna. El símbolo nCk denota el número de tales combinaciones y se lee combinaciones de n objetos tomados en grupos de k. Operativamente…

nCk = n!/[x! (n-x)!]

El símbolo ! indica el factorial del número, de modo que…

n! = (1)(2)(3)… (n)



A continuación, se presentan varios ejemplos que nos ayudarán a comprender el uso de esta distribución.



Televisores

Un embarque de veinte televisores incluye tres unidades defectuosas. Si se inspeccionan tres televisores al azar, indique usted cuál es la probabilidad de que se encuentren dos defectuosos.

Podemos verificar si se trata de una distribución binomial mediante una lista de chequeo de cada uno de los puntos que caracterizan a esta distribución.

Característica Estatus Observación
Hay un número finito de ensayos. Cada televisor es un ensayo y hay tres de ellos.
Cada ensayo tiene sólo dos resultados. Cada televisor puede estar defectuoso o no.
La probabilidad de éxito es constante. La probabilidad de que la unidad esté defectuosa es 3/20.
Se desea saber la probabilidad de un cierto número de éxitos. Se desea saber la probabilidad de que X = 2

Una vez que hemos confirmado que se trata de una distribución binomial, aplicamos la expresión P(x) = nCx pxq(n-x), de modo que…

P(2) = 3C2 (3/20)2(17/20)1 = 3 (0.0225)(0.85) = 0.057375

El resultado obtenido es la probabilidad de que aparezcan dos aparatos de televisión defectuosos. Si queremos pasarlo a porcentaje, el valor se debe multiplicar por 100 %.



Planeación familiar

Una pareja de recién casados planea tener tres hijos. Indica cuál es la probabilidad de que los tres hijos sean varones si consideramos que la probabilidad de que el descendiente sea hombre o mujer es igual.

Verificamos primero si se cumplen los puntos que caracterizan la distribución binomial.

Claramente es un experimento aleatorio con tres ensayos y en todos ellos sólo hay dos resultados posibles, cada uno con probabilidad de 0.5 en cada ensayo. Si se define como éxito que el sexo sea masculino, entonces podemos decir que se desea saber la probabilidad de que haya tres éxitos.

Entonces, el experimento lleva a una distribución binomial y…

P(3) = 3C3 (1/2)3(1/2)0 = (1/2)3 = 0.0125

El resultado obtenido es la probabilidad de que los tres hijos de la pareja sean varones. Si queremos pasarlo a porcentaje, el valor se debe multiplicar por 100 %.



Clases de geografía

Se sabe que el 30 % de los estudiantes de secundaria en México es incapaz de localizar en un mapa el lugar donde se encuentra Afganistán. Si se entrevista a seis estudiantes de este nivel elegidos al azar:

a) ¿Cuál será la probabilidad de que exactamente dos puedan localizar este país?
b) ¿Cuál será la probabilidad de que un máximo de dos puedan localizar este país?

Al igual que en los casos anteriores, verificamos si se cumple o no que el experimento lleve a una distribución binomial.

Se trata de un experimento con seis ensayos, en cada uno de los cuales puede ocurrir que el estudiante sepa o no sepa localizar Afganistán en el mapa. Si se define como éxito que sí sepa la localización, podemos decir que la probabilidad de éxito es de 0.70. Además, las probabilidades que se desean calcular se refieren al número de éxitos. Concluimos que el experimento es Bernoulli y, por lo tanto…

P(2) = 6C2 (0.70)2(0.30)4 = 15 (0.49)(0.0081) = 0.059535

El resultado obtenido es la probabilidad exacta de que dos estudiantes de secundaria localicen en el mapa Afganistán. Si queremos pasarlo a porcentaje, el valor se debe multiplicar por 100 %.

Por cuanto hace al inciso (b), la frase “un máximo de dos” significa que X toma los valores cero, uno o dos. Entonces…

P(X ≤ 2) = P(2) + P(1) + P(0) =
= 6C2 0.70)2(0.30)4 + 6C1 (0.70)1(0.30)5 + 6C0 (0.70)0(0.30)6 =
= 15(0.49)(0.0081) + 6(0.7)(0.00243) + 0.1 + 0.000729
= 0.05953

El resultado obtenido es la probabilidad máxima de que dos estudiantes de secundaria localicen en el mapa Afganistán. Si queremos pasarlo a porcentaje, el valor se debe multiplicar por 100 %.

Esperanza y varianza de una variable aleatoria binomial


Consideremos de nueva cuenta el ejemplo Televisores. ¿Qué pasa con las probabilidades de los otros valores posibles para la variable aleatoria? Si hacemos los cálculos respectivos tendríamos…

P(0) = 3C0 (3/20)0(17/20)3 = 0.614125

P(1) = 3C1 (3/20)1(17/20)2 = 3(0.15)(0.7225) = 0.325125

P(3) = 3C3 (3/20)3(17/20)0 = (0.003375) = 0.003375

Si recordamos que P(2) = 0.057375, entonces podemos confirmar que…

P(0) + P(1) + P(2) + P(3) = 1.00

Lo que era de esperarse, puesto que los valores 0, 1, 2 y 3 constituyen el universo en el experimento en cuestión.

Con estos valores podemos determinar la esperanza y varianza de la variable aleatoria considerada. Para ello, nos es útil acomodar los datos en una tabla recordando que…

μ = Σ x [P(X=x)], y que, σ2 = Σ (x – μ)2 [P(X=x)]


x Función de probabilidad x P(X = x) (x - 0.45)2 (x - 0.45)2 P(X = x)
P( X = x)
0 0.614125 0.000000 0.2025 0.124360
1 0.325125 0.325125 0.3025 0.098350
2 0.057375 0.114750 2.4025 0.137843
3 0.003375 0.010125 6.5025 0.021946
Suma 0.450000 0.382500


Entonces, la esperanza es 0.45 y la varianza 0.3825.

Parámetros de la distribución binomial


Si interpretamos las probabilidades anteriores en un sentido frecuentista, diríamos que si consideramos un número grande de realizaciones del experimento, por ejemplo, un millón de veces, en aproximadamente 614 125 realizaciones tendremos televisores sin defecto; en 325 125 veces encontraremos un televisor con defecto; en otras 57 375 ocasiones encontraremos dos televisores con defecto; y en 33 751 veces los tres televisores estarían defectuosos.



Con los datos anteriores podemos elaborar una tabla de distribución de frecuencias y calcular el promedio de televisores defectuosos.

Número de televisores defectuosos (x) Frecuencia (f) fm
0 614125 0
1 325125 325125
2 57375 114750
3 3375 10125
Total 1000000 450000


Luego…

μ = 450 000/1 000 000 = 0.45

Asimismo, podemos calcular la varianza

σ2 = [614125(0-0.45)2 + 325125(1-0.45)2 + 57375(2-0.45)2 + 3375(3-0.45)2]/100
= (124360.313 + 98350.3125 + 137843.438 + 29945.9375)/100
= 0.3825

Observa que hemos seguido fielmente las lecciones de estadística descriptiva en el cálculo de μ y σ, y que hemos llegado a los mismos valores que ya habíamos obtenido. Esto nos proporciona por lo menos un esquema con el cual podemos interpretar la esperanza y varianza, haciendo uso del concepto de frecuencias.

Es importante

Darse cuenta que podemos llegar a estos mismos valores de un modo más sencillo si nos percatamos que…

  • μ = 0.45 es precisamente el resultado que se obtiene al multiplicar el número de ensayos por la probabilidad de éxito, esto es, 3(0.15).
  • σ2 = 0.3825 es precisamente el resultado que se obtiene al multiplicar el número de ensayos por la probabilidad de éxito y por la de fracaso, esto es, 3(0.15) (0.85).


En otras palabras…

Media y varianza de una variable aleatoria binomial

μ = npσ2 = npq



Puede ocurrir, como en el caso del ejemplo anterior, que la esperanza dé un valor que no coincide con los valores posibles de la variable aleatoria. Por eso, se dice que la esperanza es un valor ideal.

Por otra parte, si desglosamos cada uno de los elementos que integran la expresión del cálculo de probabilidades de la distribución binomial y consideramos las expresiones para el cálculo de la media y la varianza, tendremos que…

Expresiones para el cálculo de la media y varianza en una distribución binomial
nCx = n!/[x!(n - x)!]
px = px
qn-x = (1 - p)n-x
Media = np
Varianza = n p (1 - p)


Lo que nos revela que para poder calcular cualquier probabilidad con el modelo binomial, o su esperanza o varianza, debemos conocer los valores de n, el número total de ensayos; y de p, la probabilidad de éxito. El valor de x, el número de éxitos, se establece de acuerdo con las necesidades del problema.

Lo anterior nos permite concluir que la distribución binomial queda completamente caracterizada cuando conocemos los valores de n y p. Por esta razón, a estos valores se les conoce como los parámetros de la distribución.

Un error que suele cometerse a propósito de la distribución binomial, es considerar que sus parámetros son la esperanza y varianza de la variable aleatoria respectiva. En realidad, estos dos valores se expresan en función de los parámetros. El siguiente ejemplo nos ayudará a entender este concepto.

Salud pública

De acuerdo con estudios realizados en un pequeño poblado, el 20 % de la población tiene parásitos intestinales. Si se toma una muestra de 1400 personas, ¿cuántos esperamos que tengan parásitos intestinales?

Media = np = 1400(0.20)= 280

Para poder resolver la pregunta utilizaremos el teorema de Chebyshev: “La probabilidad de que una variable aleatoria tome un valor contenido en k desviaciones estándar de la media es cuando menos 1 – 1/k2”.

Utilizando el teorema de Chebyshev, podríamos considerar que el valor real estaría a dos desviaciones estándar con un 75 % de probabilidades y a tres con un 89 %. De acuerdo con esto, obtenemos la desviación estándar y posteriormente determinamos los intervalos.




La media, más menos dos desviaciones estándar, nos daría un intervalo de 250 a 310 personas que tienen problemas. Recuerda que las desviaciones estándar se calculan con los valores obtenidos por la media y las diferencias entre cada uno de los valores elevadas al cuadrado, y a ese valor sacando la raíz cuadrada, pero en este caso se obtienen por medio de tablas ya elaboradas.

La media, más menos tres desviaciones estándar, nos daría un intervalo de 235 a 325 personas que podrían tener problemas.



Con el cálculo anterior queda demostrado el Teorema de Chebyshev, en el que para este ejemplo en particular, el uso de dos o tres desviaciones estándar representan a la población que puede tener parásitos intestinales.

Actividad. De Museos y seguros

Ahora que has revisado un poco más sobre la distribución binomial y su aplicación a la vida diaria a través de ejemplos como lanzar una moneda, en el cual se tienen sólo dos posibles resultados, es indispensable que logres identificar los parámetros para determinar tal distribución (éstos son dados por el promedio y la varianza). La obtención de una correcta distribución binomial puede ser la clave para la toma de decisiones en entornos públicos y privados.

Recuerda que siempre puedes regresar a ver los ejemplos, así como las fórmulas empleadas durante el desarrollo del tema.

Lee con atención, identifica los datos del problema planteado y calcula la probabilidad que se solicita, una vez la tengas vinculada con el problema que corresponda.

Autoevaluación. El último reto

Ahora que revisaste de forma detenida las condiciones para aplicar la distribución binomial; que has visto las condiciones que se deben cumplir; y has hecho los ejercicios y actividades, te invito a que realices un último reto que pondrá a prueba lo aprendido.

Recuerda que si tienes duda, puedes consultar en cualquier momento las fórmulas y los ejemplos del tema.

Lee con atención el problema, realiza el cálculo que se te solicita en cada uno y selecciona el valor correcto.

Fuentes de información

Básicas

Bibliografía

Anderson, D., Sweeney, D. y Williams, T. (2005). Estadística para administración y economía (8.ª ed.). México: Thomson.

Berenson, M., Levine, D. y Krehbiel, T. (2001). Estadística para administración (2.ª ed.). México: Prentice Hall.

Hernández, R., Fernández, C., Baptista, L. P. (2006). Metodología de la investigación (4.ª ed.). México: McGraw-Hill Interamericana.

Levin, R. y Rubin, D. (2004). Estadística para administración y economía (7.ª ed.). México: Pearson Educación.

Lind, D., Marchal, W. y Wathen, S. (2008). Estadística aplicada a los negocios y la economía (13.ª ed.). México: McGraw-Hill.

Documentos electrónicos

Camargo, A., García, J., Minjares, M., Rodríguez, A. y Serrano, R. (2010). Distribución Binomial. En Estadística I. Licenciatura en Contaduría (pp. 180-189). [CD-ROM]. México: Universidad Nacional Autónoma de México.


Cómo citar