La distribución binomial es uno de los modelos matemáticos que más se utilizan para calcular la probabilidad de éxito de un evento, siempre y cuando la variable a analizar sea discreta. Se relaciona con el experimento aleatorio de Bernoulli, nombrado así en honor de Jakob Bernoulli, matemático y científico suizo.
Utilizamos la distribución binomial en todos los eventos donde solamente hay dos resultados, por ejemplo, la definición del sexo de un bebé; el que nuestro equipo favorito gane o pierda algún partido; el que pase o repruebe un examen. Ahí, sin darnos cuenta, estamos haciendo uso de este concepto.
Si lo reflexionas detenidamente, su uso es más común de lo que se piensa. Considera cuántas veces en la vida diaria y en qué momento utilizas la distribución binomial; verás que son muchas más de las que te habías dado cuenta.
La distribución binomial se relaciona con un experimento aleatorio conocido como experimento de Bernoulli, el cual tiene las siguientes características:
Puesto que sólo hay dos resultados posibles, la probabilidad de fracaso, a la que podemos denominar q, está dada por la diferencia 1 – p, esto es, corresponde al complemento de la probabilidad de éxito, y como ésta última es constante, entonces también lo es la probabilidad de fracaso.
La probabilidad de x éxitos en n intentos está dada por la siguiente expresión:
Esta fórmula nos dice que la probabilidad de obtener x número de éxitos en n pruebas, está dada por la multiplicación de n combinaciones en grupos de x por la probabilidad de éxito elevada al número de éxitos deseado, y por la probabilidad de fracaso elevada al número de fracasos deseados.
A continuación, se presentan varios ejemplos que nos ayudarán a comprender el uso de esta distribución.
Un embarque de veinte televisores incluye tres unidades defectuosas. Si se inspeccionan tres televisores al azar, indique usted cuál es la probabilidad de que se encuentren dos defectuosos.
Podemos verificar si se trata de una distribución binomial mediante una lista de chequeo de cada uno de los puntos que caracterizan a esta distribución.
Característica | Estatus | Observación |
Hay un número finito de ensayos. | Sí | Cada televisor es un ensayo y hay tres de ellos. |
Cada ensayo tiene sólo dos resultados. | Sí | Cada televisor puede estar defectuoso o no. |
La probabilidad de éxito es constante. | Sí | La probabilidad de que la unidad esté defectuosa es 3/20. |
Se desea saber la probabilidad de un cierto número de éxitos. | Sí | Se desea saber la probabilidad de que X = 2 |
Una vez que hemos confirmado que se trata de una distribución binomial, aplicamos la expresión P(x) = nCx pxq(n-x), de modo que…
P(2) = 3C2 (3/20)2(17/20)1 = 3 (0.0225)(0.85) = 0.057375
El resultado obtenido es la probabilidad de que aparezcan dos aparatos de televisión defectuosos. Si queremos pasarlo a porcentaje, el valor se debe multiplicar por 100 %.
Una pareja de recién casados planea tener tres hijos. Indica cuál es la probabilidad de que los tres hijos sean varones si consideramos que la probabilidad de que el descendiente sea hombre o mujer es igual.
Verificamos primero si se cumplen los puntos que caracterizan la distribución binomial.
Claramente es un experimento aleatorio con tres ensayos y en todos ellos sólo hay dos resultados posibles, cada uno con probabilidad de 0.5 en cada ensayo. Si se define como éxito que el sexo sea masculino, entonces podemos decir que se desea saber la probabilidad de que haya tres éxitos.
Entonces, el experimento lleva a una distribución binomial y…
P(3) = 3C3 (1/2)3(1/2)0 = (1/2)3 = 0.0125
El resultado obtenido es la probabilidad de que los tres hijos de la pareja sean varones. Si queremos pasarlo a porcentaje, el valor se debe multiplicar por 100 %.
Se sabe que el 30 % de los estudiantes de secundaria en México es incapaz de localizar en un mapa el lugar donde se encuentra Afganistán. Si se entrevista a seis estudiantes de este nivel elegidos al azar:
a) ¿Cuál será la probabilidad de que exactamente dos puedan localizar este país?
b) ¿Cuál será la probabilidad de que un máximo de dos puedan localizar este país?
Al igual que en los casos anteriores, verificamos si se cumple o no que el experimento lleve a una distribución binomial.
Se trata de un experimento con seis ensayos, en cada uno de los cuales puede ocurrir que el estudiante sepa o no sepa localizar Afganistán en el mapa. Si se define como éxito que sí sepa la localización, podemos decir que la probabilidad de éxito es de 0.70. Además, las probabilidades que se desean calcular se refieren al número de éxitos. Concluimos que el experimento es Bernoulli y, por lo tanto…
P(2) = 6C2 (0.70)2(0.30)4 = 15 (0.49)(0.0081) = 0.059535
El resultado obtenido es la probabilidad exacta de que dos estudiantes de secundaria localicen en el mapa Afganistán. Si queremos pasarlo a porcentaje, el valor se debe multiplicar por 100 %.
Por cuanto hace al inciso (b), la frase “un máximo de dos” significa que X toma los valores cero, uno o dos. Entonces…
P(X ≤ 2) = P(2) + P(1) + P(0) =
= 6C2 0.70)2(0.30)4 + 6C1 (0.70)1(0.30)5 + 6C0 (0.70)0(0.30)6 =
= 15(0.49)(0.0081) + 6(0.7)(0.00243) + 0.1 + 0.000729
= 0.05953
El resultado obtenido es la probabilidad máxima de que dos estudiantes de secundaria localicen en el mapa Afganistán. Si queremos pasarlo a porcentaje, el valor se debe multiplicar por 100 %.
Consideremos de nueva cuenta el ejemplo Televisores. ¿Qué pasa con las probabilidades de los otros valores posibles para la variable aleatoria? Si hacemos los cálculos respectivos tendríamos…
P(0) = 3C0 (3/20)0(17/20)3 = 0.614125 P(1) = 3C1 (3/20)1(17/20)2 = 3(0.15)(0.7225) = 0.325125 P(3) = 3C3 (3/20)3(17/20)0 = (0.003375) = 0.003375 |
Si recordamos que P(2) = 0.057375, entonces podemos confirmar que…
P(0) + P(1) + P(2) + P(3) = 1.00 |
Lo que era de esperarse, puesto que los valores 0, 1, 2 y 3 constituyen el universo en el experimento en cuestión.
Con estos valores podemos determinar la esperanza y varianza de la variable aleatoria considerada. Para ello, nos es útil acomodar los datos en una tabla recordando que…
μ = Σ x [P(X=x)], y que, σ2 = Σ (x – μ)2 [P(X=x)] |
x | Función de probabilidad | x P(X = x) | (x - 0.45)2 | (x - 0.45)2 P(X = x) |
P( X = x) | ||||
0 | 0.614125 | 0.000000 | 0.2025 | 0.124360 |
1 | 0.325125 | 0.325125 | 0.3025 | 0.098350 |
2 | 0.057375 | 0.114750 | 2.4025 | 0.137843 |
3 | 0.003375 | 0.010125 | 6.5025 | 0.021946 |
Suma | 0.450000 | 0.382500 |
Entonces, la esperanza es 0.45 y la varianza 0.3825.
Si interpretamos las probabilidades anteriores en un sentido frecuentista, diríamos que si consideramos un número grande de realizaciones del experimento, por ejemplo, un millón de veces, en aproximadamente 614 125 realizaciones tendremos televisores sin defecto; en 325 125 veces encontraremos un televisor con defecto; en otras 57 375 ocasiones encontraremos dos televisores con defecto; y en 33 751 veces los tres televisores estarían defectuosos.
Con los datos anteriores podemos elaborar una tabla de distribución de frecuencias y calcular el promedio de televisores defectuosos.
Número de televisores defectuosos (x) | Frecuencia (f) | fm |
0 | 614125 | 0 |
1 | 325125 | 325125 |
2 | 57375 | 114750 |
3 | 3375 | 10125 |
Total | 1000000 | 450000 |
Luego…
μ = 450 000/1 000 000 = 0.45
Asimismo, podemos calcular la varianza
σ2 = [614125(0-0.45)2 + 325125(1-0.45)2 + 57375(2-0.45)2 + 3375(3-0.45)2]/100
= (124360.313 + 98350.3125 + 137843.438 + 29945.9375)/100
= 0.3825
Observa que hemos seguido fielmente las lecciones de estadística descriptiva en el cálculo de μ y σ, y que hemos llegado a los mismos valores que ya habíamos obtenido. Esto nos proporciona por lo menos un esquema con el cual podemos interpretar la esperanza y varianza, haciendo uso del concepto de frecuencias.
Es importante
Darse cuenta que podemos llegar a estos mismos valores de un modo más sencillo si nos percatamos que…
En otras palabras…
Media y varianza de una variable aleatoria binomial μ = npσ2 = npq |
Puede ocurrir, como en el caso del ejemplo anterior, que la esperanza dé un valor que no coincide con los valores posibles de la variable aleatoria. Por eso, se dice que la esperanza es un valor ideal.
Por otra parte, si desglosamos cada uno de los elementos que integran la expresión del cálculo de probabilidades de la distribución binomial y consideramos las expresiones para el cálculo de la media y la varianza, tendremos que…
Expresiones para el cálculo de la media y varianza en una distribución binomial nCx = n!/[x!(n - x)!] px = px qn-x = (1 - p)n-x Media = np Varianza = n p (1 - p) |
Lo que nos revela que para poder calcular cualquier probabilidad con el modelo binomial, o su esperanza o varianza, debemos conocer los valores de n, el número total de ensayos; y de p, la probabilidad de éxito. El valor de x, el número de éxitos, se establece de acuerdo con las necesidades del problema.
Lo anterior nos permite concluir que la distribución binomial queda completamente caracterizada cuando conocemos los valores de n y p. Por esta razón, a estos valores se les conoce como los parámetros de la distribución.
Un error que suele cometerse a propósito de la distribución binomial, es considerar que sus parámetros son la esperanza y varianza de la variable aleatoria respectiva. En realidad, estos dos valores se expresan en función de los parámetros. El siguiente ejemplo nos ayudará a entender este concepto.
De acuerdo con estudios realizados en un pequeño poblado, el 20 % de la población tiene parásitos intestinales. Si se toma una muestra de 1400 personas, ¿cuántos esperamos que tengan parásitos intestinales?
Media = np = 1400(0.20)= 280
Para poder resolver la pregunta utilizaremos el teorema de Chebyshev: “La probabilidad de que una variable aleatoria tome un valor contenido en k desviaciones estándar de la media es cuando menos 1 – 1/k2”.
Utilizando el teorema de Chebyshev, podríamos considerar que el valor real estaría a dos desviaciones estándar con un 75 % de probabilidades y a tres con un 89 %. De acuerdo con esto, obtenemos la desviación estándar y posteriormente determinamos los intervalos.
La media, más menos dos desviaciones estándar, nos daría un intervalo de 250 a 310 personas que tienen problemas. Recuerda que las desviaciones estándar se calculan con los valores obtenidos por la media y las diferencias entre cada uno de los valores elevadas al cuadrado, y a ese valor sacando la raíz cuadrada, pero en este caso se obtienen por medio de tablas ya elaboradas.
La media, más menos tres desviaciones estándar, nos daría un intervalo de 235 a 325 personas que podrían tener problemas.
Con el cálculo anterior queda demostrado el Teorema de Chebyshev, en el que para este ejemplo en particular, el uso de dos o tres desviaciones estándar representan a la población que puede tener parásitos intestinales.
Actividad. De Museos y seguros
Ahora que has revisado un poco más sobre la distribución binomial y su aplicación a la vida diaria a través de ejemplos como lanzar una moneda, en el cual se tienen sólo dos posibles resultados, es indispensable que logres identificar los parámetros para determinar tal distribución (éstos son dados por el promedio y la varianza). La obtención de una correcta distribución binomial puede ser la clave para la toma de decisiones en entornos públicos y privados.
Recuerda que siempre puedes regresar a ver los ejemplos, así como las fórmulas empleadas durante el desarrollo del tema.
Lee con atención, identifica los datos del problema planteado y calcula la probabilidad que se solicita, una vez la tengas vinculada con el problema que corresponda.
Autoevaluación. El último reto
Ahora que revisaste de forma detenida las condiciones para aplicar la distribución binomial; que has visto las condiciones que se deben cumplir; y has hecho los ejercicios y actividades, te invito a que realices un último reto que pondrá a prueba lo aprendido.
Recuerda que si tienes duda, puedes consultar en cualquier momento las fórmulas y los ejemplos del tema.
Lee con atención el problema, realiza el cálculo que se te solicita en cada uno y selecciona el valor correcto.