+7(499)-938-42-58 Москва
+7(800)-333-37-98 Горячая линия

Биномиальный закон распределения

Биномиальное распределение дискретной случайной величины

Биномиальный закон распределения

Биномиальное распределение – одно из важнейших распределений вероятностей дискретно изменяющейся случайной величины.

Биномиальным распределением называется распределение вероятностей числа m наступления события А в n взаимно независимых наблюдениях.

Часто событие А называют “успехом” наблюдения, а противоположное ему событие – “неуспехом”, но это обозначение весьма условное.

Условия биномиального распределения:

  • в общей сложности проведено n испытаний, в которых событие А может наступить или не наступить;
  • событие А в каждом из испытаний может наступить с одной и той же вероятностью p;
  • испытания являются взаимно независимыми.

Вероятность того, что в n испытаниях событие А наступит именно m раз, можно вычислить по формуле Бернулли:

или

,

где p – вероятность наступления события А;

q = 1 – p – вероятность наступления противоположного события .

Разберёмся, почему биномиальное распределение описанным выше образом связано с формулой Бернулли. Событие – число успехов при n испытаниях распадается на ряд вариантов, в каждом из которых успех достигается в m испытаниях, а неуспех – в n – m испытаниях. Рассмотрим один из таких вариантов – B1. По правилу сложения вероятностей умножаем вероятности противоположных событий:

,

а если обозначим q = 1 – p, то

.

Такую же вероятность будет иметь любой другой вариант, в котором m успехов и n – m неуспехов. Число таких вариантов равно – числу способов, которыми можно из n испытаний получить m успехов.

Сумма вероятностей всех m чисел наступления события А (чисел от 0 до n) равна единице:

где каждое слагаемое представляет собой слагаемое бинома Ньютона. Поэтому рассматриваемое распределение и называется биномиальным распределением.

На практике часто необходимо вычислять вероятности “не более m успехов в n испытаниях” или “не менее m успехов в n испытаниях”. Для этого используются следующие формулы.

Интегральную функцию, то есть вероятность F(m) того, что в n наблюдениях событие А наступит не более m раз, можно вычислить по формуле:

.

В свою очередь вероятность F(≥m) того, что в n наблюдениях событие А наступит не менее m раз, вычисляется по формуле:

Иногда бывает удобнее вычислять вероятность того, что в n наблюдениях событие А наступит не более m раз, через вероятность противоположного события:

.

Какой из формул пользоваться, зависит от того, в какой из них сумма содержит меньше слагаемых.

Характеристики биномиального распределения вычисляются по следующим формулам.

Математическое ожидание: .

Дисперсия: .

Среднеквадратичное отклонение: .

Биномиальное распределение и расчёты в MS Excel

Вероятность биномиального распределения Pn(m) и значения интегральной функции F(m) можно вычислить при помощи функции MS Excel БИНОМ.РАСП. Окно для соответствующего расчёта показано ниже (для увеличения нажать левой кнопкой мыши).

MS Excel требует ввести следующие данные:

  • число успехов;
  • число испытаний;
  • вероятность успеха;
  • интегральная – логическое значение: 0 – если нужно вычислить вероятность Pn(m) и 1 – если вероятность F(m).

Пример 1. Менеджер фирмы обобщил информацию о числе проданных в течение последних 100 дней фотокамер. В таблице обобщена информация и рассчитаны вероятности того, что в день будет продано определённое число фотокамер.

Продано в деньЧисло днейВероятность
1080,08
11120,12
12190,19
13230,23
14180,18
15200,20
Всего1001,00

День завершён с прибылью, если продано 13 или более фотокамер. Вероятность, что день будет отработан с прибылью:

Вероятность того, что день будет отработан без прибыли:

Пусть вероятность того, что день отработан с прибылью, является постоянной и равна 0,61, и число проданных в день фотокамер не зависит от дня. Тогда можно использовать биномиальное распределение, где событие А – день будет отработан с прибылью, – без прибыли.

Вероятность того, что из 6 дней все будут отработаны с прибылью:

.

Тот же результат получим, используя функцию MS Excel БИНОМ.РАСП (значение интегральной величины – 0):

P6(6) = БИНОМ.РАСП(6; 6; 0,61; 0) = 0,052.

Вероятность того, что из 6 дней 4 и больше дней будут отработаны с прибылью:

,

где ,

,

,

.

Используя функцию MS Excel БИНОМ.РАСП, вычислим вероятность того, что из 6 дней не более 3 дней будут завершены с прибылью (значение интегральной величины – 1):

P6(≤3) = БИНОМ.РАСП(3; 6; 0,61; 1) = 0,435.

Вероятность того, что из 6 дней все будут отработаны с убытками:

,

Тот же показатель вычислим, используя функцию MS Excel БИНОМ.РАСП:

P6(0) = БИНОМ.РАСП(0; 6; 0,61; 0) = 0,0035.

Решить задачу самостоятельно, а затем посмотреть решение

Пример 2. В урне 2 белых шара и 3 чёрных. Из урны вынимают шар, устанавливают цвет и кладут обратно. Попытку повторяют 5 раз. Число появления белых шаров – дискретная случайная величина X, распределённая по биномиальному закону. Составить закон распределения случайной величины. Определить моду, математическое ожидание и дисперсию.

Правильное решение и ответ.

Нет времени вникать в решение? Можно заказать работу!

Продолжаем решать задачи вместе

Пример 3. Из курьерской службы отправились на объекты n = 5 курьеров. Каждый курьер с вероятностью p = 0,3 независимо от других опаздывает на объект.

Дискретная случайная величина X – число опоздавших курьеров. Построить ряд распределения это случайной величины. Найти её математическое ожидание, дисперсию, среднее квадратическое отклонение.

Найти вероятность того, что на объекты опоздают не менее двух курьеров.

Решение. Случайная величина X – число опоздавших курьеров – распределена по биномиальному закону. Под наблюдением понимается отправка курьера на объект, а под “успехом” удобнее понимать его опоздание. Найдём вероятности возможных значений случайной величины и округлим их до трёх знаков после запятой:

Ряд распределения будет иметь вид:

012345
0,1680,3600,3090,1330,0280,002

Математическое ожидание случайной величины: .

Дисперсия случайной величины: .

Среднеквадратичное отклонение: .

Найдём вероятность того, что на объекты опоздают не менее двух курьеров:

Пример 4. Игральная кость бросается четыре раза. Найти вероятность того, что шестёрка появится а) ровно один раз; б) хотя бы один раз.

Решение. Случайная величина X – число появлений шестёрки – имеет биномиальное распределение с параметрами n = 4; p = 1/6.

а) .

б)

Пройти тест по теме Теория вероятностей и математическая статистика

Начало темы “Теория вероятностей”

Действия над вероятностями Различные задачи на сложение и умножение вероятностей Формула полной вероятности Независимые испытания и формула Бернулли Распределение вероятностей дискретной случайной величины Распределение вероятностей непрерывной случайной величины Математическое ожидание и дисперсия случайной величины Распределение Пуассона дискретной случайной величины Равномерное распределение непрерывной случайной величины Нормальное распределение непрерывной случайной величины

Источник: https://function-x.ru/probabilities_distribution_binomial.html

Биномиальное распределение – NOP::Nuances of programming

Биномиальный закон распределения

Все знают и любят нормальное распределение. Оно используется в инвестиционном моделировании, A/B-тестах и улучшении производственных процессов (шесть сигм). Но мало кто хорошо знаком с биномиальным распределением. Между тем, результаты бросков монеты следуют биномиальному распределению.

Важно, что здесь работает закон больших чисел. Я также должен сказать, что если мы многократно выполняем один и тот же набор экспериментов (подбрасывая монетку 10 раз) снова и снова, то число решек, наблюдаемых во всех экспериментах, следует биномиальному распределению.

Симуляция на Python

Генерируем случайное число n раз и записываем результаты в списки. Если число равно 0,5 или больше, то считать его решкой, если нет — орлом. И повторим это много раз, в нашем примере 1000.

# Import librariesimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns# Входные данные# Число повторовtrials = 1000# Бросков в каждом повтореn = 10# Вероятность успехаp = 0.5# Основная функция# heads – это список удачных исходовdef run_binom(trials, n, p): heads = [] for i in range(trials): tosses = [np.random.random() for i in range(n)] heads.append(len([i for i in tosses if i>=0.50])) return heads # Выполняем функцию.heads = run_binom(trials, n, p)# Plot the results as a histogramfig, ax = plt.subplots(figsize=(14,7))ax = sns.distplot(heads, bins=11, label='simulation results')ax.set_xlabel(“Number of Heads”,fontsize=16)

ax.set_ylabel(“Frequency”,fontsize=16)

Результат выполнения кода на гистограмме:

Изменим график так, чтобы он отображал распределение. Используем stats.binom из scipy:

# Plot the actual binomial distribution as a sanity checkfrom scipy.stats import binomx = range(0,11)ax.plot(x, binom.pmf(x, n, p), 'ro', label='actual binomial distribution')ax.vlines(x, 0, binom.pmf(x, n, p), colors='r', lw=5, alpha=0.5)plt.legend()

plt.show()

На графике ниже показано моделируемое распределение синим цветом и фактическое — красным. Вывод: биномиальное распределение — достаточно хорошее приближение к реальности. Поэтому вместо того, чтобы тратить время на подбрасывание и записывать результаты, мы можем просто использовать биномиальное распределение!

Если мы хотим смоделировать результат последовательности из n экспериментов, то могли бы сделать это, используя биномиально распределенную случайную переменную, например:
np.random.binomial(n, p)

Наконец, ответим на наш вопрос о монетках:

# Вероятность шести решек.prob_6 = sum([1 for i in np.random.binomial(n, p, size=runs) if i==6])/runs

print('The probability of 6 heads is: ' + str(prob_6))

Это также соответствует первой гистограмме.

“,”author”:”Novikov Ivan”,”date_published”:”2019-09-09T17:01:01.605Z”,”lead_image_url”:”https://miro.medium.com/max/700/0*Lt0PL3VvRLosvZ19.jpeg”,”dek”:null,”next_page_url”:null,”url”:”https://medium.com/nuances-of-programming/%D0%B1%D0%B8%D0%BD%D0%BE%D0%BC%D0%B8%D0%B0%D0%BB%D1%8C%D0%BD%D0%BE%D0%B5-%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5-5171e049504e”,”domain”:”medium.com”,”excerpt”:”Если десять раз подбросить монетку, какова вероятность шести решек? Отвечаем на вопрос: разбираемся с биномиальным распределением. Jupyter…”,”word_count”:482,”direction”:”ltr”,”total_pages”:1,”rendered_pages”:1}

Источник: https://medium.com/nuances-of-programming/%D0%B1%D0%B8%D0%BD%D0%BE%D0%BC%D0%B8%D0%B0%D0%BB%D1%8C%D0%BD%D0%BE%D0%B5-%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5-5171e049504e

Биномиальное распределение. Дискретные распределения в MS EXCEL

Биномиальный закон распределения

Рассмотрим Биномиальное распределение, вычислим его математическое ожидание, дисперсию, моду. С помощью функции MS EXCEL БИНОМ.РАСП() построим графики функции распределения и плотности вероятности. Произведем оценку параметра распределения p, математического ожидания распределения и стандартного отклонения. Также рассмотрим распределение Бернулли.

Определение. Пусть проводятся n испытаний, в каждом из которых может произойти только 2 события: событие «успех» с вероятностью p или событие «неудача» с вероятностью q=1-p (так называемая Схема Бернулли, Bernoulli trials).

Вероятность получения ровно x успехов в этих n испытаниях равна:

Примечание: Порядок получения успехов значения не имеет. Если важен порядок, то см. статью Отрицательное Биномиальное распределение.

Количество успехов в выборке x является случайной величиной, которая имеет Биномиальное распределение (англ. Binomial distribution) p и n– являются параметрами этого распределения.

Примечание: Запись  означает количество сочетаний из n элементов по x. Для сочетаний также используется запись . Подробнее о сочетаниях см. статью Сочетания без повторений: Комбинаторика в MS EXCEL.

Напомним, что для применения схемы Бернулли и соответственно Биномиального распределения, должны быть выполнены следующие условия:

  • каждое испытание должно иметь ровно два исхода, условно называемых «успехом» и «неудачей».
  • результат каждого испытания не должен зависеть от результатов предыдущих испытаний (независимость испытаний).
  • вероятность успеха p должна быть постоянной для всех испытаний.

Биномиальное распределение в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Биномиального распределения имеется функция БИНОМ.РАСП(), английское название – BINOM.

DIST(), которая позволяет вычислить вероятность того, что в выборке будет ровно х «успехов» (т.е. функцию плотности вероятности p(x), см.

формулу выше), и интегральную функцию распределения (вероятность того, что в выборке будет x или меньше «успехов», включая 0).

СОВЕТ: Подробнее о Функции распределения и Плотности вероятности см. статью Функция распределения и плотность вероятности в MS EXCEL.

До MS EXCEL 2010 в EXCEL была функция БИНОМРАСП(), которая также позволяет вычислить функцию распределения и плотность вероятности p(x). БИНОМРАСП() оставлена в MS EXCEL 2010 для совместимости.

В файле примера приведены графики плотности распределения вероятности и интегральной функции распределения.

Биномиальное распределения имеет обозначение B(n; p).

Примечание: Для построения интегральной функции распределения идеально подходит диаграмма типа График, для плотности распределения – Гистограмма с группировкой. Подробнее о построении диаграмм читайте статью Основные типы диаграмм.

Примечание: Для удобства написания формул в файле примера созданы Имена для параметров Биномиального распределения: n и p.

В файле примера приведены различные расчеты вероятности с помощью функций MS EXCEL:

Как видно на картинке выше, предполагается, что:

  • В бесконечной совокупности, из которой делается выборка, содержится 10% (или 0,1) годных элементов (параметр p, третий аргумент функции =БИНОМ.РАСП())
  • Чтобы вычислить вероятность, того что в выборке из 10 элементов (параметр n, второй аргумент функции) будет ровно 5 годных элементов (первый аргумент), нужно записать формулу: =БИНОМ.РАСП(5; 10; 0,1; ЛОЖЬ)
  • Последний, четвертый элемент, установлен =ЛОЖЬ, т.е. возвращается значение функции плотности распределения.

Если значение четвертого аргумента =ИСТИНА, то функция БИНОМ.РАСП() возвращает значение интегральной функции распределения или просто Функцию распределения. В этом случае можно рассчитать вероятность того, что в выборке количество годных элементов будет из определенного диапазона, например, 2 или меньше (включая 0).

Для этого нужно записать формулу:
= БИНОМ.РАСП(2; 10; 0,1; ИСТИНА)

Примечание: При нецелом значении х, дробная часть отбрасывается. Например, следующие формулы вернут одно и тоже значение:
=БИНОМ.РАСП(2; 10; 0,1; ИСТИНА)
=БИНОМ.РАСП(2,9; 10; 0,1; ИСТИНА)

Примечание: В файле примера плотность вероятности и функция распределения также вычислены с использованием определения и функции ЧИСЛКОМБ().

Показатели распределения

В файле примера на листе Пример имеются формулы для расчета некоторых показателей распределения:

Выведем формулу математического ожидания Биномиального распределения, используя Схему Бернулли.

По определению случайная величина Х в схеме Бернулли (Bernoulli random variable) имеет функцию распределения:

Это распределение называется распределение Бернулли.

Примечание: распределение Бернулли – частный случай Биномиального распределения с параметром n=1.

Найдем математическое ожидание (среднее, mean) распределения Бернулли (x принимает только 2 значения).

Предположим, что мы провели n последовательных испытаний Бернулли и у нас сформировалась выборка, состоящая из n элементов: x1, x2, …, xn (каждое из которых равно 0 или 1). Сумма этих случайных величин Y=X1+X2+…+Xn, в свою очередь, также является случайной величиной и, как мы помним, будет иметь Биномиальное распределение с параметрами n и p.

Учитывая, что математическое ожидание для каждого xi равно p, то для соответствующего Биномиального распределения μ=p*n.

Аналогичным образом, можно вычислить дисперсию Биномиального распределения.

Для этого сначала найдем дисперсию (второй момент, variance) распределения Бернулли:

Соответственно, дисперсия для Биномиального распределения равна σ2=n*p*(1-p)= n*p*q.

Генерация случайных чисел. Распределение Бернулли

С помощью надстройки Пакет анализа можно сгенерировать случайные числа, извлеченные из распределения Бернулли.

СОВЕТ: О надстройке Пакет анализа можно прочитать в статье Надстройка Пакет анализа MS EXCEL.

Сгенерируем 3 массива по 100 чисел с различными вероятностями успеха: 0,1; 0,5 и 0,9. Для этого в окне Генерация случайных чисел установим следующие параметры для каждой вероятности p:

Примечание: Если установить опцию Случайное рассеивание (Random Seed), то можно выбрать определенный случайный набор сгенерированных чисел.

Например, установив эту опцию =25 можно сгенерировать на разных компьютерах одни и те же наборы случайных чисел (если, конечно, другие параметры распределения совпадают). Значение опции может принимать целые значения от 1 до 32 767.

Название опции Случайное рассеивание может запутать. Лучше было бы ее перевести как Номер набора со случайными числами.

В итоге будем иметь 3 столбца по 100 чисел, на основании которых можно, например, оценить вероятность успеха p по формуле: Число успехов/100 (см. файл примера лист ГенерацияБернулли).

Примечание: Для распределения Бернулли с p=0,5 можно использовать формулу =СЛУЧМЕЖДУ(0;1), которая соответствует дискретному равномерному распределению. 

Генерация случайных чисел. Биномиальное распределение

С помощью надстройки Пакет анализа можно сгенерировать случайные числа, извлеченные из Биномиального распределения.

Сгенерируем 3 массива по 100 чисел с различными вероятностями успеха: 0,1; 0,5; 0,9. Количество испытаний n установим 20. Для этого в окне Генерация случайных чисел установим следующие параметры для каждой вероятности p:

В итоге будем иметь 3 столбца чисел, на основании которых можно, например, оценить вероятность успеха p по формуле: Среднее значение успехов/n (см. файл примера лист ГенерацияБином).

Примечание: Для генерирования массива чисел, распределенных по Биномиальному закону, можно использовать формулу =БИНОМ.ОБР(20; p; СЛЧИС()), где p – вероятность успеха. Функция СЛЧИС() генерирует непрерывное равномерное распределение от 0 до 1, что как раз соответствует диапазону изменения вероятности (см. файл примера лист ГенерацияБином).

Оценка параметра p

В схеме Бернулли оценить параметр распределения p можно по формуле =СУММ(B14:B113)/СЧЁТ(B14:B113). В формуле предполагается, что массив случайных чисел находится в диапазоне B14:B113.

Оценить параметр Биномиального распределения p можно по формуле = СРЗНАЧ(B13:B112)/n (предполагается, что случайные числа сгенерированы формулой =БИНОМ.ОБР(n; p; СЛЧИС()). Также в формуле предполагается, что массив случайных чисел находится в диапазоне B13:B112.

Обратная функция БИНОМ.ОБР()

Вспомним график функции Биномиального распределения:

Решим задачу. Предположим, что для целей контроля качества нам требуется определить наибольшее допустимое количество дефектных изделий, которое еще позволяет обойтись без отбраковки всей партии.

Задана величина выборки из партии (n=20) и р=0,2 – доля дефектных изделий, которая обычно наблюдается в данном производственном процессе. Также пусть задана вероятность допустить ошибку 1-го рода (см.

статью про уровень доверия) равная 90%. Пороговый приемочный критерий можно вычислить по формуле =БИНОМ.ОБР(20; 0,2; 90%).

Формула вернет значение 6 – наибольшее количество дефектных изделий, допустимое в выборке.

Примечание: Третий аргумент функции БИНОМ.ОБР() называется Альфа (α error, type I error, риск производителя, альфа-риск) и представляет собой вероятность допустить ошибку 1-го рода при проверке статистической гипотезы (см. статью Проверка статистических гипотез в MS EXCEL о равенстве среднего значения распределения (дисперсия известна)).

Предположим, что в выборке обнаружилось 7 дефектных изделий. Это означает, что «очень вероятна» ситуация, что изменилась доля дефектных изделий p, которая является характеристикой нашего производственного процесса.

Хотя такая ситуация «очень вероятна», но существует вероятность (альфа-риск, ошибка 1-го рода, «ложная тревога»), что все же p осталась без изменений, а увеличенное количество дефектных изделий обусловлено случайностью выборки.

Как видно на рисунке ниже, 7 – количество дефектных изделий, которое допустимо для процесса с p=0,21 при том же значении Альфа.

Это служит иллюстрацией, что при превышении порогового значения дефектных изделий в выборке, p «скорее всего» увеличилось.

Фраза «скорее всего» означает, что существует всего лишь 10% вероятность (100%-90%) того, что отклонение доли дефектных изделий выше порогового вызвано только сучайными причинами.

Таким образом, превышение порогового количества дефектных изделий в выборке, может служить сигналом, что процесс расстроился и стал выпускать больший процент бракованных изделий.

Примечание: До MS EXCEL 2010 в EXCEL была функция КРИТБИНОМ(), которая эквивалентна БИНОМ.ОБР(). КРИТБИНОМ() оставлена в MS EXCEL 2010 и выше для совместимости.

Связь Биномиального распределения с другими распределениями

Если параметр n Биномиального распределения стремится к бесконечности, а p стремится к 0, то в этом случае Биномиальное распределение может быть аппроксимировано Распределением Пуассона.
Можно сформулировать условия, когда приближение распределением Пуассона работает хорошо:

  • p0,9 (учитывая, что q=1-p, вычисления в этом случае необходимо производить через q (а х нужно заменить на n-x). Следовательно, чем меньше q и больше n, тем приближение точнее).

При 0,1>n или n/N

Источник: https://excel2.ru/articles/binomialnoe-raspredelenie-diskretnye-raspredeleniya-v-ms-excel

Биномиальное распределение случайной величины

Биномиальный закон распределения

Не все явления измеряются в количественной шкале типа 1, 2, 3 … 100500 … Не всегда явление может принимать бесконечное или большое количество различных состояний. Например, пол у человека может быть либо М, либо Ж. Стрелок либо попадает в цель, либо не попадает.

Голосовать можно либо «За», либо «Против» и т.д. и т.п. Другими словами, такие данные отражают состояние альтернативного признака – либо «да» (событие наступило), либо «нет» (событие не наступило). Наступившее событие (положительный исход) еще называют «успехом».

 

Эксперименты с такими данными называются схемой Бернулли, в честь известного швейцарского математика, который установил, что при большом количестве испытаний соотношение положительных исходов и общего количества испытаний стремится к вероятности наступления этого события.

Переменная альтернативного признака

Для того, чтобы в анализе задействовать математический аппарат, результаты подобных наблюдений следует записать в числовом виде. Для этого положительному исходу присваивают число 1, отрицательному – 0. Другими словами, мы имеем дело с переменной, которая может принимать только два значения: 0 или 1.

Какую пользу отсюда можно извлечь? Вообще-то не меньшую, чем от обычных данных. Так, легко подсчитать количество положительных исходов – достаточно просуммировать все значения, т.е. все 1 (успехи). Можно пойти далее, но для этого потребуется ввести парочку обозначений.

Первым делом нужно отметить, что положительные исходы (которые равны 1) имеют некоторую вероятность появления. Например, выпадение орла при подбрасывании монеты равно ½ или 0,5.

Такая вероятность традиционно обозначается латинской буквой p. Следовательно, вероятность наступления альтернативного события равна 1 — p, которую еще обозначают через q, то есть q = 1 – p.

Указанные обозначения можно наглядно систематизировать в виде таблички распределения переменной X.

Мы получили перечень возможных значений и их вероятности. Можно рассчитать математическое ожидание и дисперсию. Матожидание – это сумма произведений всех возможных значений на соответствующие им вероятности:

Вычислим матожидание, используя обозначения в таблицы выше.

Получается, что математическое ожидание альтернативного признака равно вероятности этого события – p.

Теперь определим, что такое дисперсия альтернативного признака. Дисперсия – есть средний квадрат отклонений от математического ожидания. Общая формула (для дискретных данных) имеет вид:

Отсюда дисперсия альтернативного признака:

Нетрудно заметить, что эта дисперсия имеет максимум 0,25 (при p=0,5).

Стандартное отклонение – корень из дисперсии:

Максимальное значение не превышает 0,5.

Как видно, и математическое ожидание, и дисперсия альтернативного признака имеют очень компактный вид.

Рассмотрим ситуацию под другим углом. Действительно, кому интересно, что среднее выпадение орлов при одном бросании равно 0,5? Это даже невозможно представить. Интересней поставить вопрос о числе выпадения орлов при заданном количестве бросков.

Другими словами, исследователя часто интересует вероятность наступления некоторого числа успешных событий. Это может быть количество бракованных изделий в проверяемой партии (1- бракованная, 0 — годная) или количество выздоровлений (1 – здоров, 0 – больной) и т.д. Количество таких «успехов» будет равно сумме всех значений переменной X, т.е. количеству единичных исходов.

Случайная величина B называется биномиальной и принимает значения от 0 до n (при B = 0 – все детали годные, при B = n – все детали бракованные). Предполагается, что все значения x независимы между собой. Рассмотрим основные характеристики биномиальной переменной, то есть установим ее математическое ожидание, дисперсию и распределение.

Матожидание биномиальной переменной получить очень легко. Математическое ожидание суммы величин есть сумма математических ожиданий каждой складываемой величины, а оно у всех одинаковое, поэтому:

Например, математическое ожидание количества выпавших орлов при 100 подбрасываниях равно 100 × 0,5 = 50.

Теперь выведем формулу дисперсии биномиальной переменной. Дисперсия суммы независимых случайных величин есть сумма дисперсий. Отсюда

Стандартное отклонение, соответственно

Для 100 подбрасываний монеты стандартное отклонение количества орлов равно

И, наконец, рассмотрим распределение биномиальной величины, т.е. вероятности того, что случайная величина B будет принимать различные значения k, где 0≤ k ≤n. Для монеты эта задача может звучать так: какова вероятность выпадения 40 орлов при 100 бросках?

Чтобы понять метод расчета, представим, что монета подбрасывается всего 4 раза. Каждый раз может выпасть любая из сторон. Мы задаемся вопросом: какова вероятность выпадения 2 орлов из 4 бросков. Каждый бросок независим друг от друга.

Значит, вероятность выпадения какой-либо комбинации будет равна произведению вероятностей заданного исхода для каждого отдельного броска. Пусть О – это орел, Р – решка.

Тогда, к примеру, одна из устраивающих нас комбинаций может выглядеть как ООРР, то есть:

Вероятность такой комбинации равняется произведению двух вероятностей выпадения орла и еще двух вероятностей не выпадения орла (обратное событие, рассчитываемое как 1 — p), т.е. 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. Такова вероятность одной из устраивающих нас комбинации. Но вопрос ведь стоял об общем количестве орлов, а не о каком-то определенном порядке.

Тогда нужно сложить вероятности всех комбинаций, в которых присутствует ровно 2 орла. Ясно, все они одинаковы (от перемены мест множителей произведение не меняется). Поэтому нужно вычислить их количество, а затем умножить на вероятность любой такой комбинации. Подсчитаем все варианты сочетаний из 4 бросков по 2 орла: РРОО, РОРО, РООР, ОРРО, ОРОР, ООРР.

Всего 6 вариантов.

Следовательно, искомая вероятность выпадения 2 орлов после 4 бросков равна 6×0,0625=0,375.

Однако подсчет подобным образом утомителен. Уже для 10 монет методом перебора получить общее количество вариантов будет очень трудно.

Поэтому умные люди давно изобрели формулу, с помощью которой рассчитывают количество различных сочетаний из n элементов по k, где n – общее количество элементов, k – количество элементов, варианты расположения которых и подсчитываются. Формула сочетания из n элементов по k такова:

Подобные вещи проходят в разделе комбинаторики. Всех желающих подтянуть знания отправляю туда. Отсюда, кстати, и название биномиального распределения (формула выше является коэффициентом в разложении бинома Ньютона).

Формулу для определения вероятности легко обобщить на любое количество n и k. В итоге формула биномиального распределения имеет следующий вид.

Количество подходящих под условие комбинаций умножить на вероятность одной из них.

Для практического использования достаточно просто знать формулу биномиального распределения. А можно даже и не знать – ниже показано, как определить вероятность с помощью Excel. Но лучше все-таки знать.

Рассчитаем по этой формуле вероятность выпадения 40 орлов при 100 бросках:

Или всего 1,08%. Для сравнения вероятность наступления математического ожидания этого эксперимента, то есть 50 орлов, равна 7,96%. Максимальная вероятность биномиальной величины принадлежит значению, соответствующему математическому ожиданию.

Расчет вероятностей биномиального распределения в Excel

Если использовать только бумагу и калькулятор, то расчеты по формуле биномиального распределения, несмотря на отсутствие интегралов, даются довольно тяжело. К примеру значение 100! – имеет более 150 знаков.

Раньше, да и сейчас тоже, для вычисления подобных величин использовали приближенные формулы. В настоящий момент целесообразно использовать специальное ПО, типа MS Excel.

Таким образом, любой пользователь (даже гуманитарий по образованию) вполне может вычислить вероятность значения биномиально распределенной случайной величины.

Для закрепления материала задействуем Excel пока в качестве обычного калькулятора, т.е. произведем поэтапное вычисление по формуле биномиального распределения. Рассчитаем, например, вероятность выпадения 50 орлов. Ниже приведена картинка с этапами вычислений и конечным результатом.

Как видно, промежуточные результаты имеют такой масштаб, что не помещаются в ячейку, хотя везде и используются простые функции типа: ФАКТР (вычисление факториала), СТЕПЕНЬ (возведение числа в степень), а также операторы умножения и деления. Более того, этот расчет довольно громоздок, во всяком случаен не является компактным, т.к. задействовано много ячеек. Да и разобраться с ходу трудновато.

В общем в Excel предусмотрена готовая функция для вычисления вероятностей биномиального распределения. Функция называется БИНОМ.РАСП.

Синтаксис функции состоит из 4 аргументов:

Поля имеют следующие назначения:

Число успехов – количество успешных испытаний. У нас их 50.

Число испытаний – количество бросков: 100 раз.

Вероятность успеха – вероятность выпадения орла при одном подбрасывании 0,5.

Интегральная – указывается либо 1, либо 0. Если 0, то рассчитается вероятность P(B=k); если 1, то рассчитается функция биномиального распределения, т.е. сумма всех вероятностей от B=0 до B=k включительно.

Нажимаем ОК и получаем тот же результат, что и выше, только все рассчиталось одной функцией.

Очень удобно. Эксперимента ради вместо последнего параметра 0 поставим 1. Получим 0,5398. Это значит, что при 100 подкидываниях монеты вероятность выпадения орлов в количестве от 0 до 50 равна почти 54%. А поначалу то казалось, что должно быть 50%. В общем, расчеты производятся легко и быстро.

Настоящий аналитик должен понимать, как ведет себя функция (каково ее распределение), поэтому произведем расчет вероятностей для всех значений от 0 до 100.

То есть зададимся вопросом: какова вероятность, что не выпадет ни одного орла, что выпадет 1 орел, 2, 3, 50, 90 или 100. Расчет приведен в следующей картинке.

Синяя линия – само биномиальное распределение, красная точка – вероятность для конкретного числа успехов k.

Кто-то может спросить, а не похоже ли биномиальное распределение на… Да, очень похоже. Еще Муавр (в 1733 г.) говорил, что биномиальное распределение при больших выборках приближается к нормальному закону (не знаю, как это тогда называлось), но его никто не слушал.

Только Гаусс, а затем и Лаплас через 60-70 лет вновь открыли и тщательно изучили нормальной закон распределения. На графике выше отлично видно, что максимальная вероятность приходится на математическое ожидание, а по мере отклонения от него, резко снижается.

Также, как и у нормального закона.

Биномиальное распределение имеет большое практическое значение, встречается довольно часто. С помощью Excel расчеты проводятся легко и быстро.

в социальных сетях:

Источник: https://statanaliz.info/statistica/teoriya-veroyatnostej/binomialnoe-raspredelenie/

Поделиться:
Нет комментариев

    Добавить комментарий

    Ваш e-mail не будет опубликован. Все поля обязательны для заполнения.