Калькулятор розподілу Пуассона

Розподіл Пуассона описує кількість подій, що відбуваються в фіксований проміжок часу або простору, якщо ці події відбуваються з відомою середньою інтенсивністю (λ) та незалежно одна від одної. Застосовується для моделювання рідкісних подій: кількість аварій за рік, кількість запитів до сервера за секунду, радіоактивні розпади тощо.

Калькулятор розподілу Пуассона

Формули розподілу Пуассона

Ймовірність точно k подій

P(X = k) = (λᵏ × e^(−λ)) / k! де λ > 0, k = 0, 1, 2, …

Числові характеристики

E(X) = λ (математичне сподівання) D(X) = λ (дисперсія) σ(X) = √λ (стандартне відхилення) Mo(X) = floor(λ) (мода)

Унікальна властивість: для розподілу Пуассона E(X) = D(X) = λ.

Наближення біноміальним

При n великому та p малому (np = λ): B(n, p) ≈ Poisson(λ = np)

Приклад: Середня кількість аварій на заводі λ = 2 за місяць. Яка ймовірність рівно 3 аварій у місяці?

P(X = 3) = (2³ × e⁻²) / 3! = (8 × 0.1353) / 6 ≈ 0.1804 (18.04%)

Застосування розподілу Пуассона

Телекомунікації та ІТ

  • Кількість запитів до API за секунду
  • Кількість помилок у коді на 1000 рядків
  • Потік пакетів у мережі

Фізика

  • Радіоактивні розпади за одиницю часу
  • Кількість фотонів, що потрапляють на детектор

Страхування та фінанси

  • Кількість страхових випадків за рік
  • Кількість дефолтів у портфелі

Медицина та біологія

  • Кількість мутацій у ДНК на певному відрізку
  • Кількість бактерій у зразку

Практичне значення та контекст

Коротка довідка

Гаус і Лежандр розробили метод найменших квадратів на початку XIX ст. Фішер заклав основи сучасної статистики в 1920-х роках.

Де застосовується

Медицина та клінічні дослідження: аналіз ефективності препаратів, контрольні групи. Соціальні науки: опитування, вибіркові методи, аналіз даних. Бізнес та фінанси: аналіз ринків, прогнозування, контроль якості. Наука про дані (Data Science): статистика є фундаментом ML/AI.

Часті запитання

Чому E(X) = D(X) = λ?
Це математична властивість розподілу Пуассона. Вона означає, що чим більша середня інтенсивність, тим більший і розкид значень. Якщо D(X) >> E(X), дані можуть мати "наддисперсію" і не підходити під модель Пуассона.
При якому λ наближення нормальним коректне?
При λ ≥ 10–15 розподіл Пуассона добре наближається нормальним N(λ, λ). Для малих λ (рідкісні події) використовують точні формули Пуассона.
Як знайти λ із реальних даних?
λ оцінюється як середнє спостережене число подій за одиницю часу/простору. Наприклад, якщо за 100 годин сталося 250 подій, то λ̂ = 250/100 = 2.5 на годину.
Яка різниця між генеральною сукупністю та вибіркою?
Генеральна сукупність — це весь набір об'єктів, що досліджуються (наприклад, всі студенти університету). Вибірка — підмножина генеральної сукупності, яку реально вимірюють. Статистичні оцінки (середнє, відхилення) обчислюються за вибіркою, але слугують для оцінки параметрів генеральної сукупності.
Коли використовувати середнє арифметичне, а коли медіану?
Середнє арифметичне підходить для симетричних розподілів без викидів (аномальних значень). Медіана краща при несиметричних розподілах або наявності викидів — наприклад, для аналізу доходів населення, де кілька наддоходів сильно завищили б середнє. Мода використовується для категоріальних або дискретних даних.