1. Що таке нормальний розподіл?
Нормальний (або Гаусів) розподіл — це дзвоноподібна крива, яка описує безліч природних явищ: зріст людей, похибки вимірювань, результати тестів, відхилення виробів від стандарту.
Нормальний розподіл визначається лише двома параметрами: середнє μ (центр кривої) та стандартне відхилення σ (ширина кривої).
2. Правило 68-95-99.7 (Правило трьох сигм)
Це одне з найкорисніших практичних правил статистики:
| Інтервал | % даних | Практичний зміст |
|---|---|---|
| μ ± σ | ≈ 68,3% | Основна маса (2/3 вибірки) |
| μ ± 2σ | ≈ 95,4% | Стандартний довірчий інтервал |
| μ ± 3σ | ≈ 99,7% | Майже всі значення |
| >μ + 3σ | ≈ 0,15% | Дуже рідкісні «аномалії» |
Приклад: контроль якості
Завод виробляє болти з середнім діаметром μ = 10 мм і стандартним відхиленням σ = 0,1 мм. За правилом трьох сигм, 99,7% болтів матимуть діаметр від 9,7 до 10,3 мм. Болти поза цим діапазоном — потенційний брак.
3. Z-оцінки (Z-scores): стандартизація
Z-оцінка показує, на скільки стандартних відхилень конкретне значення відхиляється від середнього:
Як читати Z-оцінку:
- Z = 0: значення рівно на середньому
- Z = 1: на 1 сигму вище середнього (топ ~16%)
- Z = 2: на 2 сигми вище (топ ~2,3%)
- Z = −1,5: на 1,5 сигми нижче (нижні ~6,7%)
Приклад IQ: Якщо IQ розподілений нормально з μ = 100, σ = 15, то IQ = 130 має Z = (130−100)/15 = 2. Це означає, що людина знаходиться вище ~97,7% населення.
4. Стандартний нормальний розподіл N(0,1)
Коли ми стандартизуємо дані (перетворюємо в Z-оцінки), отримуємо стандартний нормальний розподіл з μ = 0 і σ = 1. Для нього є стандартні таблиці (Z-таблиці), що дозволяють знаходити ймовірності.
| Z | P(X ≤ z) | Тлумачення |
|---|---|---|
| −3,00 | 0,0013 | 0,13% лежать нижче |
| −1,96 | 0,025 | 2,5% (межа 95% ДІ) |
| 0,00 | 0,500 | 50% (медіана = середнє) |
| +1,645 | 0,950 | 95% лежать нижче |
| +1,960 | 0,975 | 97,5% (межа 95% ДІ) |
| +3,00 | 0,9987 | 99,87% |
5. Центральна гранична теорема — чому нормальний розподіл скрізь
Центральна гранична теорема (ЦГТ) стверджує: середнє n незалежних однаково розподілених змінних наближається до нормального розподілу при зростанні n, незалежно від початкового розподілу!
Це пояснює, чому нормальний розподіл виникає у природі так часто: зріст людини = сума багатьох генетичних і середовищних факторів → нормальний розподіл.
6. Практичні застосування
- Довірчі інтервали: x̄ ± 1,96·(σ/√n) — 95% ДІ для середнього
- Гіпотезні тести: t-тест, Z-тест спираються на нормальність
- Контроль якості: Six Sigma — відхилення ±6σ (3,4 бракованих на 1 мільйон)
- Фінанси: Value at Risk (VaR) — припускаючи нормальність прибутків
Увага: Нормальний розподіл — це модель, не реальність. Доходи, ціни акцій, часи реакцій часто мають «важкі хвости» (fat tails). Перевіряйте нормальність за допомогою тесту Шапіро-Вілка або Q-Q графіку.
Про цю статтю
Ця стаття є частиною бази знань calculator.party — освітнього ресурсу, що поєднує теорію з практичними інструментами. Матеріал орієнтований на студентів, учнів і фахівців, що прагнуть глибокого розуміння теми. Тут зібрані ключові концепції, формули та реальні приклади застосування.
Статистика — мова даних. Без неї неможливі медичні дослідження, соціологія, фінанси, Data Science та державне управління. Вміння читати та інтерпретувати статистику є ключовою навичкою XXI ст.
Навіщо читати цю статтю
Після прочитання ви зможете впевнено пояснити тему, вирішувати практичні задачі та застосовувати знання у навчанні й роботі. Стаття охоплює теоретичне підґрунтя і числові приклади, що полегшують запам'ятовування матеріалу.