Калькулятор математичного сподівання та дисперсії

Математичне сподівання E(X) — середнє зважене значень випадкової величини за їх ймовірностями. Дисперсія D(X) — міра розкиду значень навколо середнього. Введіть рядки з парами (xᵢ; pᵢ), де сума всіх pᵢ = 1, щоб отримати повний аналіз дискретного розподілу.

Статистика — наука про збір, обробку, аналіз і інтерпретацію числових даних. Описова статистика характеризує вибірку (середнє, дисперсія, медіана), тоді як математична статистика дозволяє робити висновки про генеральну сукупність на основі обмеженої вибірки — будуючи довірчі інтервали та перевіряючи гіпотези. Сучасна статистика від класичних тестів Стьюдента до байєсівського аналізу є незамінним інструментом будь-якого дослідника.

Калькулятор дискретного розподілу

#xᵢ (значення)pᵢ (ймовірність)

Формули дискретних розподілів

Математичне сподівання

E(X) = Σ xᵢ × pᵢ = x₁p₁ + x₂p₂ + … + xₙpₙ

Дисперсія

D(X) = E(X²) − [E(X)]² = Σ xᵢ² × pᵢ − (E(X))²

Стандартне відхилення

σ(X) = √D(X)

Умова нормування

Σ pᵢ = 1 (сума всіх ймовірностей = 1)

Приклади

Гральний кубик (рівномірний розподіл):

x: 1, 2, 3, 4, 5, 6; p: 1/6 кожне

E(X) = (1+2+3+4+5+6)/6 = 3.5

D(X) = (1²+2²+3²+4²+5²+6²)/6 − 3.5² = 15.1667 − 12.25 = 2.9167

σ = √2.9167 ≈ 1.708

Виграш у лотерею:

x: −10, 0, 50, 1000; p: 0.5, 0.3, 0.15, 0.05

E(X) = −10×0.5 + 0×0.3 + 50×0.15 + 1000×0.05 = −5 + 0 + 7.5 + 50 = 52.5 грн

Практичне значення та контекст

Коротка довідка

Основи математичної статистики закладали Гаусс (метод найменших квадратів, 1809), Пірсон (коефіцієнт кореляції, хі-квадрат, 1900) та Госсет/Стьюдент (t-тест, 1908). Фішер систематизував статистику у книзі «Statistical Methods for Research Workers» (1925), ввівши ANOVA, рандомізацію та p-значення. Нейман і Пірсон (1933) формалізували теорію перевірки гіпотез.

Де застосовується

Статистичні методи застосовуються у всіх сферах, де є дані. У медицині клінічні дослідження потребують статистики для доведення ефективності препаратів (t-тест, ANOVA, виживаність Каплана-Мейєра). У соціальних науках опитування та кореляційний аналіз виявляють тренди та зв'язки між явищами. В економіці та фінансах регресійний аналіз прогнозує попит, оцінює ризики (VaR) та будує торгові стратегії. В машинному навчанні статистика — основа оцінки якості моделей: точність, повнота, F1-міра, ROC-AUC. У промисловості статистичний контроль якості (SPC) виявляє дефекти виробничих процесів у реальному часі.

Часті запитання

Чи може E(X) бути недосяжним значенням?
Так! Математичне сподівання є теоретичним середнім і не обов'язково збігається з жодним конкретним значенням. Наприклад, E(X) = 3.5 для кубика, хоча кубик ніколи не показує 3.5.
Дисперсія вийшла від'ємна — чи це можливо?
Дисперсія D(X) = E(X²) − [E(X)]² завжди ≥ 0. Від'ємне значення означає помилку в розрахунках або введених даних.
Навіщо потрібне стандартне відхилення σ?
σ виміряний у тих самих одиницях, що й X, і показує типовий розмір відхилення від E(X). Дисперсія D(X) = σ² має одиниці квадратні, що ускладнює інтерпретацію.
Яка різниця між генеральною сукупністю та вибіркою?
Генеральна сукупність — це весь набір об'єктів, що досліджуються (наприклад, всі студенти університету). Вибірка — підмножина генеральної сукупності, яку реально вимірюють. Статистичні оцінки (середнє, відхилення) обчислюються за вибіркою, але слугують для оцінки параметрів генеральної сукупності.
Коли використовувати середнє арифметичне, а коли медіану?
Середнє арифметичне підходить для симетричних розподілів без викидів (аномальних значень). Медіана краща при несиметричних розподілах або наявності викидів — наприклад, для аналізу доходів населення, де кілька наддоходів сильно завищили б середнє. Мода використовується для категоріальних або дискретних даних.