Калькулятор формули Байєса

Теорема Байєса — один з фундаментальних результатів теорії ймовірностей, що дозволяє обчислити умовну ймовірність події A за умови настання події B, використовуючи апріорну ймовірність та правдоподібність. Широко застосовується в медичній діагностиці, машинному навчанні, спам-фільтрах та наукових дослідженнях. Введіть відомі ймовірності, щоб отримати апостеріорну ймовірність.

Статистика — наука про збір, обробку, аналіз і інтерпретацію числових даних. Описова статистика характеризує вибірку (середнє, дисперсія, медіана), тоді як математична статистика дозволяє робити висновки про генеральну сукупність на основі обмеженої вибірки — будуючи довірчі інтервали та перевіряючи гіпотези. Сучасна статистика від класичних тестів Стьюдента до байєсівського аналізу є незамінним інструментом будь-якого дослідника.

Калькулятор формули Байєса

P(A) — апріорна ймовірність гіпотези A (0…1):

P(B|A) — ймовірність спостереження B за умови A (0…1):

P(B|¬A) — ймовірність спостереження B якщо A хибна (0…1):

Формула Байєса

P(A|B) = P(B|A) × P(A) / P(B)

де P(B) = P(B|A)×P(A) + P(B|¬A)×P(¬A)
       = P(B|A)×P(A) + P(B|¬A)×(1 − P(A))
                    

Пояснення позначень:

P(A) — апріорна ймовірність гіпотези (до спостереження)
P(B|A) — правдоподібність (ймовірність спостерігати B, якщо A вірна)
P(B|¬A) — ймовірність спостерігати B, якщо A хибна
P(A|B) — апостеріорна ймовірність (після спостереження B)

Медичний приклад: Тест на рак має чутливість P(Тест+|Хвороба) = 0.95 та специфічність P(Тест−|Здоровий) = 0.95. Поширеність хвороби P(Хвороба) = 0.01.

P(Тест+|Здоровий) = 1 − 0.95 = 0.05

P(Хвороба|Тест+) = 0.95×0.01 / (0.95×0.01 + 0.05×0.99) ≈ 0.161 (16.1%)

Попри 95% точність тесту, ймовірність хвороби при позитивному результаті лише ~16% через низьку поширеність.

Застосування теореми Байєса

Статистичні методи застосовуються у всіх сферах, де є дані. У медицині клінічні дослідження потребують статистики для доведення ефективності препаратів (t-тест, ANOVA, виживаність Каплана-Мейєра). У соціальних науках опитування та кореляційний аналіз виявляють тренди та зв'язки між явищами. В економіці та фінансах регресійний аналіз прогнозує попит, оцінює ризики (VaR) та будує торгові стратегії. В машинному навчанні статистика — основа оцінки якості моделей: точність, повнота, F1-міра, ROC-AUC. У промисловості статистичний контроль якості (SPC) виявляє дефекти виробничих процесів у реальному часі.

Медична діагностика

Оцінка ймовірності захворювання після позитивного тесту з урахуванням поширеності хвороби.

Спам-фільтри

Наївний Байєсів класифікатор: ймовірність того, що лист є спамом, на основі слів у ньому.

Машинне навчання

Байєсівські нейронні мережі, оцінка гіперпараметрів, активне навчання.

Наукові дослідження

Оновлення гіпотез на основі нових даних, байєсівська статистика.

Практичне значення та контекст

Коротка довідка

Основи математичної статистики закладали Гаусс (метод найменших квадратів, 1809), Пірсон (коефіцієнт кореляції, хі-квадрат, 1900) та Госсет/Стьюдент (t-тест, 1908). Фішер систематизував статистику у книзі «Statistical Methods for Research Workers» (1925), ввівши ANOVA, рандомізацію та p-значення. Нейман і Пірсон (1933) формалізували теорію перевірки гіпотез.

Де застосовується

Часті запитання

Що таке апріорна та апостеріорна ймовірність?

Апріорна — ймовірність до отримання нових даних. Апостеріорна — ймовірність після врахування нових спостережень. Теорема Байєса перетворює апріорну ймовірність на апостеріорну за допомогою правдоподібності.

Чому результат іноді здивовує (парадокс тесту)?

При рідкісних хворобах навіть точний тест дає переважно хибно-позитивні результати, тому апостеріорна ймовірність може бути набагато нижчою, ніж точність тесту. Це і є парадокс Байєса.

Чи можна застосовувати теорему Байєса кілька разів?

Так! Апостеріорна ймовірність від першого спостереження стає апріорною для наступного — саме так будується послідовне байєсівське оновлення при накопиченні даних.

Яка різниця між генеральною сукупністю та вибіркою?

Генеральна сукупність — це весь набір об'єктів, що досліджуються (наприклад, всі студенти університету). Вибірка — підмножина генеральної сукупності, яку реально вимірюють. Статистичні оцінки (середнє, відхилення) обчислюються за вибіркою, але слугують для оцінки параметрів генеральної сукупності.

Коли використовувати середнє арифметичне, а коли медіану?

Середнє арифметичне підходить для симетричних розподілів без викидів (аномальних значень). Медіана краща при несиметричних розподілах або наявності викидів — наприклад, для аналізу доходів населення, де кілька наддоходів сильно завищили б середнє. Мода використовується для категоріальних або дискретних даних.

📁 Категорія: Ймовірність

📚 Читайте також: Теорема Байєса інтуїтивно: пояснення з прикладами

Калькулятор формули Байєса