Теорія ймовірностей · Статистика

Теорія ймовірностей: від монети до машинного навчання

🧮
Калькулятор математичного очікування Обчислюйте математичне очікування та дисперсію випадкових величин.
Відкрити →
3 березня 2026 · Математика, Статистика

Аксіоми Колмогорова (1933)

Андрій Колмогоров у 1933 р. надав теорії ймовірностей строге математичне підґрунтя за допомогою трьох аксіом. Ця аксіоматика перетворила ймовірність на розділ теорії міри.

Ймовірнісний простір: (Ω, ℱ, P) Ω — простір елементарних подій ℱ — σ-алгебра підмножин Ω P: ℱ→[0,1] — ймовірнісна міра
A1
Невід'ємність: P(A) ≥ 0 для будь-якої події A ∈ ℱ
A2
Нормування: P(Ω) = 1 (вся ймовірність = 1)
A3
Зліченна адитивність: якщо A₁, A₂, … попарно несумісні, то P(A₁ ∪ A₂ ∪ …) = P(A₁) + P(A₂) + …
Наслідки: P(Ā) = 1 − P(A) (доповнення) P(A ∪ B) = P(A)+P(B)−P(A∩B) (включення-виключення) P(∅) = 0 (неможлива подія) A ⊆ B ⟹ P(A) ≤ P(B) (монотонність)

Умовна ймовірність і теорема Байєса

Умовна ймовірність P(A|B) — ймовірність події A за умови, що B вже відбулась. Теорема Байєса дозволяє «оновлювати» ймовірності при отриманні нових даних.

Умовна ймовірність: P(A|B) = P(A∩B) / P(B), (P(B) > 0) Формула повної ймовірності: P(A) = Σᵢ P(A|Hᵢ)·P(Hᵢ) де H₁,H₂,…,Hₙ — повна система гіпотез Теорема Байєса: P(Hᵢ|A) = P(A|Hᵢ)·P(Hᵢ) / P(A) = P(A|Hᵢ)·P(Hᵢ) / Σⱼ P(A|Hⱼ)·P(Hⱼ) Термінологія: P(Hᵢ) — апріорна ймовірність (prior) P(Hᵢ|A) — апостеріорна ймовірність (posterior) P(A|Hᵢ) — функція правдоподібності (likelihood)
Приклад: медичний тест на рідку хворобу (P(хвороба)=0.001). Чутливість тесту 99%, специфічність 99%. Якщо тест позитивний: P(хвороба|+) = (0.99·0.001)/(0.99·0.001+0.01·0.999) ≈ 9% — лише 9%! Байєс рятує від хибних висновків.

Випадкові величини і розподіли

Випадкова величина X: Ω → ℝ — функція, що числово описує результат випадкового досліду.

РозподілPMF / PDFE[X]Var(X)Застосування
Бернуллі(p)P(1)=p, P(0)=1-ppp(1-p)Монета, двійковий вихід
Біном(n,p)C(n,k)pᵏ(1-p)ⁿ⁻ᵏnpnp(1-p)k успіхів з n спроб
Пуассон(λ)e⁻ˡλᵏ/k!λλРідкісні події (черги, збої)
Рівномірний(a,b)1/(b-a)(a+b)/2(b-a)²/12Рандомізація, моделювання
Показниковий(λ)λe⁻ˡˣ1/λ1/λ²Час до відмови, черги
Нормальний(μ,σ²)(1/√2πσ²)e⁻(x-μ)²/2σ²μσ²Помилки вимірювань, зріст

Математичне сподівання і дисперсія

E[X] = Σₓ x·P(X=x) (дискретна) E[X] = ∫_{-∞}^{+∞} x·f(x) dx (неперервна) Лінійність: E[aX+bY] = aE[X] + bE[Y] Var(X) = E[(X−E[X])²] = E[X²] − (E[X])² SD(X) = σ = √Var(X) Ковар.: Cov(X,Y) = E[(X−μₓ)(Y−μᵧ)] Корел.: ρ(X,Y) = Cov(X,Y)/(σₓσᵧ) ∈ [−1,1] Незалежність ⟹ Cov(X,Y)=0 (обернене невірно!)

Закон великих чисел і ЦГТ

Два найважливіших граничних теорема ймовірностей, що пояснюють, чому статистика працює.

Закон великих чисел (слабкий, Хінчин): X₁, X₂, … — н.о.р. з E[Xᵢ]=μ, Var(Xᵢ)=σ²<∞ X̄ₙ = (X₁+…+Xₙ)/n →^P μ (збіжність за імовірністю) Тобто: P(|X̄ₙ−μ|>ε) → 0 при n→∞ ∀ε>0 Центральна гранична теорема (ЦГТ): √n · (X̄ₙ − μ) / σ →^d N(0,1) Або: Σᵢ Xᵢ ≈ N(nμ, nσ²) при великих n Прагматика: якщо n>30, вибіркове середнє вже приблизно нормально розподілене, незалежно від форми розподілу окремих Xᵢ!
ЦГТ пояснює, чому нормальний розподіл зустрічається скрізь: зріст людини — сума тисяч незалежних генетичних факторів; помилка вимірювання — сума багатьох незалежних похибок. Гаусс вивів нормальний розподіл, обґрунтовуючи метод найменших квадратів саме через ЦГТ.

Нерівності ймовірностей

Нерівність Маркова (X≥0): P(X ≥ a) ≤ E[X]/a Нерівність Чебишова: P(|X−μ| ≥ kσ) ≤ 1/k² Нерівність Хефдінга (концентрація): P(X̄ₙ−μ ≥ t) ≤ exp(−2nt²/(b−a)²) (для обмежених Xᵢ ∈ [a,b]) Правило 3σ (нормальний розподіл): P(|X−μ| ≤ σ) ≈ 68.27% P(|X−μ| ≤ 2σ) ≈ 95.45% P(|X−μ| ≤ 3σ) ≈ 99.73%

Ланцюги Маркова

Ланцюг Маркова — послідовність випадкових величин, де майбутній стан залежить лише від поточного (марковська властивість). Фундамент для PageRank, MCMC та RL.

Марковська властивість: P(Xₙ₊₁=j | X₀,…,Xₙ) = P(Xₙ₊₁=j | Xₙ) Матриця переходів P: pᵢⱼ = P(Xₙ₊₁=j|Xₙ=i) (кожен рядок: Σⱼ pᵢⱼ = 1) Стаціонарний розподіл π: πP = π, Σᵢ πᵢ = 1 Для ергодичного ланцюга: π єдиний і Xₙ→π Застосування: PageRank Google: πᵢ = (1-d)/n + d·ΣⱼP(j→i)πⱼ MCMC: Metropolis-Hastings — ланцюг зі стаціонарним розподілом = цільовому розподілу

Про цю статтю

Ця стаття є частиною бази знань calculator.party — освітнього ресурсу, що поєднує теорію з практичними інструментами. Матеріал орієнтований на студентів, учнів і фахівців, що прагнуть глибокого розуміння теми. Тут зібрані ключові концепції, формули та реальні приклади застосування.

Теорія ймовірностей кількісно описує невизначеність. Вона є основою статистики, машинного навчання, фінансів та криптографії.

Навіщо читати цю статтю

Після прочитання ви зможете впевнено пояснити тему, вирішувати практичні задачі та застосовувати знання у навчанні й роботі. Стаття охоплює теоретичне підґрунтя і числові приклади, що полегшують запам'ятовування матеріалу.

Часті запитання (FAQ)

Що таке Теорія ймовірностей: від монети до машинного навчання і чому це важливо знати?
Теорія ймовірностей: від монети до машинного навчання — ключова тема в математики та статистики. Розуміння її основ дає змогу вирішувати практичні задачі, успішно складати іспити та застосовувати знання в реальних ситуаціях. Стаття розкриває концепцію доступними словами з конкретними прикладами.
Які ключові формули та методи використовуються в теорія ймовірностей: від монети до машинного навчання?
Основні формули та методи для теорія ймовірностей: від монети до машинного навчання охоплюють як аналітичні підходи, так і числові алгоритми. У статті наведені всі ключові вирази з поясненням кожного позначення та вказівкою одиниць вимірювання.
Де в реальному житті застосовується теорія ймовірностей: від монети до машинного навчання?
Сфери застосування теорія ймовірностей: від монети до машинного навчання надзвичайно широкі: страхуванні та ризик-менеджменті, фінансах, телекомунікаціях, Machine Learning. Знання цієї теми відкриває кар'єрні можливості в інженерії, науці, фінансах та IT-галузі.
Як розрахувати теорія ймовірностей: від монети до машинного навчання онлайн?
На calculator.party є безкоштовні онлайн-калькулятори з тематики 'Теорія ймовірностей: від монети до машинного навчання'. Достатньо ввести вхідні дані — і ви миттєво отримаєте точний результат з покроковим поясненням. Це ідеально для перевірки ручних розрахунків.
Яка різниця між теорія ймовірностей: від монети до машинного навчання та суміжними темами?
Стаття чітко описує межі тематики 'Теорія ймовірностей: від монети до машинного навчання', порівнюючи її з близькими поняттями. Чітке розуміння відмінностей допомагає уникнути типових помилок та плутанини при розв'язанні задач.