Теорія ймовірностей — повне пояснення

Аксіоми Колмогорова (1933)

Андрій Колмогоров у 1933 р. надав теорії ймовірностей строге математичне підґрунтя за допомогою трьох аксіом. Ця аксіоматика перетворила ймовірність на розділ теорії міри.

Ймовірнісний простір: (Ω, ℱ, P) Ω — простір елементарних подій ℱ — σ-алгебра підмножин Ω P: ℱ→[0,1] — ймовірнісна міра

Невід'ємність: P(A) ≥ 0 для будь-якої події A ∈ ℱ

Нормування: P(Ω) = 1 (вся ймовірність = 1)

Зліченна адитивність: якщо A₁, A₂, … попарно несумісні, то P(A₁ ∪ A₂ ∪ …) = P(A₁) + P(A₂) + …

Наслідки: P(Ā) = 1 − P(A) (доповнення) P(A ∪ B) = P(A)+P(B)−P(A∩B) (включення-виключення) P(∅) = 0 (неможлива подія) A ⊆ B ⟹ P(A) ≤ P(B) (монотонність)

Умовна ймовірність і теорема Байєса

Умовна ймовірність P(A|B) — ймовірність події A за умови, що B вже відбулась. Теорема Байєса дозволяє «оновлювати» ймовірності при отриманні нових даних.

Приклад: медичний тест на рідку хворобу (P(хвороба)=0.001). Чутливість тесту 99%, специфічність 99%. Якщо тест позитивний: P(хвороба|+) = (0.99·0.001)/(0.99·0.001+0.01·0.999) ≈ 9% — лише 9%! Байєс рятує від хибних висновків.

Випадкові величини і розподіли

Випадкова величина X: Ω → ℝ — функція, що числово описує результат випадкового досліду.

Розподіл	PMF / PDF	E[X]	Var(X)	Застосування
Бернуллі(p)	P(1)=p, P(0)=1-p	p	p(1-p)	Монета, двійковий вихід
Біном(n,p)	C(n,k)pᵏ(1-p)ⁿ⁻ᵏ	np	np(1-p)	k успіхів з n спроб
Пуассон(λ)	e⁻ˡλᵏ/k!	λ	λ	Рідкісні події (черги, збої)
Рівномірний(a,b)	1/(b-a)	(a+b)/2	(b-a)²/12	Рандомізація, моделювання
Показниковий(λ)	λe⁻ˡˣ	1/λ	1/λ²	Час до відмови, черги
Нормальний(μ,σ²)	(1/√2πσ²)e⁻(x-μ)²/2σ²	μ	σ²	Помилки вимірювань, зріст

Математичне сподівання і дисперсія

E[X] = Σₓ x·P(X=x) (дискретна) E[X] = ∫_{-∞}^{+∞} x·f(x) dx (неперервна) Лінійність: E[aX+bY] = aE[X] + bE[Y] Var(X) = E[(X−E[X])²] = E[X²] − (E[X])² SD(X) = σ = √Var(X) Ковар.: Cov(X,Y) = E[(X−μₓ)(Y−μᵧ)] Корел.: ρ(X,Y) = Cov(X,Y)/(σₓσᵧ) ∈ [−1,1] Незалежність ⟹ Cov(X,Y)=0 (обернене невірно!)

Закон великих чисел і ЦГТ

Два найважливіших граничних теорема ймовірностей, що пояснюють, чому статистика працює.

Закон великих чисел (слабкий, Хінчин): X₁, X₂, … — н.о.р. з E[Xᵢ]=μ, Var(Xᵢ)=σ²<∞ X̄ₙ = (X₁+…+Xₙ)/n →^P μ (збіжність за імовірністю) Тобто: P(|X̄ₙ−μ|>ε) → 0 при n→∞ ∀ε>0 Центральна гранична теорема (ЦГТ): √n · (X̄ₙ − μ) / σ →^d N(0,1) Або: Σᵢ Xᵢ ≈ N(nμ, nσ²) при великих n Прагматика: якщо n>30, вибіркове середнє вже приблизно нормально розподілене, незалежно від форми розподілу окремих Xᵢ!

ЦГТ пояснює, чому нормальний розподіл зустрічається скрізь: зріст людини — сума тисяч незалежних генетичних факторів; помилка вимірювання — сума багатьох незалежних похибок. Гаусс вивів нормальний розподіл, обґрунтовуючи метод найменших квадратів саме через ЦГТ.

Нерівності ймовірностей

Нерівність Маркова (X≥0): P(X ≥ a) ≤ E[X]/a Нерівність Чебишова: P(|X−μ| ≥ kσ) ≤ 1/k² Нерівність Хефдінга (концентрація): P(X̄ₙ−μ ≥ t) ≤ exp(−2nt²/(b−a)²) (для обмежених Xᵢ ∈ [a,b]) Правило 3σ (нормальний розподіл): P(|X−μ| ≤ σ) ≈ 68.27% P(|X−μ| ≤ 2σ) ≈ 95.45% P(|X−μ| ≤ 3σ) ≈ 99.73%

Ланцюги Маркова

Ланцюг Маркова — послідовність випадкових величин, де майбутній стан залежить лише від поточного (марковська властивість). Фундамент для PageRank, MCMC та RL.

Марковська властивість: P(Xₙ₊₁=j | X₀,…,Xₙ) = P(Xₙ₊₁=j | Xₙ) Матриця переходів P: pᵢⱼ = P(Xₙ₊₁=j|Xₙ=i) (кожен рядок: Σⱼ pᵢⱼ = 1) Стаціонарний розподіл π: πP = π, Σᵢ πᵢ = 1 Для ергодичного ланцюга: π єдиний і Xₙ→π Застосування: PageRank Google: πᵢ = (1-d)/n + d·ΣⱼP(j→i)πⱼ MCMC: Metropolis-Hastings — ланцюг зі стаціонарним розподілом = цільовому розподілу

Про цю статтю

Ця стаття є частиною бази знань calculator.party — освітнього ресурсу, що поєднує теорію з практичними інструментами. Матеріал орієнтований на студентів, учнів і фахівців, що прагнуть глибокого розуміння теми. Тут зібрані ключові концепції, формули та реальні приклади застосування.

Теорія ймовірностей кількісно описує невизначеність. Вона є основою статистики, машинного навчання, фінансів та криптографії.

Навіщо читати цю статтю

Після прочитання ви зможете впевнено пояснити тему, вирішувати практичні задачі та застосовувати знання у навчанні й роботі. Стаття охоплює теоретичне підґрунтя і числові приклади, що полегшують запам'ятовування матеріалу.

Часті запитання (FAQ)

Що таке Теорія ймовірностей: від монети до машинного навчання і чому це важливо знати?

Теорія ймовірностей: від монети до машинного навчання — ключова тема в математики та статистики. Розуміння її основ дає змогу вирішувати практичні задачі, успішно складати іспити та застосовувати знання в реальних ситуаціях. Стаття розкриває концепцію доступними словами з конкретними прикладами.

Які ключові формули та методи використовуються в теорія ймовірностей: від монети до машинного навчання?

Основні формули та методи для теорія ймовірностей: від монети до машинного навчання охоплюють як аналітичні підходи, так і числові алгоритми. У статті наведені всі ключові вирази з поясненням кожного позначення та вказівкою одиниць вимірювання.

Де в реальному житті застосовується теорія ймовірностей: від монети до машинного навчання?

Сфери застосування теорія ймовірностей: від монети до машинного навчання надзвичайно широкі: страхуванні та ризик-менеджменті, фінансах, телекомунікаціях, Machine Learning. Знання цієї теми відкриває кар'єрні можливості в інженерії, науці, фінансах та IT-галузі.

Як розрахувати теорія ймовірностей: від монети до машинного навчання онлайн?

На calculator.party є безкоштовні онлайн-калькулятори з тематики 'Теорія ймовірностей: від монети до машинного навчання'. Достатньо ввести вхідні дані — і ви миттєво отримаєте точний результат з покроковим поясненням. Це ідеально для перевірки ручних розрахунків.

Яка різниця між теорія ймовірностей: від монети до машинного навчання та суміжними темами?

Стаття чітко описує межі тематики 'Теорія ймовірностей: від монети до машинного навчання', порівнюючи її з близькими поняттями. Чітке розуміння відмінностей допомагає уникнути типових помилок та плутанини при розв'язанні задач.