1. Ентропія Шеннона
У 1948 р. Клод Шеннон запитав: «Скільки інформації несе повідомлення?» Відповідь — ентропія H(X), яка вимірює середню невизначеність випадкової величини X.
Приклад: монета
Ланцюгове правило
2. Взаємна інформація і дивергенція KL
Взаємна інформація I(X;Y) вимірює кількість інформації про X, що міститься в Y (і навпаки).
Дивергенція Кульбака-Лейблера
Застосування в ML
D_KL(P||Q) — основа функції втрат крос-ентропії. Якщо P = справжній розподіл, Q = модель, то мінімізація крос-ентропії H(P,Q) = H(P) + D_KL(P||Q) еквівалентна мінімізації KL-дивергенції.
3. Коди Хаффмана
Оптимальний алгоритм префіксного кодування з мінімальною середньою довжиною кодового слова. Запропонований Девідом Хаффманом у 1952 р.
Алгоритм: жадібна побудова дерева
- Ставимо кожен символ у список із його ймовірністю
- Обираємо два вузли з найменшими ймовірностями
- З'єднуємо їх у новий внутрішній вузол (сума ймовірностей)
- Повторюємо до одного кореневого вузла
- Ліва гілка = 0, права гілка = 1
4. Стиснення без втрат: LZ77 та LZ78
Алгоритми Лемпеля-Зіва (1977, 1978) — основа ZIP, gzip, PNG, GIF. Не потребують попереднього знання розподілу символів — є адаптивними.
Теореми асимптотичної оптимальності
Для будь-якого стаціонарного ергодичного джерела коефіцієнт стиснення LZ-алгоритмів наближається до ентропійної межі H(X) при n→∞ (теорема Зіва, 1978).
5. Пропускна здатність каналу
Скільки інформації можна надійно передати каналом зв'язку? Теорема кодування каналу Шеннона (1948) дає точну відповідь.
Числові приклади
6. Ентропія неперервних розподілів
Диференціальна ентропія узагальнює поняття ентропії на неперервні випадкові величини.
7. Застосування в ML і безпеці
- Крос-ентропійні втрати в нейромережах: L = −Σ yᵢ log(ŷᵢ)
- Вирішальні дерева: критерій інформаційного виграшу IG = H(parent) − Σ H(child)
- Варіаційний автокодер (VAE): D_KL(q(z|x)||p(z)) — частина ELBO
- Ентропія паролів: H = log₂(|алфавіт|^довжина) — пароль з 12 символів ≈ 79 біт
- Квантова теорія інформації: ентропія фон Неймана S(ρ) = −Tr(ρ·log ρ)
Про цю статтю
Ця стаття є частиною бази знань calculator.party — освітнього ресурсу, що поєднує теорію з практичними інструментами. Матеріал орієнтований на студентів, учнів і фахівців, що прагнуть глибокого розуміння теми. Тут зібрані ключові концепції, формули та реальні приклади застосування.
Електрика та магнетизм, об'єднані рівняннями Максвелла, лежать в основі сучасної цивілізації: від комп'ютерних чіпів до ліній електропередачі.
Навіщо читати цю статтю
Після прочитання ви зможете впевнено пояснити тему, вирішувати практичні задачі та застосовувати знання у навчанні й роботі. Стаття охоплює теоретичне підґрунтя і числові приклади, що полегшують запам'ятовування матеріалу.