🧠 Калькулятор активаційних функцій
Візуалізація та розрахунок функцій активації нейронних мереж: Sigmoid, ReLU, Tanh, Softmax та інші
📊 Калькулятор активаційних функцій
Sigmoid (σ) Класика
Стискає значення до (0, 1). Гарна для бінарної класифікації.
Tanh Центрований
Стискає до (-1, 1). Центрований вихід, краще ніж Sigmoid.
ReLU Популярний
Найпопулярніша функція. Просто і ефективно.
Leaky ReLU Покращений
Вирішує проблему "мертвих нейронів" ReLU.
ELU Гладкий
Експоненційний лінійний блок. Гладкий для негативних.
SELU Самонормалізація
Масштабований ELU з самонормалізацією.
Swish Google
Запропонований Google. Гладкий і ефективний.
GELU BERT/GPT
Використовується в трансформерах. Гаусівська.
Softplus Гладкий ReLU
Гладка апроксимація ReLU.
Mish Новий
Сучасна функція з хорошою продуктивністю.
Hard Swish MobileNet
Швидша апроксимація Swish для мобільних.
PReLU Навчальний
Параметричний ReLU з навчальним α.
Результати обчислення
Графік функції
Графік похідної
📈 Softmax калькулятор
Softmax перетворює вектор дійсних чисел у розподіл ймовірностей. Використовується в останньому шарі класифікаторів.
Введіть логіти (необроблені виходи мережі):
⚖️ Порівняння активаційних функцій
Порівняння значень усіх активаційних функцій для заданого входу.
🔗 Симуляція нейронного шару
Вхідні значення:
Результати шару
Матриця ваг W:
Вектор зміщень b:
📚 Теорія активаційних функцій
1. Роль активаційних функцій
Функції активації додають нелінійність до нейронних мереж. Без них мережа з будь-якою кількістю шарів була б еквівалентна одношаровій лінійній моделі.
де f — функція активації, w — ваги, b — зміщення
2. Властивості ідеальної функції активації
- Нелінійність: Дозволяє апроксимувати складні функції
- Диференційованість: Для застосування градієнтного спуску
- Монотонність: Спрощує оптимізацію
- Центрований вихід: Прискорює навчання (як tanh)
- Обчислювальна ефективність: Швидкі операції
3. Класичні функції
Sigmoid (Логістична)
σ'(x) = σ(x) · (1 - σ(x))
Діапазон: (0, 1)
Проблема: Зникаючий градієнт при |x| >> 0
Tanh (Гіперболічний тангенс)
tanh'(x) = 1 - tanh²(x)
Діапазон: (-1, 1)
Переваги: Центрований вихід
4. Сімейство ReLU
ReLU (Rectified Linear Unit)
ReLU'(x) = { 1, x > 0; 0, x ≤ 0 }
Переваги: Простота, швидкість, розріджена активація
Недолік: "Мертві нейрони" при x < 0
Leaky ReLU
LReLU'(x) = { 1, x > 0; α, x ≤ 0 }
Вирішує проблему мертвих нейронів
ELU (Exponential Linear Unit)
ELU'(x) = { 1, x > 0; α·eˣ, x ≤ 0 }
Гладкий перехід, робустний до шуму
SELU (Scaled ELU)
λ ≈ 1.0507, α ≈ 1.6733
Самонормалізація: виходи мають μ≈0, σ≈1
5. Сучасні функції
Swish
При β=1: Swish(x) = x · σ(x)
Swish'(x) = σ(x) + x · σ(x) · (1 - σ(x))
Гладка, не-монотонна, немає верхньої межі
GELU (Gaussian Error Linear Unit)
GELU(x) ≈ 0.5x(1 + tanh(√(2/π)(x + 0.044715x³)))
Використовується в BERT, GPT, ViT
Mish
Гладка, не-монотонна, без насичення зверху
6. Softmax
З температурою T:
Softmax(zᵢ, T) = exp(zᵢ/T) / Σⱼ exp(zⱼ/T)
T → 0: жорсткий argmax
T → ∞: рівномірний розподіл
7. Порівняльна таблиця
| Функція | Діапазон | Центрована | Складність | Де використовувати |
|---|---|---|---|---|
| Sigmoid | (0, 1) | ❌ | O(1) exp | Вихід бінарної класифікації |
| Tanh | (-1, 1) | ✅ | O(1) exp | RNN, LSTM |
| ReLU | [0, ∞) | ❌ | O(1) | Приховані шари CNN |
| Leaky ReLU | (-∞, ∞) | ~ | O(1) | Заміна ReLU |
| GELU | (-0.17, ∞) | ~ | O(1) erf | Трансформери |
| Swish | (-0.28, ∞) | ~ | O(1) exp | Глибокі мережі |
| Softmax | (0, 1), Σ=1 | ❌ | O(n) exp | Вихід мультикласу |
8. Рекомендації щодо вибору
- Приховані шари CNN: ReLU, Leaky ReLU, ELU
- Трансформери: GELU
- RNN/LSTM: Tanh (всередині), Sigmoid (для воріт)
- Вихід бінарної класифікації: Sigmoid
- Вихід мультикласової класифікації: Softmax
- Вихід регресії: Без активації (лінійний)
- GAN генератор: Tanh (вихід)
Практичне значення та контекст
Де застосовується
Інструменти даного типу широко застосовуються у навчальній та дослідницькій діяльності. Вони дозволяють швидко отримувати точні числові результати, перевіряти аналітичні розрахунки та моделювати різноманітні сценарії. Використання онлайн-калькуляторів значно прискорює роботу науковців, інженерів, студентів та спеціалістів-практиків, які щодня стикаються з відповідними обчислювальними задачами.
Часті запитання (FAQ)
📁 Категорія: IT