Зміст статті
1. Основна ідея: розкласти на "цеглинки"
Уявіть акорд на гітарі. Ви чуєте один складний звук, але насправді це суміш кількох простих: основна нота, перший обертон, другий обертон... Кожен обертон — це синусоїда певної частоти.
Жан-Батист Жозеф Фур'є довів у 1822 році: будь-який сигнал можна представити як суму синусоїд. Це як сказати: будь-який колір фарби — це суміш трьох базових кольорів (RGB). Тільки замість 3 кольорів — нескінченно багато частот.
Ключова ідея Фур'є: перейти від "сигнал у часі" → "сигнал у частоті". Тобто з'ясувати, яких частот і скільки міститься в будь-якому коливанні.
Уявіть музику як коктейль. Перетворення Фур'є — це як хімік, який аналізує коктейль і каже: "Тут 30% соку манго, 45% ананасу і 25% кокосового молока." Для звуку це буде: "200 Гц — 15%, 440 Гц — 40%, 1200 Гц — 25%..."
2. Математика: що насправді рахує Фур'є
Неперервне перетворення Фур'є — це інтеграл:
де:
- f(t) — оригінальний сигнал у часі
- F(ω) — "спектр" — скільки частоти ω міститься в сигналі
- e−iωt = cos(ωt) − i·sin(ωt) — комплексна синусоїда (формула Ейлера)
По суті ми "запитуємо" сигнал: "Скільки в тобі частоти ω?" — і множимо на відповідну синусоїду цієї частоти, потім інтегруємо. Якщо частота є у сигналі — добуток буде великим. Якщо ні — майже нулем.
Дискретне перетворення Фур'є (ДПФ)
Комп'ютери працюють з числами, не з неперервними функціями. Тому існує дискретне перетворення Фур'є (DFT):
А Швидке перетворення Фур'є (FFT) робить те саме N² раз швидше — за O(N log N) операцій замість O(N²). Саме FFT стало можливим у 1965 році і революціонізувало цифрову обробку сигналів.
3. Як це застосовується до звуку
Мікрофон записує коливання тиску повітря як функцію часу — це тисячі чисел за секунду (наприклад, 44100 семплів/с для CD-якості). Це дуже складний сигнал.
Після FFT ми отримуємо спектрограму — графік, де вісь X — частота (Гц), а вісь Y — амплітуда цієї частоти. Людський голос займає переважно 100–8000 Гц. Басова гітара — 40–300 Гц. Флейта — 260–4200 Гц.
🎵 Приклад: нота Ля (A4)
Нота A4 = 440 Гц. У спектрі чистого камертона буде лише один пік — на 440 Гц.
У скрипки та фортепіано при тій самій ноті спектр різний: різна кількість і амплітуда обертонів (880 Гц, 1320 Гц тощо). Саме це робить їх звучання несхожим — тембр!
4. Shazam та музичний fingerprint
Shazam записує 10–15 секунд аудіо, будує його спектрограму через FFT, потім знаходить яскраві точки — пари (час, частота) де амплітуда локально максимальна. Це і є fingerprint пісні.
Потім алгоритм порівнює fingerprint вашого рядку з базою мільярдів fingerprints. Через геш-таблицю це дуже швидко — буквально мікросекунди на порівняння.
Важливо: Shazam стійкий до шуму, тому що fingerprint будується тільки з "піків" спектра — вони найбільш виражені навіть у шумному середовищі.
5. MP3: стиснення через Фур'є
MP3 використовує модифіковане косинусне перетворення (MDCT) — варіант перетворення Фур'є. Алгоритм:
- Сигнал ділиться на короткі фрейми (20–30 мс кожен)
- До кожного фрейму застосовується MDCT — отримуємо спектр
- Психоакустична модель визначає, які частоти людське вухо не чує в даному контексті (ефект маскування)
- «Непочутні» частоти викидаються або квантуються грубіше
- Отримані дані стискаються через алгоритм Хаффмана
Результат: файл у 10 разів менший при непомітній для більшості людей різниці якості. 128 kbps MP3 ~ 3.6 МБ/хв проти 10 МБ/хв для WAV.
6. Де ще використовують перетворення Фур'є
- ЕКГ та ЕЕГ — аналіз серцевого ритму та мозкових хвиль
- МРТ — реконструкція зображень з k-простору через 2D FFT
- WiFi та 4G/5G — модуляція OFDM базується на зворотному FFT
- Сейсмологія — аналіз землетрусів за частотними компонентами
- Обробка зображень — фільтрація та стиснення (JPEG використовує DCT)
- Квантова хімія — аналіз електронних хвильових функцій
- Астрономія — пошук екзопланет за коливаннями яскравості зірок
Цікавий факт: FFT є одним з найважливіших алгоритмів XX-XXI ст. У 2000 році журнал Computing in Science and Engineering включив FFT до топ-10 алгоритмів, що найбільше вплинули на науку та техніку за останні 50 років.
Про цю статтю
Ця стаття є частиною бази знань calculator.party — освітнього ресурсу, що поєднує теорію з практичними інструментами. Матеріал орієнтований на студентів, учнів і фахівців, що прагнуть глибокого розуміння теми. Тут зібрані ключові концепції, формули та реальні приклади застосування.
Навіщо читати цю статтю
Після прочитання ви зможете впевнено пояснити тему, вирішувати практичні задачі та застосовувати знання у навчанні й роботі. Стаття охоплює теоретичне підґрунтя і числові приклади, що полегшують запам'ятовування матеріалу.