← Блог · 📊 Математика

Перетворення Фур'є простою мовою: розкладаємо звук на частоти

Як Shazam розпізнає пісні за 5 секунд, як MP3 зменшує файл у 10 разів без video якості, і як лікарі "бачать" серцебиття — все це один і той самий математичний інструмент.

1. Основна ідея: розкласти на "цеглинки"

Уявіть акорд на гітарі. Ви чуєте один складний звук, але насправді це суміш кількох простих: основна нота, перший обертон, другий обертон... Кожен обертон — це синусоїда певної частоти.

Жан-Батист Жозеф Фур'є довів у 1822 році: будь-який сигнал можна представити як суму синусоїд. Це як сказати: будь-який колір фарби — це суміш трьох базових кольорів (RGB). Тільки замість 3 кольорів — нескінченно багато частот.

Ключова ідея Фур'є: перейти від "сигнал у часі" → "сигнал у частоті". Тобто з'ясувати, яких частот і скільки міститься в будь-якому коливанні.

Уявіть музику як коктейль. Перетворення Фур'є — це як хімік, який аналізує коктейль і каже: "Тут 30% соку манго, 45% ананасу і 25% кокосового молока." Для звуку це буде: "200 Гц — 15%, 440 Гц — 40%, 1200 Гц — 25%..."

2. Математика: що насправді рахує Фур'є

Неперервне перетворення Фур'є — це інтеграл:

F(ω) = ∫+∞−∞ f(t) · e−iωt dt

де:

По суті ми "запитуємо" сигнал: "Скільки в тобі частоти ω?" — і множимо на відповідну синусоїду цієї частоти, потім інтегруємо. Якщо частота є у сигналі — добуток буде великим. Якщо ні — майже нулем.

Дискретне перетворення Фур'є (ДПФ)

Комп'ютери працюють з числами, не з неперервними функціями. Тому існує дискретне перетворення Фур'є (DFT):

X[k] = Σn=0N−1 x[n] · e−i2πkn/N

А Швидке перетворення Фур'є (FFT) робить те саме N² раз швидше — за O(N log N) операцій замість O(N²). Саме FFT стало можливим у 1965 році і революціонізувало цифрову обробку сигналів.

3. Як це застосовується до звуку

Мікрофон записує коливання тиску повітря як функцію часу — це тисячі чисел за секунду (наприклад, 44100 семплів/с для CD-якості). Це дуже складний сигнал.

Після FFT ми отримуємо спектрограму — графік, де вісь X — частота (Гц), а вісь Y — амплітуда цієї частоти. Людський голос займає переважно 100–8000 Гц. Басова гітара — 40–300 Гц. Флейта — 260–4200 Гц.

🎵 Приклад: нота Ля (A4)

Нота A4 = 440 Гц. У спектрі чистого камертона буде лише один пік — на 440 Гц.

У скрипки та фортепіано при тій самій ноті спектр різний: різна кількість і амплітуда обертонів (880 Гц, 1320 Гц тощо). Саме це робить їх звучання несхожим — тембр!

4. Shazam та музичний fingerprint

Shazam записує 10–15 секунд аудіо, будує його спектрограму через FFT, потім знаходить яскраві точки — пари (час, частота) де амплітуда локально максимальна. Це і є fingerprint пісні.

Потім алгоритм порівнює fingerprint вашого рядку з базою мільярдів fingerprints. Через геш-таблицю це дуже швидко — буквально мікросекунди на порівняння.

Важливо: Shazam стійкий до шуму, тому що fingerprint будується тільки з "піків" спектра — вони найбільш виражені навіть у шумному середовищі.

5. MP3: стиснення через Фур'є

MP3 використовує модифіковане косинусне перетворення (MDCT) — варіант перетворення Фур'є. Алгоритм:

  1. Сигнал ділиться на короткі фрейми (20–30 мс кожен)
  2. До кожного фрейму застосовується MDCT — отримуємо спектр
  3. Психоакустична модель визначає, які частоти людське вухо не чує в даному контексті (ефект маскування)
  4. «Непочутні» частоти викидаються або квантуються грубіше
  5. Отримані дані стискаються через алгоритм Хаффмана

Результат: файл у 10 разів менший при непомітній для більшості людей різниці якості. 128 kbps MP3 ~ 3.6 МБ/хв проти 10 МБ/хв для WAV.

6. Де ще використовують перетворення Фур'є

Цікавий факт: FFT є одним з найважливіших алгоритмів XX-XXI ст. У 2000 році журнал Computing in Science and Engineering включив FFT до топ-10 алгоритмів, що найбільше вплинули на науку та техніку за останні 50 років.

Про цю статтю

Ця стаття є частиною бази знань calculator.party — освітнього ресурсу, що поєднує теорію з практичними інструментами. Матеріал орієнтований на студентів, учнів і фахівців, що прагнуть глибокого розуміння теми. Тут зібрані ключові концепції, формули та реальні приклади застосування.

Навіщо читати цю статтю

Після прочитання ви зможете впевнено пояснити тему, вирішувати практичні задачі та застосовувати знання у навчанні й роботі. Стаття охоплює теоретичне підґрунтя і числові приклади, що полегшують запам'ятовування матеріалу.

Часті запитання (FAQ)

Що таке Перетворення Фур'є простою мовою: розкладаємо звук на частоти і чому це важливо знати?
Перетворення Фур'є простою мовою: розкладаємо звук на частоти — ключова тема в різних галузей науки. Розуміння її основ дає змогу вирішувати практичні задачі, успішно складати іспити та застосовувати знання в реальних ситуаціях. Стаття розкриває концепцію доступними словами з конкретними прикладами.
Які ключові формули та методи використовуються в перетворення фур'є простою мовою: розкладаємо звук на частоти?
Основні формули та методи для перетворення фур'є простою мовою: розкладаємо звук на частоти охоплюють як аналітичні підходи, так і числові алгоритми. У статті наведені всі ключові вирази з поясненням кожного позначення та вказівкою одиниць вимірювання.
Де в реальному житті застосовується перетворення фур'є простою мовою: розкладаємо звук на частоти?
Сфери застосування перетворення фур'є простою мовою: розкладаємо звук на частоти надзвичайно широкі: освіті, науці, інженерії та повсякденному житті. Знання цієї теми відкриває кар'єрні можливості в інженерії, науці, фінансах та IT-галузі.
Як розрахувати перетворення фур'є простою мовою: розкладаємо звук на частоти онлайн?
На calculator.party є безкоштовні онлайн-калькулятори з тематики 'Перетворення Фур'є простою мовою: розкладаємо звук на частоти'. Достатньо ввести вхідні дані — і ви миттєво отримаєте точний результат з покроковим поясненням. Це ідеально для перевірки ручних розрахунків.
Яка різниця між перетворення фур'є простою мовою: розкладаємо звук на частоти та суміжними темами?
Стаття чітко описує межі тематики 'Перетворення Фур'є простою мовою: розкладаємо звук на частоти', порівнюючи її з близькими поняттями. Чітке розуміння відмінностей допомагає уникнути типових помилок та плутанини при розв'язанні задач.