Калькулятор хі-квадрат (chi-square)

Критерій хі-квадрат Пірсона використовується для порівняння спостережуваних та очікуваних частот, а також для перевірки незалежності категоріальних змінних у таблицях спряженості. Інструмент підтримує базові сценарії: тест узгодженості та 2x2 тест незалежності.

Ви можете ввести дані списком для goodness-of-fit або заповнити 2x2 таблицю. Калькулятор повертає статистику chi-square, ступені свободи і наближене p-value (через нормальне наближення Вілсона-Хілферті для df > 1).

Обчислення

Формули

Chi-square = Σ ((O_i - E_i)^2 / E_i) df (goodness-of-fit) = k - 1 - m k - кількість категорій m - кількість оцінених параметрів df (r x c таблиця) = (r - 1) * (c - 1) Для 2x2: df = 1

Очікувані частоти для 2x2

E_ij = (row_i_total * col_j_total) / grand_total Рекомендація: всі E_ij >= 5 для класичного наближення Pearson chi-square.

Практичне значення та контекст

Медицина: асоціація між лікуванням і результатом. Соціологія: перевірка зв'язку між категоріальними ознаками в опитуваннях. Бізнес-аналітика: A/B категоріальні конверсії. Біологія: перевірка моделей розщеплення та популяційних гіпотез.

Часті запитання (FAQ)

Коли використовувати chi-square, а коли t-тест?
Chi-square застосовується для частот у категоріальних даних. t-тест використовується для порівняння середніх числових величин. Це різні типи задач і різні статистичні припущення.
Що робити, якщо очікувані частоти малі?
Якщо очікувані частоти в клітинках дуже малі (часто < 5), класичне chi-square наближення може бути неточним. Для 2x2 доцільно розглянути точний критерій Фішера.
Що означає p-value у цьому калькуляторі?
p-value показує, наскільки екстремальне спостереження за умови нульової гіпотези. Малий p-value свідчить, що дані слабо узгоджуються з H0, і може бути підставою її відхилити.
Чому p-value позначене як наближене?
Для df > 1 використане нормальне наближення CDF хі-квадрат розподілу (Wilson-Hilferty), яке добре працює у типових умовах, але не замінює точні бібліотеки статистики для критично важливих звітів.
Чи достатньо лише p-value для висновку?
Ні. Рекомендується додатково аналізувати ефект, розмір вибірки, довірчі інтервали та контекст задачі. Статистична значущість не завжди означає практичну значущість.