Описова статистика

Вимоги до опису використаних статистичних методів

Варто наводити тільки ті методи і прийоми, які дійсно використані автором і результати застосування яких представлені в даній роботі. Не слід використовувати незрозумілі кліше типу «відповідні статистичні методи», «статистика за Ст’юдентом», «традиційна статистична обробка», «за допомогою стандартних статистичних пакетів» без пояснення, у чому саме ці методи полягають. При цьому вибір статистичних методик повинний визначатися не простотою реалізації чи традицією, а винятково адекватністю підходів (наприклад, використовувати кореляційний аналіз виключно для кількісних змінних, для рангових – таблиці спряженості, критерій Ст’юдента – тільки при нормальному розподілі тощо).

При початковому описі первинного масиву даних необхідно наводити результати дескриптивної (описової) статистики. Для кількісних даних – результати перевірки на нормальність розподілу (значення критеріїв і достовірності висновку). У випадку відповідності нормальному вигляду розподілу слід навести значення обсягу вибірки (кількості спостережень), середніх арифметичних і хоча б одного з показників варіабельності (наприклад, помилки середніх, середньоквадратичні відхилення, довірчі інтервали). Для опису розподілів, що не є «нормальними», крім обсягу вибірки, необхідно вказувати значення медіани та інтерквартільний розмах. При традиційному використанні 25% і 75% процентилів, тобто верхньої границі 1-го і нижньої границі 4-го квартилей, цей запис може мати, наприклад, такий вигляд: Ме (25%; 75%) = 125 (53; 182).

Для згрупованих кількісних даних, а також рангових, бінарних і номінальних змінних зведену інформацію слід представляти у вигляді таблиць частот зустрічальності. У випадку подання даних у вигляді відносних величин (відсотків), крім самих їх значень варто наводити і показники варіабельності (помилки, довірчі інтервали). Рекомендується при описовому наведенні даних максимально використовувати графічні методи: стовпчасті та кругові діаграми, «ящики з вусами» тощо.

Слід звертати увагу на розрядність наведених у роботі цифрових значень. Дробову частину чисел (число знаків після коми), отриманих після комп'ютерних розрахунків, необхідно округлювати до мінімальної кількості, достатньої для сприймання та подальших розрахунків. Наприклад, при обробці цілих чисел середнє арифметичне варто вказувати тільки з одним знаком після коми, а помилку середнього – із двома.

Всі отримані наукові результати роботи, якщо вони можуть бути виражені кількісно, необхідно статистично підтверджувати.  При викладі матеріалів дослідження необхідно вказувати всі статистичні характеристики, які підтверджують висновки автора. Наприклад, при оцінці розходжень між «нормально розподіленими» вибірками – значення коефіцієнту Ст’юдента (t) і похибки висновку (p).

Значення вірогідності (помилки статистичного висновку – p) варто наводити або в традиційній формі порівняння на трьох рівнях значимості (наприклад, p > 0,05 чи p < 0,001), або що доцільніше, наводити його точне значення (p = 0,031). При цьому наведення повинне бути однаковим впродовж всієї роботи. Нагадуємо, що p не може дорівнювати нулю. Мінімальне його значення потрібно подавати у вигляді р < 0,001. Якщо для доведення результату дослідження використано декілька математичних підходів (критеріїв, формул), у роботі рекомендується наводити результати тільки одного, найефективнішого підходу. Наприклад, при використанні критерію Ст’юдента і критерію Фішера – наводити те значення, яке більш вірогідне.

При використанні кореляційного аналізу, крім розрахунку власне коефіцієнту кореляції, необхідно обов'язково розраховувати значення його помилки і вірогідності. Варто пам'ятати, що про наявність кореляційного зв'язку (не залежності!) свідчить не величина коефіцієнту кореляції, а тільки його вірогідність. Тому результати треба представляти у вигляді, наприклад, r = 0,56, p = 0,028. Поняття «сильна (слабка) кореляція» у загальному випадку – некоректні та можуть використовуватися тільки для порівняльного співставлення достовірних результатів в межах однієї задачі. Якщо розраховується парна кореляція між декількома перемінними, у тексті варто наводити значення тільки достовірних коефіцієнтів. При цьому ті зв'язки, які не відповідають апріорним припущенням автора, необхідно також наводити та пояснювати. При трактуванні результатів варто звертати увагу на спрямованість кореляції (негативна вона чи позитивна), про що свідчить знак коефіцієнту кореляції.

При використанні лінійного регресійного аналізу (як і в кореляційному аналізі) у роботі слід наводити не тільки отримані математичні моделі (значення коефіцієнтів регресії), але і помилки коефіцієнтів та їх вірогідності. Недостовірні коефіцієнти регресії повинні вилучатися з моделі. Рекомендується наводити характеристики адекватності моделі в цілому (коефіцієнт Фішера, p тощо). Всі основні висновки роботи повинні, по можливості, містити цифровий матеріал і бути підтверджені статистично. Наприклад, «були отримані зміни … на 34 %, p < 0,05».