загрузка...
загрузка...
Вибіркові оцінки середньої та частки - Статистика PDF Друк e-mail
Статистика - Статистика - Герасименко С. С., Головач А. В., Єріна А. М.

6.2. Вибіркові оцінки середньої та частки


У статистиці використовують два типи оцінок параметрів генеральної сукупності — точкові та інтервальні. Точкова оцінка — це значення параметра за даними вибірки: вибіркова середня  та вибіркова частка р . Інтервальною оцінкою називають інтервал значень параметра, розрахований за даними вибірки для певної ймовірності, тобто довірчий інтервал . Чим менший довірчий інтервал, тим точніша вибіркова оцінка.

Межі довірчого інтервалу визначаються на основі точкової оцінки та граничної похибки вибірки :

для середньої

;

для частки

,

де m — стандартна (середня) похибка вибірки; t — квантиль розподілу ймовірностей (довірче число).

Стандартна похибка вибірки m є середнім квадратичним відхиленням вибіркових оцінок від значення параметра в генеральній сукупності. Як доведено в теорії вибіркового методу, дисперсія вибіркових середніх у n раз менша від дисперсії ознаки в генеральній сукупності, тобто . Оскільки на практиці генеральна дисперсія ознаки  невідома, у розрахунках можна використати вибіркову незсунену оцінку дисперсії: для повторної вибірки , для безповторної . Отже, формули стандартної похибки:

для повторної вибірки

,

для безповторної вибірки

.

Щодо практичного використання наведених формул слід урахувати таке:

а) дисперсія частки , де р і q — частки вибіркової сукупності, яким відповідно властива і невластива ознака;

б) у великих за обсягом сукупностях (30 і більше одиниць) поправка  не вносить істотних змін у розрахунки, а тому береться до уваги лише у вибірках з невеликою кількістю елементів;

в) коригуючий множник для безповторної вибірки , тобто при малих величинах  (наприклад, для 2 чи 5%-ної вибірки) наближається до 1, а тому розрахунок можна виконувати за формулою для повторної вибірки; при 10%-ній вибірці коригуючий множник становить 0,949, при 20%-ній — 0,894.

Гранична похибка вибірки — це максимально можлива похибка для взятої ймовірності F ( x ). Довірче число t показує, як співвідносяться гранична та стандартна похибки. Як бачимо з рис. 6.1, з імовірністю 0,683 гранична похибка не вийде за межі стандартної , з імовірністю 0,954 вона не перевищить ± 2m, з імовірністю 0,997 — ± 3m. На практиці найчастіше застосовують імовірність 0,954 (на рис. 6.1 незаштрихована частина площини).


Рис. 6.1. Співвідношення ймовірностей та ширини довірчих меж


З урахуванням сказаного формули граничних похибок середньої та частки записують так:



Повторна вибірка

Безповторна вибірка

для середньої

;

;

для частки

;

.


Як видно з формул, розмір граничної похибки залежить:

  • від варіації ознаки s 2 ;
  • обсягу вибірки n ;
  • частки вибірки в генеральній сукупності ;
  • узятого рівня ймовірності, якому відповідає квантиль t.

Чим більша варіація ознаки в генеральній сукупності, тим більша в середньому похибка вибірки. Залежність похибки від обсягу вибіркової сукупності обернено пропорційна. Щоб зменшити похибку вибірки вдвічі, обсяг останньої має зрости в 4 рази. При безповторному доборі похибка буде тим менша, чим більша частка обстеженої сукупності . Очевидно, при суцільному спостереженні похибка репрезентативності відсутня (D = 0).

При малих вибірках ( n < 30 ), у розрахунках стандартних похибок використовують вибіркові оцінки дисперсій . Квантилі t визначають за розподілом імовірностей Стьюдента. У табл. 6.3 наведено деякі значення квантилів t розподілу Стьюдента для ймовірності 0,95 і числа ступенів свободи , тобто числа незалежних величин, необхідних для визначення даної характеристики, k n – 1. При n > 30 квантилі розподілу Стьюдента і нормального розподілу збігаються.

Розглянемо методику вибіркового оцінювання середньої та частки на прикладі обстеження 225 домогосподарств регіону. За результатами 1%-ної вибірки 70% грошового доходу домогосподарства витрачають на харчування. Середньодушові витрати на харчування за місяць становлять 82 грн. при дисперсії 8510.

Визначимо межі середньодушових витрат на харчування з імовірністю 0,954 ( t = 2).

Гранична похибка

грн.

Це дає підставу стверджувати з імовірністю 0,954, що середньодушові витрати на харчування в цілому по регіону щонайменше 69,7 грн. і не перевищують 94,3 грн.:

.

Перш ніж визначити граничну похибку частки витрат на харчування, необхідно обчислити її дисперсію:

= 0,7(1 – 0,7) = 0,21.

Гранична похибка

або 6,1%.

Щодо інтервалу можливих значень частки витрат на харчування в генеральній сукупності, то межі його становлять 63,9 і 76,1%:

.

У статистичному аналізі часто постає потреба порівняти похибки вибірки різних ознак або однієї і тієї самої ознаки в різних сукупностях.

Такі порівняння виконують за допомогою відносної похибки , яка показує, на скільки процентів вибіркова оцінка може відхилятися від параметра генеральної сукупності. Відносна стандартна похибка середньої — це коефіцієнт варіації вибіркових середніх:

.

Її розмір можна визначити також на основі коефіцієнта варіації ознаки V x :

для повторної вибірки

;

для безповторної вибірки

.

Так, у нашому прикладі відносна похибка середньодушових витрат на харчування

.

Такий самий результат дає розрахунок відносної похибки на основі коефіцієнта варіації :

;


Вибіркову похибку частки  також слід порівнювати з часткою р . Адже одна і та сама похибка  = 2% для р = 80% є малою, для р = 40% — допустимою, для р = 10% — завеликою. Відносну похибку частки обчислюють за формулою

.

У нашому прикладі відносна похибка частки витрат на харчування становить 4,36%:

,

що значно менше порівняно з похибкою середньодушових витрат на харчування (7,5%).

Отже, відносну похибку можна використати для порівняння вибіркових оцінок різних ознак. На практиці достатнім рівнем точності вважається  Іноді використовують граничну відносну похибку, яка враховує ймовірність статистичного висновку .

 

Бібліотека онлайн Lection.com.ua створена для студентів та учнів, які прагнуть вчитися і пізнавати нове. Наша онлайн бібліотека підручників має близько 25 книг, ми намагаємося оновлювати нашу базу підручників кожен місяць. Сподіваємося наш сайт вам подобається. З повагою адміністрація.