Граничне значення дисперсії. Розрахунок дисперсії альтернативної ознаки

Варіація- Це відмінності індивідуальних значень ознаки в одиниць сукупності, що вивчається. Дослідження варіації має велике практичне значення та є необхідною ланкою в економічному аналізі. Необхідність вивчення варіації пов'язана з тим, що середня, будучи рівнодією, виконує своє основне завдання з різним ступенем точності: чим менше відмінності індивідуальних значень ознаки, що підлягають опосередковенню, тим однорідніша сукупність, а, отже, точніша і надійніша середня, і навпаки. Отже за рівнем варіації можна будувати висновки про межі варіації ознаки, однорідності сукупності за цією ознакою, типовості середньої, взаємозв'язку чинників, визначальних варіацію.

Зміна варіації ознаки в сукупності здійснюється за допомогою абсолютних та відноснихпоказників.

Абсолютні показники варіації включають:

Розмах варіації (R)

Розмах варіації— це різниця між максимальним та мінімальним значеннями ознаки

Він показує межі, у яких змінюється величина ознаки в досліджуваній .

приклад. Досвід роботи у п'яти претендентів на попередній роботі складає: 2,3,4,7 та 9 років.
Рішення: розмах варіації = 9 - 2 = 7 років.

Для узагальненої характеристики відмінностей значення ознаки обчислюють середні показники варіації, засновані на обліку відхилень від середньої арифметичної. За відхилення від середньої приймається різниця.

При цьому, щоб уникнути перетворення на нуль суми відхилень варіантів ознаки від середньої (нульова властивість середньої) доводиться або не враховувати знаки відхилення, тобто брати цю суму за модулем , або зводити значення відхилень у квадрат

Середнє лінійне та квадратичне відхилення

Середнє лінійне відхилення- Це з абсолютних відхилень окремих значень ознаки від середньої.

Середнє лінійне відхилення просте:

Досвід роботи у п'яти претендентів на попередній роботі складає: 2,3,4,7 та 9 років.

У прикладі: років;

Відповідь: 2,4 роки.

Середнє лінійне відхилення зваженезастосовується для згрупованих даних:

Середнє лінійне відхилення з його умовності застосовується практично порівняно рідко (зокрема, для характеристики виконання договірних зобов'язань щодо рівномірності поставки; в аналізі якості продукції з урахуванням технологічних особливостей виробництва).

Середнє квадратичне відхилення

Найбільш досконалою характеристикою варіації є середнє квадратичне відкладення, яке називають стандартом (або стандартним відхиленням). () дорівнює квадратному кореню із середнього квадрата відхилень окремих значень ознаки від :

Середнє квадратичне відхилення просте:

Середнє зважене квадратичне відхилення застосовується для згрупованих даних:

Між середнім квадратичним та середнім лінійним відхиленнями в умовах нормального розподілу має місце таке співвідношення: ~ 1,25.

Середнє квадратичне відхилення, будучи основною абсолютною мірою варіації, використовується щодо значень ординат кривої нормального розподілу, у розрахунках, пов'язаних з організацією вибіркового спостереження та встановленням точності вибіркових характеристик, і навіть в оцінці меж варіації ознаки в однорідної сукупності.

Дисперсія

Дисперсія- є середнім квадратом відхилень індивідуальних значень ознаки від їх середньої величини.

Дисперсія проста:

У нашому прикладі:

Дисперсія зважена:

Більш зручно обчислювати дисперсію за такою формулою:

яка виходить із основним шляхом нескладних перетворень. У цьому випадку середній квадрат відхилень дорівнює середній із квадратів значень ознаки мінус квадрат середньої.

Для несгрупованих даних:

Для згрупованих даних:

Варіація альтернативної ознакиполягає в наявності або відсутності досліджуваної властивості одиниць сукупності. Кількісно варіація альтернативної ознаки виражається двома значеннями: наявність у одиниці досліджуваної властивості позначається одиницею (1), яке відсутність — нулем (0). Частку одиниць, що мають досліджувану ознаку, позначають буквою , а частку одиниць, що не мають цієї ознаки - через . Враховуючи, що p + q = 1 (звідси q = 1 - p), а середнє значення альтернативної ознаки дорівнює

,

середній квадрат відхилень

Таким чином, дисперсія альтернативної ознаки дорівнює добутку частки одиниць, що мають дану властивість (), на частку одиниць, даною властивістю не мають ().

Максимальне значеннясередній квадрат відхилення (дисперсія) приймає у разі рівності часток, тобто. коли тобто. . Нижня межа цього показника дорівнює нулю, що відповідає ситуації, коли у сукупності відсутня варіація. Середнє квадратичне відхилення альтернативної ознаки:

Тож якщо у виготовленої партії 3% виробів виявилися нестандартними, то дисперсія частки нестандартних виробів , а середнє квадратичне відхилення чи 17,1%.

Середнє квадратичне відхиленнядорівнює квадратному кореню із середнього квадрата відхилень окремих значень ознаки від середньої арифметичної.

Відносні показники варіації

Відносні показники варіації включають:

Порівняння варіації кількох сукупностей за однією й тому ознакою, а тим більше за різними ознаками з допомогою абсолютних показників неможливо. У таких випадках для порівняльної оцінки ступеня відмінності будують відносні показники варіації. Вони обчислюються як відношення абсолютних показників варіації до середньої:

Розраховуються інші відносні характеристики. Наприклад, для оцінки варіації у разі асиметричного розподілу обчислюють відношення середнього лінійного відхилення до медіан.

оскільки завдяки властивості медіани сума абсолютних відхилень ознаки від її величини завжди менша, ніж від будь-якої іншої.

Як відносна міра розсіювання, що оцінює варіацію центральної частини сукупності, обчислюють відносне квартильне відхилення , де - середній квартиль напівсуми різниці третього (або верхнього) квартилю () і першого (або нижнього) квартилю ().

Насправді найчастіше обчислюють коефіцієнт варіації. Нижньою межею цього показника є нуль, верхньої межі він не має, проте відомо, що зі збільшенням варіації ознаки збільшується його значення. Коефіцієнт варіації є у ​​сенсі критерієм однорідності сукупності (у разі нормального розподілу).

Розрахуємо коефіцієнт варіації на основі середнього відхилення квадратичного для наступного прикладу. Витрата сировини на одиницю продукції склав (кг): за однією технологією при , а за іншою — за. Безпосереднє порівняння величини середніх квадратичних відхилень могло б призвести до невірного уявлення про те, що варіація витрати сировини за першою технологією інтенсивніша, ніж за другою (. Відносна міра варіації (дозволяє зробити протилежний висновок)

Приклад розрахунку показників варіації

На етапі відбору кандидатів до участі у здійсненні складного проекту фірма оголосила конкурс професіоналів. Розподіл претендентів з досвіду роботи показав середні результати:

Обчислимо середній виробничий досвід роботи, років

Розрахуємо дисперсію щодо тривалості досвіду роботи

Такий самий результат виходить, якщо використовувати для розрахунку іншу формулу розрахунку дисперсії

Обчислимо середнє квадратичне відхилення, років:

Визначимо коефіцієнт варіації, %:

Правило складання дисперсій

Для оцінки впливу факторів, що визначають варіацію, використовують прийом угруповання: сукупність розбивають на групи, вибравши як групувальну ознаку один із визначальних факторів. Тоді поряд із загальною дисперсією, розрахованою по всій сукупності, обчислюють внути групову дисперсію (або середню з групових) та міжгрупову дисперсію (або дисперсію групових середніх).

Загальна дисперсіяхарактеризує варіацію ознаки у всій сукупності, що склалася під впливом всіх факторів та умов.

Міжгрупова дисперсіявимірює систематичну варіацію, обумовлену впливом фактора, за яким проведено угруповання:

Внутрішньогрупова дисперсіяоцінює варіацію ознаки, що склалася за впливом інших факторів, що не враховуються в даному дослідженні і незалежну від фактора угруповання. Вона визначається як середня із групових дисперсій.

Всі три дисперсії () пов'язані між собою наступною рівністю, яка відома як правило складання дисперсій:

у цьому співвідношенні будуються показники, оцінюють вплив ознаки угруповання освіту загальної варіації. До них відносяться емпіричний коефіцієнт детермінації () та емпіричне кореляційне відношення ().

() характеризує частку міжгрупової дисперсії у спільній дисперсії:

і показує, наскільки варіація ознаки в сукупності обумовлена ​​фактором угруповання.

Емпіричне кореляційне відношення(!!\eta = \sqrt( \frac(\delta^2)(\sigma^2) )

оцінює тісноту зв'язку між досліджуваним та групувальним ознаками. Граничними значеннями є нуль та одиниця. Чим ближче до одиниці, тим тісніше зв'язок.

приклад. Вартість 1 кв. загальної площі(усл.од) на ринку житла по десяти 17-м будинкам покращеного планування становила:

При цьому відомо, що перші п'ять будинків було збудовано поблизу ділового центру, а решта — на значній відстані від нього.

Для розрахунку загальної дисперсії обчислимо середню вартість 1 кв. загальної площі: Загальну дисперсію визначимо за формулою :

Обчислимо середню вартість 1 кв. та дисперсію за цим показником для кожної групи будинків, що відрізняються місцем розташування щодо центру міста:

а)для будинків, збудованих поблизу центру:

б)для будинків, збудованих далеко від центру:

Варіація вартості 1 кв. загальної площі, викликана зміною розташування будинків, визначається величиною міжгрупової дисперсії:

Варіація вартості 1 кв. загальної площі, обумовлена ​​зміною інших показників, що не враховуються нами, вимірюється величиною внутрішньогрупової дисперсії

Знайдені дисперсії у сумі дають величину загальної дисперсії

Емпіричний коефіцієнт детермінації:

свідчить, що дисперсія вартості 1.кв.м. загальної площі на ринку житла на 81,8% пояснюється відмінностями в розташуванні новобудов по відношенню до ділового центру та на 18,2% іншими факторами.

Емпричне кореляційне ставлення свідчить про суттєвий впливна вартість житла розташування будинків.

Правило складання дисперсій для часткиознаки записується так:

а три види дисперсій частки для згрупованих даних визначається за такими формулами:

загальна дисперсія:

Формули міжгрупової та внутрішньогрупової дисперсій:

Характеристики форми розподілу

Для отримання уявлення про форму розподілу використовуються показники середнього рівня ( , ), Показники варіації, асиметрії та ексцесу.

У симетричних розподілах середня арифметична, мода та медіана збігаються. Якщо ця рівність порушується — розподіл асиметричний.

Найпростішим показником асиметрії є різниця, яка у разі правосторонньої асиметрії позитивна, а при лівосторонній – негативна.

Асиметричний розподіл

Для порівняння асиметрії кількох рядів обчислюється відносний показник

Як узагальнюючі характеристики варіації використовуються центральні моменти розподілу-го порядку , відповідні ступеня, у якому зводяться відхилення окремих значень ознаки від середньої арифметичної:

Для несгрупованих даних:

Для згрупованих даних:

Момент першого порядку відповідно до властивості середньої арифметичної дорівнює нулю.

Момент другого порядку є дисперсією.

Моменти третього та четвертого порядків використовуються для побудови показників, що оцінюють особливості форми емпіричних розподілів.

За допомогою моменту третього порядку вимірюють ступінь скошеності чи асиметричності розподілу.

- Коефіцієнт асиметрії

У симетричних розподілах, як і всі центральні моменти непарного порядку. Нерівність нулю центрального моменту третього порядку вказує на асиметричність розподілу. При цьому, якщо асиметрія правостороння і відносно максимальної ординати витягнута права гілка; якщо асиметрія лівостороння (на графіці це відповідає витягнутості лівої гілки).

Для характеристики гостроверхості або плосковершинності розподілу обчислюють відношення моменту четвертого порядку () до середньоквадратичного відхилення в четвертому ступені (). Для нормального розподілу, тому ексцес знаходять за формулою:

Для нормального розподілу перетворюється на нуль. Для гостроверхих розподілів, для плосковершинних.

Ексцес розподілу

Крім показників, розглянутих вище, узагальнюючою характеристикою варіації в однорідній сукупності служить певний порядок у зміні частот розподілу відповідно до змін величини ознаки, що вивчається, званий закономірністю розподілу.

Характер (тип) закономірності розподілу може бути виявлений шляхом побудови варіаційного ряду на підставі великого обсягу спостережень, а також такого вибору числа груп та величини інтегралів, при якому найвиразніше могла б виявитися закономірність.

Аналіз варіаційних рядів передбачає виявлення характеру розподілу (як результату дії механізму варіації), встановлення функції розподілу, перевірку відповідності емпіричного розподілу теоретичному.

Емпіричний розподіл, отримане на основі даних спостереження, графічно зображується кривою емпіричної розподілу за допомогою полігону.

На практиці зустрічаються різні типирозподілів, серед яких можна виділити симетричні та асиметричні, одновершинні та багатовершинні.

Встановити тип розподілу означає виразити механізм формування закономірності в аналітичній формі. Багатьом явищам та його ознакам властиві характерні форми розподілу, які апроксимуються відповідними кривими. При всьому різноманітті форм розподілу найбільшого поширення як теоретичні набули нормальний розподіл, розподіл Пауссона, біномінальний розподіл та ін.

Особливе місце у вивченні варіації належить нормальному закону завдяки його математичним властивостям. Для нормального закону виконується правило трьох сигм, яким варіація індивідуальних значень ознаки перебуває у межах від величини середньої. При цьому в межах знаходиться близько 70% усіх одиниць, а в межах 95%.

Оцінка відповідності емпіричного та теоретичного розподілів провадиться за допомогою критеріїв згоди, серед яких широко відомі критерії Пірсона, Романовського, Ястремського, Колмогорова.

23. Дисперсія альтернатив. Ознака

Дисперсія альтернативної ознаки (якщо в статистичній сукупності ознака змінюється так, що є тільки два варіанти, що взаємно виключають один одного, то така мінливість називається альтернативною) може бути обчислена за формулою:

Підставляючи до цієї формули дисперсії q =1- р, отримуємо:


p align="justify"> Коефіцієнт зростання K i визначається як відношення даного рівня до попереднього або базисного, показує відносну швидкість зміни ряду. Якщо коефіцієнт зростання виявляється у відсотках, його називають темпом зростання.

Коефіцієнт зростання базисний

Коефіцієнт зростання ланцюгової

24. Вивчення основної тенденції розвитку

Однією з найважливіших завдань статистики є визначення у лавах динаміки загальної тенденції розвитку явища. На розвиток явища у часі впливають різні чинники. Тому при аналізі динамі йдеться про основну тенденцію, досить стабільну (стійку) протягом вивченого етапу розвитку. Основною тенденцією розвитку (ТРЕНДОМ)називається плавна та стійка зміна рівня явища в часі, вільна від випадкових коливань. З цією метою ряди динаміки піддаються обробці методами укрупнення інтервалів, ковзної середньої та аналітичного вирівнювання. Найбільш простим методом вивчення основної тенденції у лавах динаміки є укрупнення інтервалів.Даний метод заснований на укрупненні періодів часу, до яких відносяться рівні динаміки (одночасно зменшується кількість інтервалів). Виявлення основної тенденції може здійснюватися також методом ковзної (рухомої) середньої.Сутність його полягає в тому, що обчислюється середній рівень з певного числа, зазвичай непарного (3, 5, 7 і т.д.), перших за рахунком рівнів ряду, потім - з того ж числа рівнів, але починаючи з другого за рахунком, далі – починаючи із середнього тощо. Отже, середня хіба що «ковзає» з низки динаміки, пересуваючись однією термін. Недоліком згладжування ряду є «вкорочування» згладженого ряду порівняно з фактичним, а отже, відбувається втрата інформації. Для того щоб дати кількісну модель, що виражає основну тенденцію зміни рівнів динамічного ряду в часі, використовується аналітичне вирівнювання ряду динаміки. Основним змістом методу аналітичного вирівнюванняу лавах динаміки і те, що загальна тенденціярозвитку розраховується як функція часу: де рівні динамічного ряду, обчислені за відповідним аналітичним рівнянням на момент часу.

^ Вирівнювання ряду динаміки по прямій:
. Параметри а 0 а 1 згідно з методом найменших квадратів знаходяться рішенням наступної системи нормальних рівнянь:
, де у - фактичні (емпіричні) рівні низки; t– час (порядковий номер періоду чи моменту часу). Розрахунок параметрів спрощується, якщо за початок відліку часу (t = 0) прийняти центральний інтервал (момент). Т.ч., система набуває вигляду
. Таким чином, отримуємо:
;
.
25.Аналіт.вирівн. за способом наймен. Квадрата

Метод найменших квадратів застосовується для більш точної кількісної оцінки динаміки явища, що вивчається. Найбільш простий і часто зустрічається у практиці є лінійна залежність, що описується рівнянням:

У х = а + вХ, або У теоретич. = У середнє + вХ,

де У х - теоретичні (розрахункові) рівні низки за кожний період;
а - середньоарифметичний показник рівня ряду, що розраховується за формулою:
а = ΣУ факт. /n;
в - параметр прямий, коефіцієнт, що показує різницю між теоретичними рівнями низки за суміжні періоди, визначається шляхом розрахунку за формулою: в = Σ(ХУ факт)/ΣХ 2
де n-число рівнів динамічного ряду;
X - тимчасові точки, натуральні числа, що проставляються від середини (центру) ряду в обидва кінці.

За наявності непарного ряду рівень, що займає серединне положення, приймається за 0. Наприклад, за 9 рівнів ряду: -4, -3, -2, -1, 0, +1, +2, +3, +4.

При парному числі рівнів дві величини, що займають серединне становище, позначаються через -1 і +1, проте - через 2 інтервали. Наприклад, за 6 рівнів ряду: -5, -3, -1, +1, +3, +5.

Розрахунки проводять у наступній послідовності:


  1. Представляють фактичні рівні динамічного ряду (Ф) (див. табл.).

  2. Підсумовують фактичні рівні низки та отримують суму У факт.

  3. Знаходять умовні (теоретичні) часові точки ряду X, щоб їх сума (ΣХ) дорівнювала 0.

  4. Зводять теоретичні часові точки квадрат і підсумовують їх, отримуючи ЕX 2 .

  5. Розраховують твір Х на У та підсумовують, отримуючи ΣХУ.

  6. Розраховують параметри прямої:
    а = ΣУ факт / n = Σ(Х У факт) / ΣX 2

  7. Підставляючи послідовно рівняння У х = а + аУ значення X, знаходять вирівняні рівні У х.

26. Аналіз сезонних коливань

При порівнянні квартальних та місячних даних багатьох соціально-економічних явищ часто виявляються періодичні коливання, що виникають під впливом зміни пір року. У статистиці періодичні коливання, які мають певний та постійний період, що дорівнює річному проміжку, називаються сезонні коливанняабо сезонні хвилі, динамічний ряд називають сезонним рядом динаміки. У статистиці існують методи вивчення та виміру сезонних коливань. Найпростіший – побудова спеціальних показників, які називаються індексами сезонності (Is). Сукупність цих показників відбиває сезонну хвилю. Індекси сезонності - % відношення фактичних (емпіричних) внутрішньогрупових рівнів до теоретичних (розрахункових) рівнів, що виступають як база порівняння. Для того, щоб виявити стійку сезонну хвилю, їх обчислюють за даними за кілька років (не менше 3), розподіленими за місяцями. До кожного місяця розраховується середня величина рівня ( ), потім обчислюється середньомісячний рівень для всього ряду y. Після цього визначається показник сезонної хвилі – індекс сезонності Is як відсоткове ставлення середніх кожного місяця до загального середньомісячного рівня низки, %. Середній індекс сезонності для 12 місяців має дорівнювати 100%, тоді сума індексів повинна становити 1200. Коли рівень виявляє тенденцію до зростання або зниження, то відхилення від постійного середнього рівня можуть спотворити сезонні коливання. У цьому випадку фактичні дані зіставляють з вирівняними, тобто отримані аналітичним вирівнюванням. Формула:
.

27.І.інтерполяція та екстраполяція

Під час вивчення тривалої динаміки іноді виникає необхідність визначення невідомих рівнів усередині низки динаміки.

Інтерполяцією називається приблизний розрахунок рівнів усередині однорідного періоду, коли відомі прилеглі по обидва боки рівні.

Екстраполяцією називається розрахунок недостатнього рівня, коли відомий рівень лише з одного боку. Якщо розраховується рівень у бік майбутнього, це називається перспективною екстраполяцією, у бік минулого – ретроспективною екстраполяцією.

Як інтерполяція, і екстраполяція повинні проводитися під час дії однієї закономірності. Передбачається, що закономірність розвитку, знайдена всередині ряду, зберігається.

Прийоми розрахунку невідомого рівня залежить від характеру зміни досліджуваного явища. При плавному характері зміни рівня можна недостатній рівень визначити: напівсумою двох прилеглих рівнів, за абсолютним середнім приростом, за середнім темпом зростання.

За збереження пост-х абсолютних приростів відсутніх ур-ней динамич.ряда розрахував-ся: = +

Початковий рівень

Якщо передбачаються постійні темпи зростання відсутній ур-нь ряду обчислюється по ф-ле:

Якщо у ряді динаміки відзначаються різкі коливання, краще застосовувати середній абсолютний приріст чи середній темпи зростання протягом період дослідження, як зазначено у формулах.

Індексами називають порівняльні відносні величини, які характеризують зміну складних соціально-економічних показників (показники, що складаються з елементів, що не підсумовуються) у часі, у просторі, порівняно з планом.

Індекс - це результат порівняння двох однойменних показників, при обчисленні якого слід розрізняти чисельник індексного відношення (порівнюваний або звітний рівень) та знаменник індексного відношення (базовий рівень, з яким проводиться порівняння). Вибір основи залежить від мети дослідження. Якщо вивчається динаміка, то базисну величину то, можливо взятий розмір показника періоді, попередньому звітному. Якщо необхідно здійснити територіальне порівняння, то за базу можна прийняти дані іншої території. За базу порівняння можуть прийматися планові показники, якщо необхідно використовувати індекси як виконання плану.

Індекси формують найважливіші економічні показники національної економіки та її окремих галузей. Індексні показники дозволяють здійснити аналіз результатів діяльності підприємств та організацій, що випускають найрізноманітнішу продукцію або займаються різними видамидіяльності. З допомогою індексів можна простежити роль окремих чинників для формування найважливіших економічних показників, виявити основні резерви виробництва. Індекси широко використовують у зіставленні міжнародних економічних показників щодо рівня життя, ділової активності, цінової політики тощо.

Існує два підходи в інтерпретації можливостей індексних показників: узагальнюючий (синтетичний) та аналітичний, які у свою чергу визначаються різними завданнями.

29. Агрегатні індекси

Загальний індексвідбиває зміна всіх елементів складного явища. Якщо індекси охоплюють в повному обсязі елементи, їх називають груповими чи субиндексами. Розрізняють індекси агрегатні та середні, обчислення яких і становить спеціальний прийом дослідження, що називається індексним шляхом. При побудові загальних індексів: 1. необхідно вибрати елементи, які слід поєднати в одному індексі; 2. правильно вибрати співвимірник чи вагу, тобто. постійна ознака. Вибір ваги залежить від того, якою індексується ознака – кількісна чи якісна. Основною формою загальних індексів є агрегатна форма. Індекс агрегатної форми будується методом сум. Агрегатна форма застосовується, якщо ми маємо дані поелементні у звітному та базисному періоді . Індекс товарооб:
; ін-с фіз обсяг прод
; ^ Індекс споживчих цін є загальним вимірником інфляції. величиною, що Індексується, в ньому буде ціна товару. При побудові індексу цін як ваги індексу зазвичай беруть кількість товарів, проданих у поточному (звітному) періоді. Агрегатний індекс цін зі звітними вагами вперше запропонований Пааше та носить його ім'я: формула агрегатного індексу цін Пааше
, де
- фактична вартість продукції (товарообіг) звітного періоду;
- умовна вартість товарів, реалізованих у звітному періоді за базовими цінами.

формулу агрегатного індексу цін Ласпейреса:

30.Ср.арифм. і гармон.інд.,зв'язок з агрег.

Основною формою загальних індексів є агрегатна форма. Індекс агрегатної форми будується методом сум. Агрегатна форма застосовується, якщо ми маємо дані поелементні у звітному та базисному періоді . Багато статистичних показників, що характеризують різні сторони суспільних явищ, знаходяться між собою у певному зв'язку (часто у вигляді твору). Статистика характеризує ці взаємозв'язки кількісно. Багато економічних показників тісно пов'язані між собою та утворюють індексні системи. Прийнято наступне практика факторного аналізу: якщо результативний показник = добутку об'ємного та якісного факторів, то якісний фактор фіксується на рівні базисного періоду; якщо визначається вплив якісного показника, то об'ємний чинник фіксується лише на рівні звітного періоду. Розглянемо побудову взаємозалежних індексів з прикладу індексів цін, фізичного обсягу продукції (якщо йдеться про відпускні ціни) чи фізичного обсягу товарообігу (якщо йдеться про роздрібні ціни) та індексу вартості продукції (товарообігу у фактичних цінах). Індекси фізичного обсягу та цін є факторними щодо індексу вартості продукції(Товарообігу у фактичних цінах):
, або
. Таким чином, добуток індексу цін на індекс фізичного обсягу продукції дає індекс вартості продукції (товарообігу у фактичних цінах). Індексна система дозволяє за двома відомими значеннями індексів знайти значення третього невідомого. Індекс фізичного обсягу продукції: ;Крім агрегатного способу розрахунку загальних індексів існує й інший спосіб, який полягає у розрахунку загальних індексів як середніх із відповідних індивідуальних індексів. До обчислення таких середньозважених індексіввдаються тоді, коли інформація, що є в розпорядженні, не дозволяє розрахувати агрегатний індекс. Так, якщо невідомі кількості вироблених окремих продуктів у натуральних вимірниках, але відомі індивідуальні індекси
та вартість продукції базисного періоду ( p 0 q 0 ), можна визначити середній арифметичний індекс фізичного обсягу продукції. Вихідною базою побудови є агрегатна форма. З даних можна отримати лише знаменник цієї формули. Для знаходження чисельника використовується формула індивідуального індексу обсягу продукції, з якої випливає, що q 1 = q 0 i q. Підставляючи цей вираз у чисельник агрегатної форми, отримуємо загальний індекс фізичного обсягу у формі середнього арифметичного індексу фізичного обсягу продукції , де терезами служить вартість окремих видів продукції в базисному періоді ( q 0 p 0 ):
.

Якщо дані представлені у вигляді аналітичного угруповання, то можна обчислити загальну дисперсію, міжгрупову і внутрішньогрупову (табл. 11).

Таблиця 11

Види дисперсій та правило складання дисперсій

Найменування дисперсії

Формула розрахунку

проста (незважена)

зважена

Загальна дисперсія вимірює варіацію ознаки у всій сукупності під впливом всіх факторів

Міжгрупова дисперсія вимірює систематичну варіацію, що виникла під впливом групувальної ознаки

Середня по тій групі; - Середня по всій сукупності; - Число одиниць сукупності-число одиниць в-тій групі

Внутрішньогрупова (приватна) дисперсія розраховується окремо для кожної групи

Індивідуальні значення ознаки в тій групі; - Середня групи; - Число одиниць у сукупності; - число одиниць у тій групі

Середня внутрішньогрупова дисперсія вимірює випадкову варіацію, що виникає під впливом всіх факторів, крім групувальної ознаки

Правило складання дисперсій

На підставі правила складання дисперсій розраховують:

1) емпіричний коефіцієнт детермінації показує частку варіації результативної ознаки, обумовлену варіацією групувальної ознаки:

2) емпіричне кореляційне відношення показує тісноту зв'язку між групувальною та результативною ознаками:

Емпіричне кореляційне відношення варіює від 0 до 1. При зв'язку немає, при повний зв'язок.

Проміжні значення оцінюються за шкалою Чеддока:

Дисперсія альтернативної ознаки

Альтернативний ознака - якісна ознака, яка може набувати лише одне значення з двох. Наприклад, стать - чоловіча або жіноча; сімейний стан - одружений чи ні; продукція - придатна чи бракована. Одна частина сукупності має альтернативну ознаку, інша немає. Частка одиниць, що володіють альтернативною (вивченою) ознакою, позначається - р, неволодіючих - q. Наявність альтернативної ознаки одиниць сукупності позначається 1, відсутність - 0.

Поняття варіації

Середня дає узагальнюючу характеристику всієї сукупності досліджуваного явища.

Варіацією ознакиназивається відмінність індивідуальних значень ознаки всередині досліджуваної сукупності.

Середня величина є абстрактною, узагальнюючою характеристикою ознаки сукупності, що вивчається, але вона не показує будову сукупності.

Середня величина не дає уявлення про те, як окремі значення ознаки, що вивчається, групуються навколо середньої, зосереджені вони поблизу або значно відхиляються від неї.

Якщо окремі значення ознаки близькі до середньої арифметичної, то цьому випадку середня добре представляє всю сукупність. І навпаки.

Коливання окремих значень характеризують показники варіації.

Термін «варіація» походить від латинського variatio – зміна, коливання, відмінність. Однак не всі відмінності прийнято називати варіацією.

Під варіацієюу статистиці розуміють такі кількісні зміни величини досліджуваної ознаки в межах однорідної сукупності, які обумовлені впливом дії різних факторів, що перехрещується. Розрізняють варіацію ознаки в абсолютних та відносних величинах. Абсолютна - R, L, σ, σ 2 .

Показники варіації

1 сукупність 2 сукупність
n=5 80, 100, 120, 200, 300 n=8 145, 150, 155, 160, 160, 162, 168, 180

80 100 120 x 200 300

Тож у разі виникає необхідність визначити варіацію ознаки, тобто. співвідношення окремих значень ряду щодо один одного.

Показники варіації

1. Розмах варіації являє собою різницю між максимальним і мінімальним значенням ознаки.

R = X max - X min

R 1 = 300-80 = 220 R 2 = 180-145 = 35

Практика: для однорідної сукупності, контролю якості продукції.

2. Показники, що враховують відхилення всіх варіантів від середньої арифметичної.

а) Середнє лінійне відхилення

б) Середнє квадратичне відхилення

Середнє лінійне відхиленняявляє собою середнє арифметичне абсолютних значень відхилень окремих варіантів від середньої.

для не згрупованих:

;

для згрупованих:

Практика:з його допомогою аналізується:

1. Склад працюючих

2. Ритмічність виробництва

3. Рівномірність постачання матеріалів

Недолік:цей показник ускладнює розрахунки ймовірного типу, ускладнює застосування методів математичної статистики

Середнє квадратичне відхилення (стандартне)– це

для не згрупованих даних

для згрупованих даних

Для помірно асиметричних розподілів

Середнє квадратичне відхилення, як і середнє лінійне відхилення - це абсолютний показник, що виражається в тих самих одиницях, що і середнє арифметичне.

Показники середнього квадратичного або середнього лінійного відхилень для двох сукупностей виявляються непорівнянними, якщо самі ознаки цих сукупностей неоднакові. Несопоставляются ці показники й у різних ознак однієї сукупності. Тобто. коли середні в обох сукупностях виражені в одних і тих самих одиницях виміру і однакові, зіставлення можливе і відобразить відмінності в варіації ознаки.

Середнє квадратичне відхилення є мірилом середньої надійності. Чим менше σ, тим краще середнє арифметичне відбиває собою всю сукупність, що представляється.

3. Дисперсіявикористовується для вимірювання коливання ознаки. Цей показник більш об'єктивно відображає міру варіації

для не згрупованих

для згрупованих

Відмінною рисоюданого показники і те, що з зведенні у квадрат питому вагу малих відхилень падає, а великих збільшується у сумі відхилень.

Це також абсолютний показник

Дисперсія має ряд властивостей, деякі з них дозволяють спростити її обчислення:

1. Дисперсія постійної величини дорівнює 0

2. Якщо всі варіанти значень ознаки (x) ↓ на те саме число, то дисперсія не зменшується

3. Якщо всі варіанти ↓ в одне і те ж число разів (K разів), то дисперсія ↓ у 2 рази

x f x "

x у 100 разів

Дисперсія σ дорівнює 0,909 * 10000 = 9090

Вище було розглянуто розрахунок показників варіації для кількісних ознак, але може ставитися завдання оцінки варіації якісних ознак. Наприклад, щодо якості виготовленої продукції можна розділити на придатну і браковану.

У такому разі йдеться про альтернативні ознаки.

Дисперсія альтернативної ознаки

Альтернативними ознакаминазиваються такі, якими одні одиниці сукупності мають, а інші ні. Наприклад, наявність виробничого стажу в абітурієнтів, науковий ступінь у викладачів ВНЗ тощо. Наявність ознаки одиниць сукупності умовно позначаємо через 1, а відсутність – 0. x 1 =1, x 2 =0. Частку одиниць, які мають ознакою (загалом) позначаємо через р, а частку одиниць, які мають – через q. Тобто. p+q=1, q=1-p.

Розрахуємо середнє значення альтернативної ознаки

; ;

Тобто. середнє значення альтернативної ознаки дорівнює частки одиниць, що мають дані ознаки, на частку одиниць, що не мають даних ознак.

Середнє квадратичне відхилення дорівнює Б p =

Перевіряється якість: 1000 готових виробів, 20 бракованих.

Знаходимо частку шлюбу: (20/1000) * 100% = 0,02%

Дисперсія має ряд властивостейякі дозволяють спростити розрахунок.

1. Якщо з усіх значень варіант відібрати якесь постійне число А, то середнє квадратичне відхилення від цього не зміниться.

Серед безлічі ознак, що вивчаються статистикою, існують ознаки, якими володіють одні одиниці сукупності і не володіють інші. Ці ознаки називаються альтернативними . Прикладом таких ознак є наявність бракованої продукції, науковий ступінь викладача вишу, навчання за певною спеціальністю тощо.

Припустимо, що вся статистична сукупність має nодиниць. З них mодиниць мають виділену ознаку, тоді залишилися nmодиниць не мають цієї ознаки.

Частку одиниць, що мають ознаку, позначимо: , Тоді нехай
частка одиниць, що не володіють цією ознакою.

р + q = 1

Одиницям х,що володіє даною ознакою, надамо значення х= 1, а не таким, що володіє – х= 0.

Середнє значення альтернативної ознаки :

=нар.

Тобто середнє значення альтернативної ознаки дорівнює частці одиниць, що мають дану ознаку.

Дисперсія альтернативної ознаки :

Тобто дисперсія альтернативної ознаки дорівнює добутку частки одиниць, що мають дану ознаку, на частку одиниць, що не мають даної ознаки.

Приклад: 5% виготовлених виробів - шлюб, тоді 95% виробів придатних. Дисперсія частки шлюбу дорівнює: σ 2 = 0,050,95 = 0,0475, а середнє квадратичне відхилення частки шлюбу становить σ =
чи 22%.

Граничне значення дисперсії альтернативної ознаки дорівнює 0,25; воно виходить за р=q= 0,5.

3. Дисперсійний аналіз

Варіація ознаки обумовлена ​​різними факторами, деякі з цих факторів можна виділити, якщо статистичну сукупність розбити на групи за якоюсь ознакою. Тоді, поряд з вивченням варіації ознаки по всій сукупності в цілому, стає можливим вивчити варіацію для кожної з її складових групи, а також і між цими групами. У найпростішому випадку, коли сукупність розчленована на групи за одним фактором, вивчення варіації досягається за допомогою обчислення та аналізу трьох видів дисперсій: загальної , міжгруповий і внутрішньогруповий .

Загальна дисперсія σ 2 заг вимірює варіацію ознаки у всій сукупності під впливом всіх чинників, що зумовили цю варіацію. Вона дорівнює середньому квадрату відхилень окремих значень ознаки хвід загальної за сукупністю середньої і може бути обчислена за формулою простийабо зваженийної дисперсії.

Міжгрупова дисперсія σ 2 міжгр характеризує систематичну варіацію результативної ознаки, обумовлену впливом ознаки-фактора, покладеного в основу угруповання. Вона дорівнює середньому квадрату відхилень групових (приватних) середніх від загальної середньої :

σ 2 міжгр =
,

де f- чисельність одиниць групи.

Внутрішньогрупова (приватна) дисперсія σ 2 i відбиває випадкову варіацію, т. е. частина варіації, зумовлену впливом неврахованих чинників і залежну від ознаки-фактора, покладеного основою угруповання. Вона дорівнює середньому квадрату відхилень окремих значень ознаки всередині групи хвід середньої арифметичної цієї групи (групової середньої) і може бути обчислена за формулою простийабо зваженої дисперсії:

σ 2 i =
(проста формула);

σ 2 i =
(Зважена).

На підставі внутрішньогрупової дисперсії з кожної групи (σ 2 i) можна визначити загальну середня юю із внутрішньогрупових дисперсій :

=
.

Згідно правилу складання дисперсій загальна дисперсія дорівнює сумі середньої з внутрішньогрупових та міжгрупових дисперсій:

σ 2 заг = σ 2 міжгр + .

Користуючись правилом складання дисперсій, можна завжди за двома відомими дисперсіями визначити третю - невідому, а також судити про силу впливу групувальної ознаки.

Чим більша частка міжгрупової дисперсії в загальній дисперсії, тим сильніший вплив групувальної ознаки на ознаку, що вивчається.

У статистичному аналізі широко використовується емпіричний коефіцієнт детермінації(η 2) - показник, що є частиною міжгрупової дисперсії в загальній дисперсії результативної ознаки і характеризує силу впливу групувальної ознаки на утворення загальної варіації:

η 2 =
.

Емпіричний коефіцієнт детермінації показує частку варіації результативної ознаки упід впливом факторної ознаки х(решта загальної варіації уобумовлюється варіацією інших чинників). За відсутності зв'язку емпіричний коефіцієнт детермінації η 2 дорівнює нулю, а за функціонального зв'язку - одиниці. Якщо, наприклад, η 2 = 0,666, це означає, що на 66,6% варіація досліджуваного показника обумовлена ​​відмінностями у значеннях ознаки-фактора, покладеної в основу угруповання, та на 33,4% - впливом інших факторів.

Емпіричне кореляційне ставлення - це корінь квадратний з емпіричного коефіцієнта детермінації:

η =
.

Воно показує тісноту зв'язку між групувальною та результативною ознаками.

Емпіричне кореляційне відношення η, як і η 2 може приймати значення від 0 до 1.

Якщо зв'язок відсутній, то кореляційне відношення η = 0, тобто всі групові середні дорівнюватимуть між собою, міжгрупової варіації не буде. Отже, групувальна ознака ніяк не впливає на утворення загальної варіації.

Якщо зв'язок функціональний, то кореляційне відношення η = 1. У цьому випадку міжгрупова дисперсія дорівнює загальній дисперсії (σ 2 міжгр = σ 2), тобто внутрішньогрупової варіації не буде. Це означає, що групувальна ознака цілком визначає варіацію результативної ознаки, що досліджується.

Чим значення кореляційного відношення ближче до одиниці, тим тісніше, ближче до функціональної залежності зв'язок між ознаками.