До характеристик розсіювання не належить. Характеристики статистичного розподілу. Система застосування добрива у сівозміні

Для вибірки можна визначити ряд числових характеристик, які аналогічні основним числовим характеристикам випадкових величин теоретично ймовірностей (математичне очікування, дисперсія, середнє квадратичне відхилення, мода, медіана) і є у певному сенсі (який буде ясний далі) їх наближеним значенням.

Нехай дано статистичне розподілення вибірки обсягу nдля частот та відносних частот:

x i

x 1

x 2

x k

n i

n 1

n 2

n k


x i

x 1

x 2

x k

w i

w 1

w 2

w k

Вибірковим середнімназивається середнє арифметичне значення всіх варіантів:

Якщо внести множник під знак суми, то отримаємо формулу для вибіркового середнього через відносні частоти:

.

Зазначимо, що у разі інтервального ряду вибіркове середнє обчислюється за тими ж формулами, якщо як числа х 1 , …, х kвзяти середини інтервалів: , … ,.

Вибірковою дисперсієюназивається середнє арифметичне квадратів відхилень значень вибірки від їх вибіркового середнього:

Знову вносячи множник під знак суми, отримаємо формулу для вибіркової дисперсії через відносні частоти:

Нескладні перетворення призводять до зручнішої формули для обчислення вибіркової дисперсії

,

де є вибіркове середнє квадрата досліджуваної випадкової величини, тобто.

Якщо вибірка представлена ​​інтервальним статистичним рядом, то формули для вибіркової дисперсії залишаються ті ж самі, де, як звичайно, як чисел х 1 , …, х kберуться середини інтервалів: , … ,.

Вибірковим середнім квадратичним відхиленнямназивається квадратний корінь із вибіркової дисперсії

.

Розмахом варіації Rназивається різниця між максимальним та мінімальним значенням у вибірці. Якщо варіанти у вибірці ранжовані (розміщені у порядку, що зростає), то

.

Коефіцієнт варіаціївизначається за формулою

.

Модою М проВаріаційного ряду називається варіант, що має найбільшу частоту (або відносну частоту).

Медіаною М еВаріаційного ряду називається число, яке є його серединою. Для дискретного ряду з непарним числом варіант медіана дорівнює його серединному варіанту. Якщо ж число варіант парне, то Медіна дорівнює середньому (тобто напівсумі) двох серединних варіантів.

До основних статистичних характеристик низки вимірів (варіаційного ряду) відносяться характеристики положення (середні характеристики, або центральна тенденція вибірки); характеристики розсіювання (варіації, або коливання) та характеристики форми розподілу.

До характеристикам становищавідносяться середнє арифметичне значення (середнє значення), мода та медіана.

До характеристик розсіювання(варіації, або коливання) відносяться: розмах варіації, дисперсія, середнє квадратичне (стандартне) відхилення, помилка середньої арифметичної (помилка середньої), коефіцієнт варіації та ін.

До характеристик формивідносяться коефіцієнт асиметрії, міра скошеності та ексцес.

51. Оцінка властивостей генеральної сукупності. Точкова та інтервальна оцінка. Довірчий інтервал. Рівень значущості

Оцінка параметрів генеральної сукупності

Існують точкові та інтервальні оцінки генеральних параметрів.

Точковий одним числом. До таких оцінок відносяться, наприклад,

Для того щоб статистичні оцінки давали «хороші» наближення параметрів, що оцінюються, вони повинні бути:

    незміщеними;

    ефективними;

    заможними.

Оцінка називається незміщеною, якщо математичне очікування її вибіркового розподілу співпадає зі значенням генерального параметра.

Точкова оцінканазивається ефективною, якщо вона має найменшу дисперсію вибіркового розподілу проти іншими аналогічними оцінками, тобто. виявляє найменшу випадкову варіацію.

Точкова оцінка називається заможною, якщо зі збільшенням обсягу вибіркової сукупності вона прагне величині генерального параметра.

Наприклад,вибіркова середня є заможна, незміщена оцінка генеральної середньої. Для вибірки з нормальної генеральної сукупності ця оцінка є також ефективною.

При вибірці малого обсягу точкова оцінка може значно відрізнятися від параметра, що оцінюється, тобто. приводити до грубих помилок. Тому при невеликому обсязі вибірки слід користуватися інтервальними оцінками.

Інтервальнийназивають оцінку, яка визначається двома числамикінцями інтервалу довірчого інтервалу.

Інтервальні оцінки дозволяють встановити точність та надійність оцінок.

Для оцінки генерального параметра за допомогою довірчого інтервалу потрібні три величини:

Наприклад, довірчий інтервал для генеральної середньої знаходиться за формулою: .

Довірчий інтервал- термін, що використовується в математичній статистиці при інтервальній оцінці статистичних параметрів, більш переважною при невеликому обсязі вибірки, ніж точкова.

Рівень значущості - це ймовірність того, що ми визнали відмінності суттєвими, а вони насправді випадкові.

Коли ми вказуємо, що відмінності достовірні на 5% рівні значимості, або при р< 0,05 , то ми маємо на увазі, що ймовірність того, що вони все-таки недостовірні, становить 0,05.

Коли ми вказуємо, що відмінності достовірні на 1% рівні значимості, або при р< 0,01 , то маємо на увазі, що ймовірність того, що вони все-таки недостовірні, становить 0,01.

Якщо перекласти все це більш формалізований мову, то рівень значущості - це можливість відхилення нульової гіпотези, тоді як вона правильна.

Помилка, яка полягає в тій, що ми відхилили нульову гіпотезу, тоді як вона вірна, називається помилкою 1 роду. (Див. табл. 1)

Табл. 1. Нульова та альтернативні гіпотези та можливі стани перевірки.

Імовірність такої помилки зазвичай позначається як α. По суті, ми мали б вказувати в дужках не р < 0,05 або р < 0,01 а α < 0,05 або α < 0,01.

Якщо ймовірність помилки – це α , то можливість правильного рішення: 1-α. Що менше α, то більша ймовірність правильного рішення.

Історично склалося так, що в психології прийнято вважати нижчим рівнем статистичної значущості 5% рівень (р≤0,05): достатнім – 1% рівень (р≤0,01) і вищим 0,1% рівень (р р≤0,001), тому в таблицях критичних значень зазвичай наводяться значення критеріїв, що відповідають рівням статистичної значущості р≤0,05 та р≤0,01, іноді – р≤0,001. Для деяких критеріїв у таблицях вказано точний рівень значущості їх різних емпіричних значень. Наприклад, для φ*=1,56 р=О,06.

До тих пір, однак, поки рівень статистичної значущості не досягне р = 0,05, ми ще не маємо права відхилити нульову гіпотезу. Ми дотримуватимемося наступного правила відхилення гіпотези про відсутність відмінностей (Але) та прийняття гіпотези про статистичну достовірність відмінностей (Н 1).

Одна з причин проведення статистичного аналізу полягає в необхідності враховувати вплив на досліджуваний показник випадкових факторів (обурень), що призводять до розкидання даних. Вирішення завдань, у яких присутній розкид даних, пов'язане з ризиком, оскільки навіть за використання всієї доступної інформації не можна точнопередбачити, що станеться у майбутньому. Для адекватної роботи у таких ситуаціях доцільно розуміти природу ризику та вміти визначати міру розсіювання набору даних. Існують три числові характеристики, що описують міру розсіювання: стандартне відхилення, розмах та коефіцієнт варіації (мінливості). На відміну від типових показників (середнє, медіана, мода), що характеризують центр, характеристики розсіювання показують, наскільки близькодо цього центру розташовуються окремі значення набору даних
Визначення стандартного відхилення Стандартне відхилення(Середнє квадратичне відхилення) є мірою випадкових відхилень значень даних від середнього. У житті більшість даних характеризується розсіюванням, тобто. окремі значення розташовуються певній відстані від середнього.
Використовувати стандартне відхилення як узагальнювальну характеристику розсіювання, просто усереднивши відхилення даних не можна, тому що частина відхилень виявиться позитивною, а інша частина – негативною, і внаслідок цього результат усереднення може бути рівним нулю. Щоб позбавитися від негативного знака, застосовують стандартний прийом: спочатку обчислюють дисперсіюяк суму квадратів відхилень, поділену на ( n–1), а потім із отриманого значення витягають квадратний корінь. Формула для обчислення стандартного відхилення виглядає наступним чином: Примітка 1. Дисперсія не несе ніякої додаткової інформації в порівнянні зі стандартним відхиленням, однак її складніше інтерпретувати, тому що вона виражається в «одиницях у квадраті», у той час як стандартне відхилення виражено в звичних нам одиницях (наприклад, у доларах). Примітка 2. Наведена вище формула призначена для розрахунку стандартного відхилення за вибіркою і точніше називається вибіркове стандартне відхилення. При розрахунку стандартного відхилення генеральної сукупності(позначається символом s) виробляють поділ на n. Величина вибіркового стандартного відхилення виходить дещо більше (т.к. n-1), Що забезпечує виправлення на випадковість самої вибірки. У випадку, коли набір даних має нормальний розподіл, стандартне відхилення набуває особливого значення. На малюнку, представленому нижче, з обох боків від середнього зроблено позначки з відривом одного, двох і трьох стандартних відхилень відповідно. З малюнка видно, що приблизно 66,7% (дві третини) всіх значень знаходяться в межах одного стандартного відхилення по обидва боки від середнього значення, 95% значень будуть в межах двох стандартних відхилень від середнього та майже всі дані (99,7%) будуть у межах трьох стандартних відхилень від середнього значення.
66,7%


Ця властивість стандартного відхилення для розподілених даних називається «правилом двох третин».

У деяких ситуаціях, наприклад при аналізі контролю якості продукції, часто встановлюють такі межі, щоб в якості заслуговує на увагу проблеми розглядалися ті результати спостережень (0,3%), які відстоять від середнього на відстані більшому, ніж три стандартні відхилення.

На жаль, якщо дані не підпорядковуються нормальному розподілу, описане вище правило застосовувати не можна.

В даний час існує обмеження, яке називається правилом Чебишева, яке можна застосовувати до асиметричних (скошених) розподілів.

Сформувати вихідні дані Сукупність СВ

У таблиці 1 представлена ​​динаміка змін денний прибуток на біржі, зафіксованої у робочі дні у період від 31 липня до 9 жовтня 1987 року.

Таблиця 1. Динаміка зміни денного прибутку на біржі

Дата Денний прибуток Дата Денний прибуток Дата Денний прибуток
-0,006 0,009 0,012
-0,004 -0,015 -0,004
0,008 -0,006 0,002
0,011 0,002 -0,008
-0,001 0,011 -0,010
0,017 0,013 -0,013
0,017 0,002 0,009
-0,004 -0,018 -0,020
0,008 -0,014 -0,003
-0,002 -0,001 -0,001
0,006 -0,001 0,017
-0,017 -0,013 0,001
0,004 0,030 -0,000
0,015 0,007 -0,035
0,001 -0,007 0,001
-0,005 0,001 -0,014
Запустити Excel
Створити файл Натисніть кнопку Зберегти на панелі інструментів Стандартна. відкрийте У діалоговому вікні, що з'явилося, папку Статистика і задайте ім'я файлу Характеристики розсіювання.xls.
Задати мітку 6. На Листі1 в осередку A1 задайте мітку Денний прибуток, 7. а в діапазон A2:A49 введіть дані з Таблиці 1.
Задати функцію СЕРЕДНИЙ ЗНАЧЕННЯ 8. Введіть позначку Середнє в осередок D1. У осередку D2 обчисліть середнє, використовуючи статистичну функцію СРЗНАЧ.
Задати функцію СТАНДОТКЛОН У осередку D4 введіть позначку Стандартне відхилення. У осередку D5 обчисліть стандартне відхилення, використовуючи статистичну функцію СТАНДОТКЛОН
Зменшіть розрядність отриманого результату до четвертого знаку після коми.
Інтерпретація результатів Зниженняденний прибуток у середньому становило 0,04% (значення середньої добової прибутку вийшло рівним –0,0004). Це означає, що середня денна прибуток за аналізований період була приблизно дорівнює нулю, тобто. над ринком тримався середній курс. Стандартне відхилення вийшло рівним 0,0118. Це означає, що вкладений фондовий ринок один долар ($1) за добу змінювався в середньому на $0,0118, тобто. його вкладення могло призвести до прибутку чи втрати у розмірі $0,0118.
Перевіримо, чи відповідають наведені у Таблиці 1 значення денного прибутку правилам нормального розподілу 1. Розрахуйте інтервал, який відповідає одному стандартному відхиленню по обидва боки від середнього. 2. У осередках D7, D8 та F8 задайте відповідно позначки: Одне стандартне відхилення, Нижня межа, Верхня межа. 3. У комірку D9 введіть формулу = -0,0004 – 0,0118, а в комірку F9 введіть формулу = -0,0004 + 0,0118. 4. Отримайте результат із точністю до четвертого знака після коми.

5. Визначте кількість значень денного прибутку, що знаходяться в межах стандартного відхилення. Спочатку відфільтруйте дані, залишивши значення денного прибутку в інтервалі [-0,0121, 0,0114]. Для цього виділіть будь-яку комірку в стовпці A зі значеннями денного прибутку та виконайте команду:

Дані®Фільтр®Автофільтр

Відкрийте меню, клацнувши на стрілці в заголовку Денний прибуток, а потім виберіть (Умова…). У діалоговому вікні Користувальницький автофільтр встановіть параметри, як показано нижче. Натисніть кнопку ОК.

Щоб підрахувати кількість відфільтрованих даних, виділіть діапазон значень денного прибутку, клацніть правою кнопкою на вільному місці в рядку стану та в контекстному меню виберіть команду Кількість значень. Прочитайте результат. Тепер відобразіть усі вихідні дані, виконавши команду: Дані®Фільтр®Відобразити всі та вимкніть автофільтр за допомогою команди: Дані®Фільтр®Автофільтр.

6. Обчисліть відсоток значень денного прибутку, віддалених від середнього на відстані одного стандартного відхилення. Для цього в осередок H8 занесіть мітку Відсоток, а в осередку H9 запрограмуйте формулу обчислення відсотка та отримайте результат з точністю до одного знака після коми.

7. Розрахуйте інтервал значень денного прибутку у межах двох стандартних відхилень від середнього. У осередках D11, D12 і F12 задайте відповідно мітки: Два стандартні відхилення, Нижня границя, Верхня межа. У комірки D13 та F13 введіть розрахункові формули та отримайте результат з точністю до четвертого знака після коми.

8. Визначте кількість значень денного прибутку, що знаходяться в межах двох стандартних відхилень, попередньо відфільтрувавши дані.

9. Обчисліть відсоток значень денного прибутку віддалених від середнього на відстані двох стандартних відхилень. Для цього в осередок H12 занесіть мітку Відсоток, а в осередку H13 запрограмуйте формулу обчислення відсотка та отримайте результат з точністю до одного знака після коми.

10. Розрахуйте інтервал значень денного прибутку у межах трьох стандартних відхилень від середнього. У осередках D15, D16 і F16 задайте відповідно мітки: Три стандартні відхилення, Нижня границя, Верхня межа. У комірки D17 та F17 введіть розрахункові формули та отримайте результат з точністю до четвертого знака після коми.

11. Визначте кількість значень денного прибутку, що знаходяться в межах трьох стандартних відхилень, попередньо відфільтрувавши дані. Обчисліть відсоток значень денного прибутку. Для цього в осередок H16 занесіть мітку Відсоток, а в осередку H17 запрограмуйте формулу обчислення відсотка та отримайте результат з точністю до одного знака після коми.

13. Побудуйте гістограму денного прибутку акцій на біржі та помістіть її разом із таблицею розподілу частот в області J1:S20. Покажіть на гістограмі приблизно середнє значення та інтервали, що відповідають одному, двом та трьом стандартним відхиленням від середнього відповідно.

Для математико-статистичного аналізу результатів вибірки знати лише характеристики положення недостатньо. Одна й та сама величина середнього значення може характеризувати зовсім різні вибірки.

Тому крім них у статистиці розглядають також характеристики розсіювання (варіації, або коливання ) результатів.

1. Розмах варіації

Визначення. Розмахом варіації називається різниця між найбільшим та найменшим результатами вибірки, позначається Rі визначається

R=X max - X min.

Інформативність цього показника невелика, хоча при малих обсягах вибірки по розмаху легко оцінити різницю між найкращим та найгіршим результатами спортсменів.

2. Дисперсія

Визначення. Дисперсією називається середній квадрат відхилення значень ознаки від середньої арифметичної.

Для несгрупованих даних дисперсія визначається за формулою

де Х i- Значення ознаки, - середнє арифметичне.

Для даних, згрупованих в інтервали, дисперсія визначається за формулою

,

де х i- середнє значення i інтервалу угруповання, n i- Частоти інтервалів.

Для спрощення розрахунків і щоб уникнути похибок обчислення при округленні результатів (особливо зі збільшенням обсягу вибірки) використовуються також інші формули визначення дисперсії. Якщо середнє арифметичне вже обчислено, то для несгрупованих даних використовується така формула:

 2 =
,

для згрупованих даних:

.

Ці формули виходять із попередніх розкриттям квадрата різниці під знаком суми.

У тих випадках, коли середнє арифметичне та дисперсія обчислюються одночасно, використовуються формули:

для несгрупованих даних:

 2 =
,

для згрупованих даних:

.

3. Середнє квадратичне(стандартне)відхилення

Визначення. Середнє квадратичне (стандартне ) відхилення характеризує ступінь відхилення результатів від середнього значення абсолютних одиницях, т. до. на відміну дисперсії має самі одиниці виміру, як і результати виміру. Інакше висловлюючись, стандартне відхилення показує щільність розподілу результатів групи близько середнього значення, чи однорідність групи.

Для несгрупованих даних стандартне відхилення можна визначити за формулами

 =
,

 =
або =
.

Для даних, що згруповані в інтервали, стандартне відхилення визначається за формулами:

,

або
.

4. Помилка середньої арифметичної (помилка середньої)

Помилка середньої арифметичної характеризує коливання середньої та обчислюється за формулою:

.

Як видно з формули, зі збільшенням обсягу вибірки помилка середньої зменшується пропорційно до кореня квадратного з обсягу вибірки.

5. Коефіцієнт варіації

Коефіцієнт варіації визначається як відношення середнього квадратичного відхилення до середнього арифметичного, виражене у відсотках:

.

Вважається, що й коефіцієнт варіації вбирається у 10 %, то вибірку вважатимуться однорідної, тобто отриманої з однієї генеральної сукупності.

Мета роботи

Познайомитися з явищем розсіювання та навчитися визначати його характеристики.

Оснащення

1. Диски з номінальним значенням А 1 .

2. Диски з номінальним значенням А 2 .

3. Мікрометр.

4. Стійка.

1. Загальні відомості

При виготовленні партії деталей по тому самому технологічному процесу, одним і тим же робочим, на тому самому робочому місці, в одних і тих же умовах спостерігаються відхилення значень параметрів точності деталей від ідеального прототипу і один від одного. Це явищеотримало назву розсіювання.

На всіх етапах технологічного процесу виготовлення деталі діє велика кількість випадкових і систематичних факторів, що безперервно або дискретно змінюються.

Систематичні факторибувають:

– постійно діючі (наприклад, похибка форми оброблюваної поверхні, обумовлена ​​непаралельності осі шпинделя напрямним токарного верстата; похибка вимірювання та ін);

– що змінюються за певним законом у = f(x) (наприклад, розмірне зношування інструменту, теплові деформації верстата та ін.).

Випадкові факторихарактеризуються великою їх кількістю, відсутністю зв'язку між собою та нестабільністю (наприклад, пружні віджимання ланок системи СНІД).

Насправді явище розсіювання будь-якої характеристики якості вивчається з допомогою точкової діаграми, що дозволяє визначити все характеристики.

Для побудови точкової діаграмипо осі абцис відкладаються порядкові номери вимірювання деталей, а по осі ординат у вигляді точок – отримані значення відповідного номера вимірювань деталей (рис. 1.1). Через точки, що відповідають максимальному та мінімальному значенням вимірювання, проводяться дві лінії, паралельні між собою та осі абцис. Відстань між цими лініями є першою характеристикою розсіювання значень і називається поля розсіювання ω = Анб Aнм . Ця характеристика обов'язково доповнюється координатою середини поля розсіювання – ∆ ω , Що являє собою відстань між серединою поля розсіювання та номінальним значенням. Вона визначає положення поля розсіювання щодо номіналу.

Другий характеристикою явища розсіювання служить практична крива розсіювання і її параметри. Для побудови практичної кривої розсіювання необхідно поле розсіювання ω на точковій діаграмі розділити на 7…11 інтервалів лініями, паралельними до осі абцис. У кожному інтервалі підрахувати кількість результатів вимірювань, що потрапили в нього (абсолютна частота т)і зобразити цю кількість у вигляді прямокутників шириною, що дорівнює величині інтервалу, і висотою, що дорівнює абсолютній частоті т.е.

Діаграма, що вийшла, називається гістограмою розсіювання.Зобразивши абсолютну частоту ту вигляді прямих ліній, розташованих посередині кожного інтервалу (навантажених ординат), і з'єднавши їх верхні точки відрізками прямих ліній, одержують ламану лінію, яка називається практичної кривої розсіюваннязначень виміру (рис. 2.1).


Рис. 1.1. Точкова діаграма та практична

крива розсіювання значень вимірювання

Параметрами, що характеризують практичну криву розсіювання, є:

1. Рівняння кривої розсіювання у = φ(х). Для більшості завдань оцінки точності у технології машинобудування розподіл поточних значень х i підпорядковується нормальному закону (закону Гауса), для якого

Крім закону Гауса поточні значення х iможуть розподілятися по закону рівної ймовірності, закону Сімпсона, закону Шарльє та інших.

2. Центр групуваннявипадкової величини – це середнє значення, біля якого розташовується найбільше значень. Іншими словами, центр групування – це значення випадкової величини, що належить більшості деталей партії. Положення центру групування визначається координатою центру групування (математичним очікуванням) M(x).

3. Середнє квадратичне відхилення σ,показує щільність групування поточних значень щодо центру групування М(х). Графічно σ зображується у вигляді двох абцис, рівновіддалених від значення M(x) на величину σ, Ця характеристика є мірою розсіювання.

4. Коефіцієнт відносної асиметрії а,що показує зміщення центру групування М(х) щодо середини поля розсіювання. Для дискретних величин поточного значення х i Характеристики M(x), σ і авизначаються за рівностями:

де р(х i) = т/п кількість значень вимірювань, що потрапили у відповідний інтервал, виражене у відсотках або частках усієї кількості виміряних величин (відносна частина).

Обчислені характеристики розсіювання значень вимірювання подаються у графічному вигляді, враховуючи, що у m ах ≈ 0,4/ σ , у σ ≈ 0.24/σ (Рис. 2.2).

Рис. 2.2. Характеристики явища розсіювання: M(x); σ ; а



2. Порядок виконання роботи

Лабораторна робота виконується двома бригадами. Явище розсіювання у цій роботі вивчається з прикладу двох партій деталей по 50 штук номіналами А 1 , А 2 .

Зробити установку (50 разів) заготівлі в трикулачковий патрон і виміряти осьове зміщення.

При установці деталь необхідно щільно притискати торцевою поверхнею до оснастки, а при повторних установках деталь необхідно повертати навколо осі на деякий кут.

Результати вимірювання зафіксувати після кожної установки деталі.

За результатами вимірювань побудувати точкову діаграму, гістограму та криву розсіювання аналогічно етапу 2 .

Визначити параметри, що характеризують криву розсіювання, аналогічно до етапу 3 .

Порівняти результати експериментів та зробити висновки.

Побудувати схему цих показників явища розсіювання (рис.2.2).

1. Назва, ціль та оснащення роботи.

2. Результати вимірів деталей номіналом А 1 .

3. Точкова діаграма та характеристики явища розсіювання.

4. Результати вимірів деталей номіналом А 2 .

5. Точкова діаграма та характеристики явища розсіювання.

6. Висновки.

4. Контрольні питання

1. Що таке явище розсіювання?

2. З допомогою чого вивчається явище розсіювання.

3. Назвіть характеристики явища розсіювання.

4. Які фактори діють у процесі виготовлення деталі?

5. За що відповідають у точковій діаграмі систематичні фактори?

6. За що відповідають у точковій діаграмі випадкові фактори?

7. Чому при побудові практичної кривої розсіювання кількість інтервалів має бути непарною?

8. Що таке поле розсіювання?

9. Що таке координата середини поля розсіювання?

10. Навіщо потрібна координата середини поля розсіювання?

11. Що таке центр групування?

12. Що таке математичне очікування?

13. Що показує математичне очікування?

14. Що прийнято за міру розсіювання?

15. Назвіть характеристики технологічного процесу.

16. Назвіть характеристики явища розсіювання під час обробки партії деталей.

Поруч із найімовірнішим значенням ризику важливе значення має розкид можливих значень ризику щодо його центрального значення. Облік розкиду показників необхідний і під час вирішення завдань соціально-гігієнічного моніторингу.

Найбільш поширеними характеристиками розкиду випадкової величини є дисперсія та середньоквадратичне відхилення.

Дисперсія випадкової величини ξ позначається як D(ξ) (використовуються також позначення V(ξ) та σ 2(ξ)), характеризує найімовірніше значення квадрата відхилення випадкової величини від свого математичного очікування.

Для дискретної випадкової величини, що приймає значення х iз ймовірностями р i ,дисперсія визначається як виважена сума нітратів відхилень х iвід математичного очікування ξ з ваговими коефіцієнтами, рівними відповідним ймовірностям:

D(ξ) =

Для безперервної випадкової величини її дисперсія визначається за формулою:

D(ξ) =

Дисперсія має такі практично важливі властивості:

1.Дисперсія будь-якої випадкової величини невід'ємна:

D(ξ) ≥ 0

2. Дисперсія постійної величини дорівнює 0:

D(C) = 0

де З – константа.

3. Дисперсія випадкової величини ξ дорівнює різниці між математичним очікуванням квадрата цієї випадкової величини та квадратом математичного очікування ξ:

D(ξ) = M [ξ – M (ξ)] 2 = M(ξ 2) – ( .

4. Додавання константи до випадкової величини не змінює дисперсії; множення випадкової величини на константу а призводить до множення дисперсії на а 2 :

D(aξ + b) = a 2 D(ξ),

де аі b- Константи.

5. Дисперсія суми незалежних випадкових величин дорівнює сумі їх дисперсій:

де ξ та η - незалежні випадкові величини.

Середньоквадратичним відхиленням випадкової величини ξ (використовуються також термін «стандартне відхилення») називається число σ (ξ) дорівнює квадратному кореню з дисперсії ξ:

Середньоквадратичне відхилення вимірює відхилення випадкової нвеличини від її математичного очікування у тих самих величинах, у яких вимірюється сама випадкова величина (на відміну дисперсії, розмірність якої дорівнює квадрату розмірності вихідної випадкової величини). Для нормального розподілу середньоквадратичне відхилення дорівнює параметру σ. Таким чином, математичне очікування і стандартне відхилення є повним набором характеристик нормального розподілу і однозначно визначають вид щільності розподілу. Для розподілів, що відрізняються від нормального, ця пара показників не є такою ж ефективною характеристикою розподілу.


Як характеристику розсіювання випадкової величини використовується також коефіцієнт варіації. Коефіцієнтом варіації випадкової величини ξ, що має ненульове математичне очікування, називається число V(ξ) рівне відношенню середньоквадратичного відхилення ξ до її математичного очікування:

p align="justify"> Коефіцієнт варіації вимірює розсіювання випадкової величини в частках її математичного очікування і часто виражається у відсотках від останнього. Цією характеристикою не слід користуватися, якщо математичне очікування близьке до 0 або істотно менше стандартного відхилення (у цьому випадку малі помилки при визначенні математичного очікування призводять до високої похибки для коефіцієнта варіації), а також, якщо вид щільності розподіл істотно відрізняється від гаусовского.

Коефіцієнт асиметрії ( As) визначає 3-й ступінь відхилення випадкової величини від математичного очікування та визначається за формулою:

Насправді цей показник використовується як оцінка симетричності розподілу. Для будь-якого симетричного розподілу він дорівнює 0. Якщо ж щільність розподілу несиметрична (що часто може мати місце при оцінці ризику смерті та ризиків, пов'язаних із забрудненням води та повітря), то позитивний коефіцієнт асиметрії відповідає випадку, коли ліве плече кривої щільності крутіше правого, а негативний - випадку, коли праве плече крутіше лівого (рис 4.17).

Для асиметричних розподілів стандартне відхилення не є добрим показником розсіювання випадкової величини. Для характеристики розсіювання у разі можна використовувати такі показники, як квартили, квантили і процентили.

Першою квартиллю випадкової величини ξ, що має функцію розподілу F(х), називається число Q 1є рішенням рівняння

F(Q 1) = 1/4

тобто таке число, для якого ймовірність того, що ξ набуває значення, менші Q 1, дорівнює 1/4, ймовірність того, що вона набуває значення, великі Q 1дорівнює 3/4.

Другою квартиллю ( Q 2) випадкової величини називається її медіана, а третьою ( Q 3) - вирішення рівняння

F(Q 3) = 3/4

Квартілі ділять вісь абсцис на 4 інтервали: [-∞, Q 1], [Q 1 , Q 2], [Q 2 , Q 3] та [ Q 3, + ∞] у кожен із яких випадкова величина потрапляє з рівною ймовірністю, а фігуру, обмежену віссю абсцис та графіком щільності розподілу - на 4 області з однаковою площею. І в інтервалі між першою і третьою квартилями зосереджено 50% розподілу випадкової величини. Для симетричних розподілів перша та третя квартілі однаково віддалені від медіани.

Квантиллю порядку рвипадкової величини ξ з функцією розподілу F(х) називається число х, що є рішенням рівняння

Таким чином, квартілі є квантилями порядку 0,25, 0,5 та 0,75. Якщо порядок квантил р виражається у відсотках, то відповідні значення хназиваються відсотками, або р-процентними точками розподілу

На рис. 4.18 показані, поряд з квантилями, 2,5- та 97,5-процентні точки розподілу. Між цими точками зосереджено 95% розподілу випадкової величини, тому укладений між ними інтервал називають 95% довірчим інтервалом середнього (зокрема, при оцінці ризиків - 95% довірчим інтервалом ризику).

Завдання 2.Які з наведених нижче відомостей про випадкову величину ξ дозволяють відкинути припущення про те, що вона розподілена за нормальним законом:

а) ξ - дискретна випадкова величина;

б) математичне очікування ξ негативно;

в) розподіл ξ унімодально;

г) математичне очікування ξ не дорівнює її медіани;

д) коефіцієнт асиметрії ξ негативний;

е) стандартне відхилення ξ більше її математичного очікування;

ж) ξ характеризує розподіл тривалості гострих захворювань органів дихання на досліджуваній території;

з) ξ характеризує розподіл тривалості життя на досліджуваній території;

і) медіана ξ не збігається з центром інтервалу між першою та третьою квартилями.

Відповідь: Припущення про нормальний закон розподілу випадкової величини несумісне із твердженнями а), г), д), з), і).

Рис. 4.17.Залежність між знаком Рис.4.18.Квартили та відсотку:

коефіцієнта асиметрії та формою ілюстрація за допомогою функції

функції щільності розподілу

Схожі статті

  • Моделі стаціонарних часових рядів

    Інструкція: Під тимчасовими рядами розуміють економічні величини, залежні від часу. При цьому час передбачається дискретним, інакше говорять про випадкові процеси, а не про тимчасові ряди. Моделі стаціонарних та...

  • Характеристики статистичного розподілу

    Для вибірки можна визначити ряд числових характеристик, які аналогічні основним числовим характеристикам випадкових величин у теорії ймовірностей (математичне очікування, дисперсія, середнє квадратичне відхилення, мода, медіана) та...

  • Навчальний посібник: Математична статистика

    Математична статистика - це сучасна галузь математичної науки, яка займається статистичним описом результатів експериментів та спостережень, а також побудовою математичних моделей, що містять поняття ймовірності.

  • Чому нам складно спілкуватися: бар'єри взаємодії Отже, які ж основні види бар'єрів у спілкуванні

    Характер являє собою поєднання найбільш стійких, суттєвих особливостей людини.

  • Статистична сукупність

    Теорія статистики Посібник для студентів, які навчаються за дистанційною системою Введення Статистика є однією з базових дисциплін, що формує професійний рівень сучасного економіста, займає особливе місце в системі...

  • Логарифмічно нормальний розподіл Закон розподілу вейбулу

    Теоретично надійності найбільшого поширення набули такі закони розподілу випадкових величин f (t ):Для дискретних випадкових величин - біномінальний закон; закон Пуассона; Для безперервних випадкових величин - експонентний...