Правила та процедури математичної статистики спираються на. Навчальний посібник Математична статистика. Основні поняття математичної статистики

Математична статистика- це сучасна галузь математичної науки, яка займається статистичним описом результатів експериментів та спостережень, а також побудовоюматематичних моделей, що містять поняття імовірності.Теоретичною базою математичної статистики є теорія імовірності.

У структурі математичної статистики традиційно виділяють два основні розділи: описова статистиката статистичні висновки (рис. 1.1).

Рис. 1.1. Основні розділи математичної статистики

Описова статистикавикористовується для:

o узагальнення показників однієї змінної (статистика випадкової вибірки);

o виявлення взаємозв'язків між двома та більше змінними (кореляційно-регресійний аналіз).

Описова статистика дає можливість отримати нову інформацію, швидше зрозуміти і всебічно оцінити її, тобто виконує наукову функцію опису об'єктів дослідження, чим виправдовує свою назву. Методи описової статистики покликані перетворити сукупність окремих емпіричних даних на систему наочних сприйняття форм і чисел: розподілу частот; показники тенденцій, варіативності, зв'язку. Цими методами розраховуються статистики випадкової вибірки, які є підставою реалізації статистичних висновків.

Статистичні висновкидають можливість:

o оцінити точність, надійність та ефективність вибіркових статистик, знайти помилки, що виникають у процесі статистичних досліджень (статистичне оцінювання)

o узагальнити параметри генеральної сукупності, отримані виходячи з вибіркових статистик (перевірка статистичних гіпотез).

Головна мета наукових досліджень - це отримання нового знання про великі класи явищ, осіб або подій, які прийнято називати генеральною сукупністю.

Генеральна сукупність- це повна сукупність об'єктів дослідження, вибірка- її частина, яка сформована у певний науково обґрунтований спосіб 2.

Термін "генеральна сукупність" використовується тоді, коли йдеться про велику, але кінцеву сукупність досліджуваних об'єктів. Наприклад, про сукупність абітурієнтів України у 2009 році чи сукупність дітей дошкільного віку міста Рівного. Генеральні сукупності можуть досягати значних обсягів, бути кінцевим та нескінченним. Насправді, зазвичай, мають справу з кінцевим сукупностями. І якщо відношення обсягу генеральної сукупності до обсягу вибірки становить понад 100, то, за словами Гласса і Стенлі, методи оцінки для кінцевих і нескінченних сукупностей дають по суті однакові результати. Генеральною сукупністю можна і повну сукупність значень якогось ознаки. Приналежність вибірки до генеральної сукупності є основною підставою для оцінки показників генеральної системи за параметрами вибірки.

Основна ідеяМатематична статистика базується на переконанні про те, що повне вивчення всіх об'єктів генеральної сукупності в більшості наукових завдань або практично неможливо, або економічно недоцільно, оскільки вимагає багато часу та значних матеріальних витрат. Тому в математичній статистиці застосовується вибірковий підхід,принцип якого показано на схемі рис. 1.2.

Наприклад, за технологією формування розрізняють вибірки рандомізовані (прості та систематичні), стратифіковані, кластерні (див. Розділ 4).

Рис. 1.2. Схема застосування методів математичної статистики вибірковим підходомвикористання математико-статистичних методів може проводитись у такій послідовності (див. рис. 1.2):

o з генеральної сукупності,властивості якої підлягають дослідженню, визначеним методами формують вибірку- типову та обмежену кількість об'єктів, до яких застосовують дослідницькі методи;

o в результаті методів спостережень, експериментальних дій та вимірювань над об'єктами вибірки отримують емпіричні дані;

o обробка емпіричних даних з допомогою методів описової статистики дає показники вибірки, які називаються статистиками - як і назва дисципліни, до речі;

o застосовуючи методи статистичних висновків до статистика,отримують параметри, що характеризують властивості генеральної сукупності.

приклад 1.1.З метою оцінки стабільності рівня знань (змінна X)проведено тестування рандомізованої вибірки 3 студентів обсягом n.Тести містили по m завдань, кожне з яких оцінювалося за системою балів: "виконано" "- 1," не виконано "- 0. залишилися середні поточні досягнення студентів X

3 рандомізована вибірка(від англ. Random – випадковий) – це репрезентативна вибірка, яка сформована за стратегією випадкових випробувань.

на рівні минулих років/год? Послідовність розв'язання:

o з'ясувати змістовну гіпотезу типу: "якщо поточні результати тестування нічого очікувати відрізнятися від минулих, можна вважати рівень знань студентів незмінним, а навчальний процес - стабільним";

o сформулювати адекватну статистичну гіпотезу, наприклад, нуль-гіпотезу Н 0про те, що "поточний середній бал X статистично не відрізняється від середнього показника минулих років/год", тобто Н 0: X = / г проти відповідної альтернативної гіпотези X Ф^;

o побудуватиемпіричні розподіли досліджуваної змінної X;

o визначити(при необхідності) кореляційні зв'язки, наприклад, між змінною Xта іншими показниками, побудувати лінії регресії;

o перевірити відповідність емпіричного розподілу нормальному закону;

o оцінити значення точкових показників та довірчий інтервал параметрів, наприклад, середнього;

o визначити критерій для перевірки статистичних гіпотез;

o виконати перевірку статистичних гіпотез на основі вибраних критеріїв;

o сформулювати рішення про статистичній нуль-гіпотези на певному рівні значимості;

o перейти від рішення про прийняття або відхилення статистичної нуль-гіпотези інтерпретації висновків щодо змістовної гіпотези;

o сформулювати змістовні висновки.

Отже, якщо узагальнити перераховані вище процедури, застосування статистичних методів складається з трьох основних блоків:

Перехід від об'єкта реальності до абстрактної математико-статистичної схеми, тобто побудова імовірнісної моделі явища, процесу, властивості;

Проведення розрахункових дій власне математичними засобами в рамках імовірнісної моделі за результатами вимірювань, спостережень, експерименту та формулювання статистичних висновків;

Інтерпретація статистичних висновків про реальну ситуацію та прийняття відповідного рішення.

Статистичні методи обробки та інтерпретації даних спираються на теорію ймовірностей. Теорія ймовірностей є основою методів математичної статистики. Без використання фундаментальних понять та законів теорії ймовірностей неможливе узагальнення висновків математичної статистики, а значить і обґрунтованого їх використання для наукових та практичних цілей.

Так, завданням описової статистики є перетворення сукупності вибіркових даних на систему показників – статистик – розподілів частот, заходів центральної тенденції та мінливості, коефіцієнтів зв'язку тощо. Проте, статистики є характеристиками, власне, конкретної вибірки. Звичайно, можна розраховувати вибіркові розподіли, вибіркові середні, дисперсії і т. д., але подібний "аналіз даних" має обмежену науково-пізнавальну цінність. "Механічне" перенесення будь-яких висновків, зроблених на основі таких показників, на інші сукупності не є коректним.

Для того, щоб мати можливість перенесення вибіркових показників або інші, або більш поширені сукупності, необхідно мати математично обґрунтовані положенняпро відповідність та здатність вибіркових характеристик характеристиками цих поширених про генеральних сукупностей. Такі положення базуються на теоретичних підходах і схемах, пов'язаних з імовірнісними моделями реальності, наприклад, на аксіоматичному підході, у законі великих чисел тощо. Тільки з їхньою допомогою можна переносити властивості, встановлені за результатами аналізу обмеженої емпіричної інформації, або інші або поширені сукупності. Отже, побудова, закони функціонування, використання ймовірнісних моделей, є предметом математичної області під назвою " теорія ймовірностей " , стає суттю статистичних методів.

Таким чином, у математичній статистиці використовуються два паралельні рядки показників: перший рядок, що має відношення до практики (це вибіркові показники) та другий, заснований на теорії (це показники імовірнісної моделі). Наприклад, емпіричним частот, визначених на вибірці, відповідають поняття теоретичної ймовірності; вибірковому середньому (практика) відповідає математичне очікування (теорія) тощо. Причому у дослідженнях вибіркові характеристики, як правило, є первинними. Вони розраховуються на основі спостережень, вимірювань, експериментів, після чого проходять статистичне оцінювання здатності та ефективності, перевірку статистичних гіпотез відповідно до цілей досліджень і наприкінці приймаються з певною ймовірністю як показники властивостей досліджуваних сукупностей.

Запитання. Завдання.

1. Охарактеризуйте основні розділи математичної статистики.

2. У чому основна ідея математичної статистики?

3. Охарактеризуйте співвідношення генеральної та вибіркової сукупностей.

4. Поясніть схему застосування методів математичної статистики.

5. Зазначте перелік основних завдань математичної статистики.

6. Із яких основних блоків складається застосування статистичних методів? Охарактеризуйте їх.

7. Розкрийте зв'язок математичної статистики з теорією ймовірностей.

Під математичною статистикою розуміють розділ математики, присвячений математичним методам збору, систематизації, обробки та інтерпретації статистичних даних, а також використання їх для наукових або практичних висновків. Правила та процедури математичної статистики спираються на теорію ймовірностей, що дозволяє оцінити точність та надійність висновків, одержуваних у кожному завданні на підставі наявного статистичного матеріалу. При цьому статистичними даними називаються відомості про кількість об'єктів у будь-якій більш менш широкої сукупності, що володіють тими або іншими ознаками.

На кшталт розв'язуваних завдань математична статистика зазвичай ділиться на три розділи: опис даних, оцінювання та перевірка гіпотез.

По виду оброблюваних статистичних даних математична статистика поділяється на чотири напрямки:
- одномірна статистика (статистика випадкових величин), у якій результат спостереження описується дійсним числом;
- багатовимірний статистичний аналіз, де результат спостереження над об'єктом описується кількома числами (вектором);
- статистика випадкових процесів та часових рядів, де результат спостереження – функція;
- статистика об'єктів нечислової природи, у якій результат спостереження має нечислову природу, наприклад, є безліччю (геометричною фігурою), упорядкуванням чи отримано результаті вимірювання за якісним ознакою.

Історично першою з'явилися деякі області статистики об'єктів нечислової природи (зокрема, завдання оцінювання частки шлюбу та перевірки гіпотез про неї) та одномірна статистика. Математичний апарат їм простіше, тому з їхньої прикладі зазвичай демонструють основні ідеї математичної статистики.

Тільки методи обробки даних, тобто. Математична статистика є доказовими, які спираються на імовірнісні моделі відповідних реальних явищ і процесів. Йдеться про моделі поведінки споживачів, виникнення ризиків, функціонування технологічного обладнання, отримання результатів експерименту, перебігу захворювання тощо. Імовірнісну модель реального явища слід вважати побудованою, якщо аналізовані величини та зв'язки між ними виражені у термінах теорії ймовірностей. Відповідність імовірнісної моделі дійсності, тобто. її адекватність обґрунтовують, зокрема, за допомогою статистичних методів перевірки гіпотез.

Неймовірні методи обробки даних є пошуковими, їх можна використовувати лише при попередньому аналізі даних, так як вони не дають можливості оцінити точність та надійність висновків, отриманих на підставі обмеженого статистичного матеріалу.

Імовірнісні та статистичні методи застосовні усюди, де вдається побудувати та обґрунтувати ймовірнісну модель явища або процесу. Їх застосування обов'язково, коли виготовлені на основі вибіркових даних висновки переносяться на всю сукупність (наприклад, з вибірки на всю партію продукції).

У конкретних областях застосування використовуються як імовірнісно-статистичні методи широкого застосування, так і специфічні. Наприклад, розділ виробничого менеджменту, присвяченого статистичним методам управління якістю продукції, використовують прикладну математичну статистику (включаючи планування експериментів). За допомогою її методів проводиться статистичний аналіз точності та стабільності технологічних процесів та статистична оцінка якості. До специфічних методів належать методи статистичного приймального контролю якості продукції, статистичного регулювання технологічних процесів, оцінки та контролю надійності та ін.

Широко застосовуються такі прикладні імовірнісно-статистичні дисципліни, як теорія надійності та теорія масового обслуговування. Зміст першої їх ясно з назви, друга займається вивченням систем типу телефонної станції, яку у випадкові моменти часу надходять виклики - вимоги абонентів, набирають номери у своїх телефонних апаратах. Тривалість обслуговування цих вимог, тобто. тривалість розмов також моделюється випадковими величинами. Великий внесок у розвиток цих дисциплін зробив член-кореспондент АН СРСР А.Я. Хінчін (1894-1959), академік АН УРСР Б.В.Гнеденко (1912-1995) та інші вітчизняні вчені.

English: Wikipedia is making the site more secure. Ви використовуєте old web browser, який не може бути підключений до Wikipedia в майбутньому. Please update your device or contact your IT administrator.

中文: 维基百科正在使网站更加安全。您正在使用旧的浏览器、这在未来无法连接维基百科。请更新您的设备または联络您的IT管理员。 ).

Español: Wikipedia має в своєму розпорядженні el sitio más seguro. У вас використовується un navegador web viejo que no será capaz de connectarse a Wikipedia en el futuro. Actualice su dispositivo o contacto a su administrador informático. Más abajo hay una actualización más larga y más técnica en anglès.

ﺎﻠﻋﺮﺒﻳﺓ: ويكيبيديا تسعى لتأمين الموقع أكثر من ذي قبل. أنت تستخدم متصفح وب قديم لن يتمكن من الاتصال بموقع ويكيبيديا في المستقبل. يرجى تحديث جهازك أو الاتصال بغداري تقنية المعلومات الخاص بك. يوجد تحديث فني أطول ومغرق في التقنية باللغة الإنجليزية تاليا.

Français: Wikipédia va bientôt augmenter la sécurité de son site. Vous utilisez actuellement un navigateur web ancien, що не pourra plus se connecter à Wikipédia lorsque ce sera fait. Merci de mettre à jour votre appareil ou de contacter votre administrateur informatique à cette fin. Des informations supplémentaires plus techniques et en anglais sont ci-dessous.

日本語: 위키백과에서는 사이트의 보안을 강화하고 있습니다.이용의 브라우저는 버젼이 낡아, 향후, 위키피디아에 접속할 수 없게 될 가능성이 있습니다.디바이스를 갱신하거나, IT 관리자에게 상담해 주세요.기술면의 상세한 갱신 정보는 아래에 영어로 제공됩니다.

Deutsch: Wikipedia erhöht die Sicherheit der Webseite. Du benutzt einen alten Webbrowser, в Zukunft nicht mehr auf Wikipedia zugreifen können wird. Bitte aktualisiere dein Gerät oder sprich deinen IT-Administrator an. Ausführlichere (und technisch detailliertere) Hinweise findest Du unten in englischer Sprache.

Italiano: Wikipedia sta rendendo il sito più sicuro. Stai usando un browser web che non sarà in grado di connettersi a Wikipedia in futuro. Для favore, aggiorna il tuo dispositivo o contatta il tuo amministratore informatico. Più in basso è disponibile aggiornamento più dettagliato e tecnico in inglese.

Magyar: Biztonságosabb lesz a Wikipedia. A böngésző, amit használsz, nem lesz képes kapcsolódni a jövőben. Hasznalj modernebb szoftvert vagy jelezd a problémát a rendszergazdádnak. Alab olvashatod a részletesebb magyarázatot (angolul).

Svenska: Wikipedia gör sidan mer säker. Du använder en äldre webbläsare som inte kommer att kunna läsa Wikipedia і framtiden. Uppdatera din enhet eller kontakta din IT-administratör. Det finns en längre och mer teknisk förklaring på engelska längre ned.

हिन्दी: विकिपीडिया साइट को और अधिक सुरक्षित बना रहा है। आप एक पुराने वेब ब्राउज़र का उपयोग कर रहे हैं जो भविष्य में विकिपीडिया से कनेक्ट नहीं हो पाएगा। कृपया अपना डिवाइस अपडेट करें या अपने आईटी व्यवस्थापक से संपर्क करें। नीचे अंग्रेजी में एक लंबा और अधिक तकनीकी अद्यतन है।

Використовується для підтримки програмного забезпечення TLS протоколів, зокрема TLSv1.0 і TLSv1.1, які ваш програмний браузер використовується для підключення до наших мереж. Це звичайно пов'язано з видимими інструментами, або за допомогою Android smartphones. Або це може бути interference від корпоративного або індивідуального "Web Security" software, який насправді встановлює зв'язок безпеки.

Ви повинні upgrade вашого веб-браузера або іншогопочатку fix this issue to access our sites. Цей message буде remain until Jan 1, 2020. Після того, як ваш браузер не буде able to establish a connection to our servers.


Зміст.

1. Введення:
- Як використовуються теорія ймовірностей та математична статистика? - стор 2
– Що таке «математична статистика»? - стор 3
2) Приклади застосування теорії ймовірностей та математичної статистики:
- Вибірка. - стор 4
- Завдання оцінювання. – стор 6
- ймовірно-статистичні методи та оптимізація. – стор 7
3) Висновок.

Вступ.

Як використовуються теорія ймовірностей та математична статистика? Ці дисципліни – основа імовірнісно-статистичних методів прийняття рішень. Щоб скористатися їх математичним апаратом, необхідно завдання прийняття рішень висловити термінах вероятностно-статистических моделей. Застосування конкретного імовірнісно-статистичного методу прийняття рішень складається з трьох етапів:
- перехід від економічної, управлінської, технологічної дійсності до абстрактної математико- статистичної схемою, тобто. побудова імовірнісної моделі системи управління, технологічного процесу, процедури прийняття рішень, зокрема за результатами статистичного контролю тощо.
- проведення розрахунків та отримання висновків суто математичними засобами в рамках імовірнісної моделі;
- інтерпретація математико-статистичних висновків стосовно реальної ситуації та прийняття відповідного рішення (наприклад, про відповідність або невідповідність якості продукції встановленим вимогам, необхідності налагодження технологічного процесу тощо), зокрема, висновки (про частку дефектних одиниць продукції в партії, про конкретний вид законів розподілу контрольованих параметрів технологічного процесу та ін.).

Математична статистика використовує поняття, методи та результати теорії ймовірностей. Розглянемо основні питання побудови ймовірнісних моделей прийняття рішень на економічних, управлінських, технологічних та інших ситуаціях. Для активного та правильного використання нормативно-технічних та інструктивно-методичних документів з імовірнісно-статистичних методів прийняття рішень потрібні попередні знання. Так, необхідно знати, за яких умов слід застосовувати той чи інший документ, яку вихідну інформацію необхідно мати для його вибору та застосування, які рішення мають бути прийняті за результатами обробки даних тощо.

Що таке "математична статистика"? Під математичною статистикою розуміють розділ математики, присвячений математичним методам збору, систематизації, обробки та інтерпретації статистичних даних, а також використання їх для наукових або практичних висновків. Правила та процедури математичної статистики спираються на теорію ймовірностей, що дозволяє оцінити точність та надійність висновків, одержуваних у кожному завданні на підставі наявного статистичного матеріалу». При цьому статистичними даними називаються відомості про кількість об'єктів у будь-якій більш менш широкої сукупності, що володіють тими або іншими ознаками.

На кшталт розв'язуваних завдань математична статистика зазвичай ділиться на три розділи: опис даних, оцінювання та перевірка гіпотез.

По виду оброблюваних статистичних даних математична статистика поділяється на чотири напрямки:

Одномірна статистика (статистика випадкових величин), у якій результат спостереження описується дійсним числом;

Багатомірний статистичний аналіз, де результат спостереження над об'єктом описується кількома числами (вектором);

Статистика випадкових процесів та часових рядів, де результат спостереження – функція;

Статистика об'єктів нечислової природи, в якій результат спостереження має нечислову природу, наприклад, є безліччю (геометричною фігурою), впорядкуванням або отриманим результатом вимірювання за якісною ознакою.

Приклади застосування теорії ймовірностей та математичної статистики.
Розглянемо кілька прикладів, коли вероятностно- статистичні моделі є хорошим інструментом на вирішення управлінських, виробничих, економічних, народногосподарських завдань. Приміром, монетка, яку використовують як жереб, має бути «симетричною», тобто. при її киданні в середньому в половині випадків повинен випадати герб, а в половині випадків – грати (решітка, цифра). Але що означає «у середньому»? Якщо провести багато серій по 10 кидань у кожній серії, то часто зустрічатимуться серії, в яких монета чотири рази випадає гербом. Для симетричної монети це відбуватиметься у 20,5% серій. А якщо на 100 000 кидань виявиться 40 000 гербів, то чи можна вважати монету симетричною? Процедура прийняття рішень будується на основі теорії ймовірностей та математичної статистики.

Розглянутий приклад може бути недостатньо серйозним. Однак, це не так. Жеребкування широко використовується при організації промислових техніко-економічних експериментів, наприклад, при обробці результатів вимірювання показника якості (моменту тертя) підшипників залежно від різних технологічних факторів (впливи консерваційного середовища, методів підготовки підшипників перед вимірюванням, впливу навантаження підшипників у процесі вимірювання тощо). п.). Припустимо, необхідно порівняти якість підшипників залежно від результатів зберігання в різних консерваційних маслах, тобто. в оліях складу А і В. При плануванні такого експерименту виникає питання, які підшипники слід помістити в масло складу А, а які - в масло складу, але так, щоб уникнути суб'єктивізму і забезпечити об'єктивність прийнятого рішення.

Вибірка
Відповідь це питання може бути отримано з допомогою жереба. Аналогічний приклад можна навести з контролем якості будь-якої продукції. Щоб вирішити, чи відповідає чи не відповідає контрольована партія продукції встановленим вимогам, з неї відбирається вибірка. За результатами контролю вибірки робиться висновок про всю партію. У цьому випадку дуже важливо уникнути суб'єктивізму при формуванні вибірки, тобто необхідно, щоб кожна одиниця продукції контрольованої партії мала однакову можливість бути відібраною у вибірку. У виробничих умовах відбір одиниць продукції вибірку зазвичай здійснюють за допомогою жереба, а, по спеціальним таблицям випадкових чисел чи з допомогою комп'ютерних датчиків випадкових чисел.
Аналогічні проблеми забезпечення об'єктивності порівняння виникають у порівнянні різних схем організації виробництва, оплати праці, під час проведення тендерів і конкурсів, підбору кандидатів на вакантні посади тощо. Усюди потрібне жеребкування або подібні до неї процедури. Пояснимо на прикладі виявлення найсильнішої та другої за силою команди при організації турніру з олімпійської системи (який програв вибуває). Нехай завжди сильніша команда перемагає слабшу. Зрозуміло, що найсильніша команда однозначно стане чемпіоном. Друга за силою команда вийде у фінал тоді і лише тоді, коли до фіналу вона не матиме ігор з майбутнім чемпіоном. Якщо таку гру буде заплановано, то друга за силою команда у фінал не потрапить. Той, хто планує турнір, може або достроково «вибити» другу за силою команду з турніру, звівши її в першій же зустрічі з лідером, або забезпечити їй друге місце, забезпечивши зустрічі із слабкішими командами аж до фіналу. Щоб уникнути суб'єктивізму, проводять жеребкування. Для турніру з 8 команд ймовірність того, що у фіналі зустрінуться дві найсильніші команди, дорівнює 4/7. Відповідно до ймовірності 3/7 друга за силою команда покине турнір достроково.
За будь-якого вимірювання одиниць продукції (за допомогою штангенциркуля, мікрометра, амперметра тощо) є похибки. Щоб з'ясувати, чи є систематичні похибки, необхідно зробити багаторазові виміри одиниці продукції, характеристики якої відомі (наприклад стандартного зразка). При цьому слід пам'ятати, що, крім систематичної похибки, присутня і випадкова похибка.

Тому постає питання, як за результатами вимірювань дізнатися, чи є систематична похибка. Якщо відзначати лише, чи є отримана при черговому вимірі похибка позитивною чи негативною, це завдання можна звести до попередньої. Дійсно, можна порівняти вимірювання з киданням монети, позитивну похибку – з випаданням герба, негативну – грати (нульова похибка при достатньому числі поділів шкали практично ніколи не зустрічається). Тоді перевірка відсутності систематичної похибки еквівалентна перевірці симетричності монети.

Метою цих міркувань є зведення завдання перевірки відсутності систематичної похибки завдання перевірки симетричності монети. Проведені міркування призводять до так званого критерію знаків в математичній статистиці.
«Критерій знаків» (sign test) - статистичний критерій, що дозволяє перевірити нульову гіпотезу, що вибірка підпорядковується биномиальному розподілу з параметром p=1/2 . Критерій знаків можна використовувати як непараметричний статистичний критерій для перевірки гіпотези рівності медіани заданому значенню (зокрема, нулю), а також відсутності зсуву (відсутності ефекту обробки) у двох зв'язкових вибірках. Він також дозволяє перевіряти гіпотезу симетричності розподілу, проте для цього існують і потужніші критерії - одновибірковий критерій Вілкоксона та його модифікації.

При статистичному регулюванні технологічних процесів на основі методів математичної статистики розробляються правила та плани статистичного контролю процесів, спрямовані на своєчасне виявлення розладки технологічних процесів та вжиття заходів до їх налагодження та запобігання випуску продукції, що не відповідає встановленим вимогам. Ці заходи спрямовані на скорочення витрат виробництва та втрат від постачання неякісних одиниць продукції. При статистичному приймальному контролі з урахуванням методів математичної статистики розробляються плани контролю якості шляхом аналізу вибірок із партій продукції. Складність у тому, щоб вміти правильно будувати вероятностно-статистические моделі прийняття рішень, основі яких можна відповісти на поставлені вище питання. У математичній статистиці при цьому розроблені ймовірнісні моделі та методи перевірки гіпотез, зокрема, гіпотез про те, що частка дефектних одиниць продукції дорівнює певному числу р0, наприклад, р0 = 0,23.

Завдання оцінювання.
У низці управлінських, виробничих, економічних, народногосподарських ситуацій виникають завдання іншого – завдання оцінки показників і параметрів розподілів ймовірностей.

Розглянемо приклад. Нехай на контроль надійшла партія із N електроламп. З цієї партії випадково відібрано вибірку обсягом n електроламп. Виникає низка природних питань. Як за результатами випробувань елементів вибірки визначити середній термін служби електроламп та з якою точністю можна оцінити цю характеристику? Як зміниться точність, якщо взяти вибірку більшого обсягу? При якому числі годинника Т можна гарантувати, що не менше 90% електроламп прослужать Т і більше годинника?

Припустимо, що з випробуванні вибірки обсягом n електроламп дефектними виявилися Х електроламп. Тоді виникають такі питання. Які межі можна вказати для числа D дефектних електроламп у партії, для рівня дефектності D/N тощо?

Або при статистичному аналізі точності та стабільності технологічних процесів слід оцінити такі показники якості, як середнє значення контрольованого параметра та ступінь його розкиду в аналізованому процесі. Відповідно до теорії ймовірностей як середнє значення випадкової величини доцільно використовувати її математичне очікування, а статистичної характеристики розкиду – дисперсію, середнє квадратичне відхилення чи коефіцієнт варіації. Звідси виникає питання: як оцінити ці статистичні характеристики за вибірковими даними та з якою точністю це вдається зробити? Аналогічних прикладів можна навести дуже багато. Тут важливо було показати, як теорія ймовірностей та математична статистика можуть бути використані у виробничому менеджменті при прийнятті рішень у галузі статистичного управління якістю продукції.

Імовірнісно-статистичні методи та оптимізація. Ідея оптимізації пронизує сучасну прикладну математичну статистику та інші статистичні методи. А саме, методи планування експериментів, статистичного приймального контролю, статистичного регулювання технологічних процесів та ін. прикладної математичної статистики.

У виробничому менеджменті, зокрема, при оптимізації якості продукції і на вимоги стандартів особливо важливо застосовувати статистичні методи на початковому етапі життєвого циклу продукції, тобто. на етапі науково-дослідної підготовки дослідно-конструкторських розробок (розробка перспективних вимог до продукції, аванпроекту, технічного завдання на дослідно-конструкторську розробку). Це пояснюється обмеженістю інформації, доступної на початковому етапі життєвого циклу продукції, та необхідністю прогнозування технічних можливостей та економічної ситуації на майбутнє. Статистичні методи повинні застосовуватися на всіх етапах вирішення задачі оптимізації – при шкалюванні змінних, розробці математичних моделей функціонування виробів та систем, проведенні технічних та економічних експериментів тощо.

У задачах оптимізації, у тому числі оптимізації якості продукції та вимог стандартів, використовують усі галузі статистики. А саме, статистику випадкових величин, багатовимірний статистичний аналіз, статистику випадкових процесів та часових рядів, статистику об'єктів нечислової природи. Вибір статистичного методу для аналізу конкретних даних доцільно проводити згідно з рекомендаціями.

Висновок.
В
і т.д.................

Вступ

2. Основні поняття математичної статистики

2.1 Основні поняття вибіркового методу

2.2 Вибірковий розподіл

2.3 Емпірична функція розподілу, гістограма

Висновок

Список літератури

Вступ

Математична статистика - наука про математичні методи систематизації та використання статистичних даних для наукових та практичних висновків. У багатьох своїх розділах математична статистика спирається на теорію ймовірностей, що дозволяє оцінити надійність і точність висновків, які робляться на підставі обмеженого статистичного матеріалу (напр., оцінити необхідний обсяг вибірки для отримання результатів необхідної точності під час вибіркового обстеження).

Теоретично ймовірностей розглядаються випадкові величини із заданим розподілом чи випадкові експерименти, властивості яких цілком відомі. Предмет теорії ймовірностей - властивості та взаємозв'язку цих величин (розподілів).

Але найчастіше експеримент є чорний ящик, видає лише деякі результати, якими потрібно зробити висновок про властивості самого експерименту. Спостерігач має набір числових (або їх можна зробити числовими) результатів, отриманих повторенням одного й того самого випадкового експерименту в однакових умовах.

При цьому виникають, наприклад, такі питання: Якщо ми спостерігаємо одну випадкову величину - як за набором її значень у кількох дослідах зробити якомога точніший висновок про її розподіл?

Прикладом такої серії експериментів може бути соціологічне опитування, набір економічних показників чи, нарешті, послідовність гербів і решок при тисячократному підкиданні монети.

Всі наведені вище фактори обумовлюють актуальністьта значимість тематики роботи на сучасному етапі, спрямованої на глибоке та всебічне вивчення основних понять математичної статистики.

У зв'язку з цим метою даної є систематизація, накопичення і закріплення знань про поняття математичної статистики.

1. Предмет та методи математичної статистики

Математична статистика - наука про математичні методи аналізу даних, отриманих під час проведення масових спостережень (вимірювань, дослідів). Залежно від математичної природи конкретних результатів спостережень статистика математична поділяється на статистику чисел, багатовимірний статистичний аналіз, аналіз функцій (процесів) та часових рядів, статистику об'єктів нечислової природи. Істотна частина математичної статистики заснована на ймовірнісних моделях. Виділяють загальні завдання опису даних, оцінювання та перевірки гіпотез. Розглядають і більш приватні завдання, пов'язані з проведенням вибіркових обстежень, відновленням залежностей, побудовою та використанням класифікацій (типологій) та ін.

Для опису даних будують таблиці, діаграми, інші наочні уявлення, наприклад, кореляційні поля. Імовірнісні моделі зазвичай не застосовуються. Деякі методи опису даних спираються на просунуту теорію та можливості сучасних комп'ютерів. До них відносяться, зокрема, кластер-аналіз, націлений на виділення груп об'єктів, схожих один на одного, і багатовимірне шкалювання, що дозволяє наочно уявити об'єкти на площині, найменшою мірою спотворивши відстані між ними.

Методи оцінювання та перевірки гіпотез спираються на ймовірні моделі породження даних. Ці моделі поділяються на параметричні та непараметричні. У параметричних моделях передбачається, що об'єкти, що вивчаються, описуються функціями розподілу, що залежать від невеликого числа (1-4) числових параметрів. У непараметричних моделях функції розподілу передбачаються довільними безперервними. У статистиці математичної оцінюють параметри та характеристики розподілу (математичне очікування, медіану, дисперсію, квантилі та ін.), щільності та функції розподілу, залежності між змінними (на основі лінійних та непараметричних коефіцієнтів кореляції, а також параметричних або непараметричних оцінок функцій, що виражають залежності) та ін. Використовують точкові та інтервальні (що дають межі для справжніх значень) оцінки.

У математичній статистиці є загальна теорія перевірки гіпотез і багато методів, присвячених перевірці конкретних гіпотез. Розглядають гіпотези про значення параметрів та характеристик, про перевірку однорідності (тобто про збіг характеристик або функцій розподілу у двох вибірках), про згоду емпіричної функції розподілу із заданою функцією розподілу або з параметричним сімейством таких функцій, про симетрію розподілу та ін.

Велике значення має розділ математичної статистики, пов'язаний із проведенням вибіркових обстежень, з властивостями різних схем організації вибірок та побудовою адекватних методів оцінювання та перевірки гіпотез.

Завдання відновлення залежностей активно вивчаються понад 200 років, з розробки К. Гауссом в 1794 р. методу найменших квадратів. В даний час найбільш актуальні методи пошуку інформативного підмножини змінних та непараметричні методи.

Розробка методів апроксимації даних і скорочення розмірності опису було розпочато понад сто років тому, коли К. Пірсон створив метод основних компонентів. Пізніше було розроблено факторний аналіз та численні нелінійні узагальнення.

Різні способи побудови (кластер-анализ), аналізу та використання (дискримінантний аналіз) класифікацій (типологій) називають також способами розпізнавання образів (з учителем і без), автоматичної класифікації та ін.

Математичні методи у статистиці засновані або на використанні сум (на основі Центральної Граничної Теореми теорії ймовірностей) або показників відмінності (відстаней, метрик), як у статистиці об'єктів нечислової природи. Суворо обґрунтовані зазвичай лише асимптотичні результати. Нині комп'ютери грають велику роль математичної статистики. Вони використовуються як для розрахунків, так і для імітаційного моделювання (зокрема, у методах розмноження вибірок та при вивченні придатності асимптотичних результатів).

Основні поняття математичної статистики

2.1 Основні поняття вибіркового методу

Нехай – випадкова величина, що спостерігається у випадковому експерименті. Передбачається, що ймовірнісний простір задано (і нас не цікавитиме).

Вважатимемо, що, провівши раз цей експеримент в однакових умовах, ми отримали числа , , , - значення цієї випадкової величини в першому, другому і т.д. експерименти. Випадкова величина має деякий розподіл, який нам частково чи повністю невідомий.

Розглянемо докладніше набір, званий вибіркою.

У серії вже проведених експериментів вибірка – це набір чисел. Але якщо цю серію експериментів ще раз повторити, то замість цього набору ми отримаємо новий набір чисел. Замість числа з'явиться інше число - одне із значень випадкової величини. Тобто (і, і, і т.д.) - змінна величина, яка може приймати ті ж значення, що і випадкова величина, і так само часто (з тими ж ймовірностями). Тому до досвіду - випадкова величина, однаково розподілена з , а після досвіду - число, яке ми спостерігаємо у першому експерименті, тобто. одне з можливих значень випадкової величини.

Вибірка обсягу - це набір із незалежних і однаково розподілених випадкових величин («копій»), що мають, як і , розподіл .

Що означає «за вибіркою зробити висновок про розподіл»? Розподіл характеризується функцією розподілу, густиною або таблицею, набором числових характеристик - , , і т.д. По вибірці необхідно вміти будувати наближення всім цих параметрів.

.2 Вибірковий розподіл

Розглянемо реалізацію вибірки однією елементарному результаті - набір чисел , , . На відповідному імовірнісному просторі введемо випадкову величину , Що приймає значення , , З ймовірностями по (якщо якісь з значень співпали, складемо ймовірності відповідне число разів). Таблиця розподілу ймовірностей та функція розподілу випадкової величини виглядають так:

Розподіл величини називають емпіричним чи вибірковим розподілом. Обчислимо математичне очікування та дисперсію величини та введемо позначення для цих величин:

Так само обчислимо і момент порядку

У випадку позначимо через величину

Якщо при побудові всіх введених нами параметрів вважати вибірку , , набором випадкових величин, то й самі ці властивості - , , , , - стануть випадковими величинами. Ці характеристики вибіркового розподілу використовують з оцінки (наближення) відповідних невідомих характеристик істинного розподілу.

Причина використання параметрів розподілу для оцінки показників істинного розподілу (або ) - поблизу цих розподілів при великих.

Розглянемо, наприклад, підкидання правильного кубика. Нехай - кількість очок, що випали при кидку, . Припустимо, що одиниця у вибірці зустрінеться раз, двійка – раз тощо. Тоді випадкова величина прийматиме значення 1 , , 6 з ймовірностями , відповідно. Але ці пропорції зі зростанням наближаються до закону великих чисел. Тобто розподіл величини у певному сенсі зближується з істинним розподілом числа очок, що випадають під час підкидання правильного кубика.

Ми не будемо уточнювати, що мають на увазі під близькістю вибіркового та істинного розподілів. У наступних параграфах ми докладніше познайомимося з кожною з вищевведених характеристик і досліджуємо її властивості, у тому числі її поведінку зі зростанням обсягу вибірки.

.3 Емпірична функція розподілу, гістограма

Оскільки невідомий розподіл можна описати, наприклад, його функцією розподілу, побудуємо за вибіркою оцінку для цієї функції.

Визначення 1.

Емпіричною функцією розподілу, побудованої за вибіркою об'єму, називається випадкова функція, при кожному рівна

Нагадування:Випадкова функція

називається індикатором події. При кожному це випадкова величина, що має розподіл Бернуллі з параметром . чому?

Інакше висловлюючись, за будь-яке значення , рівне істинної ймовірності випадкової величині бути менше , оцінюється часткою елементів вибірки, менших .

Якщо елементи вибірки , , впорядкувати за зростанням (на кожному елементарному результаті), вийде новий набір випадкових величин, званий варіаційним рядом :

Елемент, називається -м членом варіаційного ряду або -й порядковою статистикою.

приклад 1.

Вибірка:

Варіаційний ряд:

Рис. 1.Приклад 1

Емпірична функція розподілу має стрибки в точках вибірки, величина стрибка в точці дорівнює , де кількість елементів вибірки, що збігаються з .

Можна побудувати емпіричну функцію розподілу за варіаційним рядом:

Іншою характеристикою розподілу є таблиця (для дискретних розподілів) або щільність (для абсолютно безперервних). Емпіричним або вибірковим аналогом таблиці або щільності є так звана гістограма.

Гістограма будується за групованими даними. Передбачувану область значень випадкової величини (або область вибіркових даних) ділять незалежно від вибірки деяку кількість інтервалів (не обов'язково однакових). Нехай , - інтервали на прямий, звані інтервалами угруповання . Позначимо через число елементів вибірки, що потрапили в інтервал :

(1)

На кожному з інтервалів будують прямокутник, площа якого є пропорційною . Загальна площа всіх прямокутників має дорівнювати одиниці. Нехай - довжина інтервалу. Висота прямокутника над дорівнює

Отримана постать називається гістограмою.

приклад 2.

Є варіаційний ряд (див. приклад 1):

Тут - десятковий логарифм, тому, тобто. при збільшенні вибірки вдвічі кількість інтервалів угруповання збільшується на 1. Зауважимо, що чим більше інтервалів угруповання, тим краще. Але, якщо брати кількість інтервалів, скажімо, порядку, то зі зростанням гістограма не наближатиметься до щільності.

Справедливим є наступне твердження:

Якщо щільність розподілу елементів вибірки є безперервною функцією, то при так, що має місце поточкова збіжність за ймовірністю гістограми до щільності.

Так що вибір логарифму розумний, але не є можливим.

Висновок

Математична (або теоретична) статистика спирається на методи та поняття теорії ймовірностей, але вирішує у якомусь сенсі зворотні завдання.

Якщо спостерігаємо одночасно прояв двох (чи більше) ознак, тобто. маємо набір значень кількох випадкових величин - що можна сказати про їхню залежність? Є вона чи ні? А якщо є, то якою є ця залежність?

Часто буває можна висловити деякі припущення про розподіл, захований у «чорному ящику», або його властивості. У цьому випадку, за досвідченими даними, потрібно підтвердити або спростувати ці припущення («гіпотези»). При цьому треба пам'ятати, що відповідь «так» чи «ні» може бути дана лише з певним ступенем достовірності, і чим довше ми можемо продовжувати експеримент, тим точніше можуть бути висновки. Найбільш сприятливою для дослідження виявляється ситуація, коли можна впевнено стверджувати про деякі властивості експерименту, що спостерігається - наприклад, про наявність функціональної залежності між спостеріганими величинами, про нормальність розподілу, про його симетричність, про наявність у розподілу щільності або про його дискретний характер, і т.д. .

Отже, про (математичну) статистику має сенс згадувати, якщо

· Є випадковий експеримент, властивості якого частково або повністю невідомі,

· Ми вміємо відтворювати цей експеримент в одних і тих же умовах деяке (а краще - будь-яке) число разів.

Список літератури

1. Баумоль У. Економічна теорія та дослідження операцій. - М.; Наука, 1999.

2. Більшов Л.М., Смирнов Н.В. Таблиці математичної статистики. М: Наука, 1995.

3. Боровков А.А. Математична статистика. М: Наука, 1994.

4. Корн Г., Корн Т. Довідник з математики для науковців та інженерів. – СПБ: Видавництво «Лань», 2003.

5. Коршунов Д.А., Чернова Н.І. Збірник завдань та вправ з математичної статистики. Новосибірськ: Вид-во Інституту математики ім. С.Л.Соболєва СО РАН, 2001.

6. Пехелецький І.Д. Математика: підручник для студентів. - М: Академія, 2003.

7. Суходільський В.Г. Лекції з вищої математики для гуманітаріїв. – СПБ Видавництво Санкт-Петербурзького державного університету. 2003

8. Феллер В. Введення в теорію ймовірностей та її застосування. - М: Мир, Т.2, 1984.

9. Харман Р., Сучасний факторний аналіз. - М: Статистика, 1972.


Харман Р., Сучасний факторний аналіз. - М: Статистика, 1972.

Схожі статті