Naključna spremenljivka x ima porazdelitveni zakon. Normalni zakon porazdelitve verjetnosti. Verjetnost, da normalno porazdeljena naključna spremenljivka pade v dani interval

Normalna gostota porazdelitve ima naslednjo obliko:

kje a- središče verjetnostne porazdelitve ali matematičnega pričakovanja dane naključne spremenljivke, tj.

standardni odklon dane naključne spremenljivke.

V praksi se izračunajo ustrezne statistične ocene. Tako bo ocena za matematično pričakovanje povprečna vrednost:

kjer je količina podatkov v obravnavanem statističnem nizu.

Matematično pričakovanje je teoretična vrednost dane naključne spremenljivke, h kateri teži povprečna vrednost z neomejenim povečevanjem količine podatkov.

Standardni odklon:

V logistiki je ta ali ona vrednost količine ocenjena z vrednostjo

v tem primeru je koeficient variacije ocenjen:

Slika 4 prikazuje graf normalne porazdelitve verjetnosti.

Slika 4 - Normalni zakon porazdelitve verjetnosti

Gostota eksponentnega zakona porazdelitve verjetnosti ima naslednjo obliko:

kjer je osnova naravnega logaritma.

Eksponentni zakon opisuje časovne parametre naključnih logističnih procesov. Naslednje naključne spremenljivke spadajo pod eksponentni zakon:

1) čas storitve za stranke;

2) čas nakladanja in razkladanja vozil;

3) čas, porabljen za druge logistične operacije

4) interval med zahtevami, ki prispejo na storitev.

Posebnost eksponentnega zakona je, da ga določa en parameter. Ob istem času

kjer je povprečna vrednost preučevanega časovnega parametra.

Za količine, ki upoštevajo eksponentni zakon, sta matematično pričakovanje M in povprečna kvadratna vrednost enaki:

Slika 5 prikazuje graf eksponentnega zakona.

Slika 5 - Eksponentni zakon porazdelitve verjetnosti

Binomski zakon porazdelitve verjetnosti

Binomski zakon porazdelitve verjetnosti je izražen s formulo:

Ta zakon določa verjetnosti dogodkov glede na skupno število dogodkov

kjer je verjetnost pojava enega dogodka iz dane skupine dogodkov;

verjetnost, da se navedeni dogodek ne zgodi,

Vrednost je število kombinacij Avtor: , se določi s formulo:

Za izračun števila kombinacij se uporablja enakost:

Pri binomski porazdelitvi je najverjetnejše število dogodkov:

Primerjava zakonov porazdelitve verjetnosti. Merilo dogovora

V teoriji verjetnosti obstajajo metode, ki omogočajo oceno stopnje ujemanja dejanskih porazdelitev verjetnosti z njihovimi teoretičnimi vrednostmi. V ta namen se uporabljajo tako imenovani kriteriji soglasja, med katerimi je najbolj znan kriterij. Ta kriterij omogoča primerjavo empiričnih zakonov porazdelitve, pridobljenih iz istih dejanskih podatkov.

Manjša kot je vrednost, bolje se ta empirični zakon ujema s teoretičnim. Za primerjavo empiričnih zakonov porazdelitve verjetnosti se vrednosti izračunajo po naslednji formuli:

Kje so dejanske in teoretične vrednosti frekvenc preučevanih distribucijskih zakonov.

Vrednost je prav tako naključna in zato upošteva lasten distribucijski zakon. Pristop k primerjavi empiričnih porazdelitvenih zakonov lahko ponazorimo s primerom.

Ugotovimo, kateri zakon porazdelitve verjetnosti - normalni ali eksponentni - bolje odraža porazdelitev dane količine, tj. Preverimo hipoteze. Kot proučevano vrednost vzamemo obseg prodaje določenega izdelka. Začetni podatki so predstavljeni v tabeli 3:

Tabela 3. Informacije o prodaji blaga

Prodaja (tisoč rubljev)

Naloga je oblikovana na naslednji način: sestaviti verjetnostno porazdelitev obsega povpraševanja po danem izdelku, če so na podlagi opravljene raziskave doseženi rezultati prodaje v tisoč rubljih. na dan.

Rešitev problema je predstavljena v prilogi 4.

Na splošno so številni logistični procesi, in sicer: prodaja, odprema izdelkov iz trgovskih podjetij na debelo, gibanje zalog, zagotavljanje storitev za dobavo izdelkov, poraba materialnih virov itd. opisan z normalnim zakonom porazdelitve verjetnosti. Posebna značilnost te porazdelitve je prisotnost izrazite simetrije naključnih spremenljivk glede na njihovo povprečno vrednost. Za te procese velja običajni zakon za vse izdelke, določene skupine izdelkov ali posamezne artikle blaga.

Pri ABC analizi strukture logističnih procesov so nastale značilnosti v vrednostnem ali fizičnem smislu podvržene eksponentni porazdelitvi.

Dejstvo, da je prodaja izdelkov v skladu z običajnim zakonom, je pomembno za logistiko, saj vam omogoča določitev količine zalog, za kar se priporoča naslednja formula:

kje je potrebna količina zalog za nedoločen čas,

povprečna prodaja na časovno enoto (dan, teden, mesec),

standardni odklon.

Za obravnavani primer je zaloga enaka:

Ta model kaže, da mora biti vsaka zahteva kupca po določeni kakovosti izdelka izpolnjena z verjetnostjo, ki je blizu 1. Ta model uporablja pravilo "treh sigm". V običajnem zakonu to ustreza verjetnosti 0,99.

V sodobnih razmerah računalniške tehnologije omogočajo sledenje povprečne prodaje in standardnih odklonov v trenutnem časovnem načinu ter prilagajanje količine zalog.

Predloženi model za določanje zalog se lahko uporablja tako za trgovino na drobno kot za trgovino na debelo.

1.2.4. Naključne spremenljivke in njihove porazdelitve

Porazdelitve naključnih spremenljivk in porazdelitvene funkcije. Porazdelitev numerične naključne spremenljivke je funkcija, ki enolično določa verjetnost, da naključna spremenljivka zavzame dano vrednost ali pripada nekemu danemu intervalu.

Prvi je, če ima naključna spremenljivka končno število vrednosti. Potem je porazdelitev podana s funkcijo P(X = x), dodeljevanje vsaki možni vrednosti X naključna spremenljivka X verjetnost, da X = x.

Drugi je, če naključna spremenljivka zavzame neskončno veliko vrednosti. To je mogoče le, če je verjetnostni prostor, na katerem je definirana naključna spremenljivka, sestavljen iz neskončnega števila elementarnih dogodkov. Nato je porazdelitev podana z množico verjetnosti P(a < X za vse pare številk a, b tako da a . Porazdelitev je mogoče določiti s pomočjo t.i. porazdelitvena funkcija F(x) = P(X opredelitev za vse realne X verjetnost, da naključna spremenljivka X ima vrednosti manjše od X. To je jasno

P(a < X

To razmerje kaže, da je distribucijo mogoče izračunati iz distribucijske funkcije in, nasprotno, distribucijsko funkcijo je mogoče izračunati iz distribucije.

Porazdelitvene funkcije, ki se uporabljajo v verjetnostno-statističnih metodah odločanja in drugih uporabnih raziskavah, so bodisi diskretne, zvezne ali njihove kombinacije.

Diskretne porazdelitvene funkcije ustrezajo diskretnim naključnim spremenljivkam, ki vzamejo končno število vrednosti ali vrednosti iz niza, katerega elemente je mogoče oštevilčiti z naravnimi števili (takšni nizi se v matematiki imenujejo števni). Njihov graf je videti kot stopničasta lestev (slika 1).

Primer 1.številka X artikli z napako v seriji dobijo vrednost 0 z verjetnostjo 0,3, vrednost 1 z verjetnostjo 0,4, vrednost 2 z verjetnostjo 0,2 in vrednost 3 z verjetnostjo 0,1. Graf porazdelitvene funkcije naključne spremenljivke X prikazano na sliki 1.

Slika 1. Graf porazdelitvene funkcije števila izdelkov z napako.

Zvezne porazdelitvene funkcije nimajo skokov. Monotono naraščajo, ko se argument povečuje - od 0 at do 1 at. Naključne spremenljivke, ki imajo zvezne porazdelitvene funkcije, imenujemo zvezne.

Zvezne porazdelitvene funkcije, ki se uporabljajo v verjetnostno-statističnih metodah odločanja, imajo izvedenke. Prva izpeljanka f(x) distribucijske funkcije F(x) se imenuje gostota verjetnosti,

Z uporabo gostote verjetnosti lahko določite porazdelitveno funkcijo:

Za katero koli distribucijsko funkcijo

Naštete lastnosti porazdelitvenih funkcij se nenehno uporabljajo v verjetnostnih in statističnih metodah odločanja. Zlasti zadnja enakost implicira specifično obliko konstant v formulah za gostoto verjetnosti, obravnavanih spodaj.

Primer 2. Pogosto se uporablja naslednja distribucijska funkcija:

(1)

kje a in b– nekaj številk, a . Poiščimo gostoto verjetnosti te porazdelitvene funkcije:

(na točkah x = a in x = b odvod funkcije F(x) ne obstaja).

Naključna spremenljivka s porazdelitveno funkcijo (1) se imenuje "enakomerno porazdeljena na intervalu [ a; b]».

Mešane porazdelitvene funkcije se pojavijo zlasti takrat, ko se opazovanja na neki točki ustavijo. Na primer pri analizi statističnih podatkov, pridobljenih z uporabo načrtov testiranja zanesljivosti, ki predvidevajo prekinitev testiranja po določenem obdobju. Ali pri analizi podatkov o tehničnih izdelkih, ki so zahtevali garancijsko popravilo.

Primer 3. Naj bo na primer življenjska doba električne žarnice naključna spremenljivka s porazdelitveno funkcijo F(t), in preskus se izvaja, dokler žarnica ne odpove, če se to zgodi v manj kot 100 urah od začetka preskusa, ali dokler t 0= 100 ur. Naj G(t)– funkcija porazdelitve časa delovanja žarnice v dobrem stanju med tem preskusom. Potem

funkcija G(t) ima skok na točki t 0, saj ustrezna naključna spremenljivka prevzame vrednost t 0 z verjetnostjo 1- F(t 0)> 0.

Značilnosti naključnih spremenljivk. Pri verjetnostno-statističnih metodah odločanja se uporabljajo številne značilnosti naključnih spremenljivk, izražene preko porazdelitvenih funkcij in gostot verjetnosti.

Pri opisovanju diferenciacije dohodka, pri iskanju meja zaupanja za parametre porazdelitev naključnih spremenljivk in v mnogih drugih primerih se uporablja koncept, kot je "kvantil reda". r«, kjer je 0< str < 1 (обозначается x str). Kvantil naročila r– vrednost naključne spremenljivke, za katero ima vrednost distribucijska funkcija r ali pride do "skoka" z manjše vrednosti r na večjo vrednost r(slika 2). Lahko se zgodi, da je ta pogoj izpolnjen za vse vrednosti x, ki pripadajo temu intervalu (tj. porazdelitvena funkcija je na tem intervalu konstantna in je enaka r). Potem se vsaka taka vrednost imenuje "kvantil reda" r" Za zvezne porazdelitvene funkcije praviloma obstaja en sam kvantil x str naročilo r(slika 2) in

F(x p) = p. (2)

Slika 2. Opredelitev kvantila x str naročilo r.

Primer 4. Poiščimo kvantil x str naročilo r za distribucijsko funkcijo F(x) od (1).

Ob 0< str < 1 квантиль x str se najde iz enačbe

tiste. x str = a + p(b – a) = a( 1- p) +bp. pri str= 0 katerikoli x < a je kvantil reda str= 0. Kvantil reda str= 1 je poljubno število x > b.

Za diskretne porazdelitve praviloma ni x str, ki izpolnjuje enačbo (2). Natančneje, če je porazdelitev slučajne spremenljivke podana v tabeli 1, kjer x 1< x 2 < … < x k , potem enakost (2), obravnavana kot enačba glede na x str, ima rešitve samo za k vrednosti str, in sicer

p = p 1,

p = p 1 + p 2 ,

p = p 1 + p 2 + p 3 ,

p = p 1 + p 2 + …+ p m, 3 < m < k,

str = str 1 + str 2 + … + p k.

Tabela 1.

Porazdelitev diskretne naključne spremenljivke

Za naštete k vrednosti verjetnosti str rešitev x str enačba (2) ni edinstvena, namreč

F(x) = p 1 + p 2 + … + p m

za vse X tako da x m< x < x m+1. Tisti. x p – poljubno število iz intervala (x m; x m+1 ]. Za vse ostale r iz intervala (0;1), ki ni vključen v seznam (3), pride do "skoka" z vrednosti manj r na večjo vrednost r. Če namreč

p 1 + p 2 + … + p m

to x p = x m+1.

Upoštevana lastnost diskretnih porazdelitev povzroča znatne težave pri tabeliranju in uporabi takšnih porazdelitev, saj je nemogoče natančno vzdrževati tipične numerične vrednosti značilnosti porazdelitve. To še posebej velja za kritične vrednosti in ravni pomembnosti neparametričnih statističnih testov (glej spodaj), saj so porazdelitve statistike teh testov diskretne.

Kvantilni vrstni red je v statistiki zelo pomemben r= ½. Imenuje se mediana (naključna spremenljivka X ali njegovo distribucijsko funkcijo F(x)) in je določen Jaz (X). V geometriji obstaja pojem "mediana" - ravna črta, ki poteka skozi vrh trikotnika in deli njegovo nasprotno stran na polovico. V matematični statistiki mediana ne deli stranice trikotnika na pol, ampak porazdelitev naključne spremenljivke: enakost F(x 0,5)= 0,5 pomeni, da je verjetnost, da pridete v levo x 0,5 in verjetnost, da prideš na desno x 0,5(ali neposredno na x 0,5) so med seboj enaki in enaki ½, tj.

p(X < x 0,5) = p(X > x 0,5) = ½.

Mediana označuje "središče" porazdelitve. Z vidika enega od sodobnih konceptov - teorije stabilnih statističnih postopkov - je mediana boljša značilnost naključne spremenljivke kot matematično pričakovanje. Pri obdelavi merilnih rezultatov na ordinalni lestvici (glej poglavje Merska teorija) lahko uporabimo mediano, matematičnega pričakovanja pa ne.

Značilnost naključne spremenljivke, kot je način, ima jasen pomen - vrednost (ali vrednosti) naključne spremenljivke, ki ustreza lokalnemu maksimumu gostote verjetnosti za zvezno naključno spremenljivko ali lokalnemu maksimumu verjetnosti za diskretno naključno spremenljivko .

če x 0– način naključne spremenljivke z gostoto f(x), potem, kot je znano iz diferencialnega računa, .

Naključna spremenljivka ima lahko veliko načinov. Torej, za enakomerno porazdelitev (1) vsaka točka X tako da a< x < b , je moda.

Vendar je to izjema. Večina naključnih spremenljivk, ki se uporabljajo v verjetnostnih statističnih metodah odločanja in drugih uporabnih raziskavah, ima en način. Naključne spremenljivke, gostote, porazdelitve, ki imajo en način, imenujemo unimodalne. X Matematično pričakovanje za diskretne naključne spremenljivke s končnim številom vrednosti je obravnavano v poglavju "Dogodki in verjetnosti". Za zvezno naključno spremenljivko matematično pričakovanje M(X)

zadošča enakosti

ki je analog formule (5) iz izjave 2 poglavja “Dogodki in verjetnosti”. Primer 5. X Pričakovanje enakomerno porazdeljene naključne spremenljivke

enako

Za naključne spremenljivke, obravnavane v tem poglavju, veljajo vse tiste lastnosti matematičnih pričakovanj in varianc, ki so bile prej obravnavane za diskretne naključne spremenljivke s končnim številom vrednosti. Vendar teh lastnosti ne dokazujemo, saj zahtevajo poglabljanje v matematične tankosti, kar ni potrebno za razumevanje in kvalificirano uporabo verjetnostno-statističnih metod odločanja. Ta učbenik se zavestno izogiba matematičnim tankostim, povezanim zlasti s koncepti merljivih množic in merljivih funkcij, algebre dogodkov itd. Tisti, ki želijo obvladati te koncepte, se morajo obrniti na specializirano literaturo, zlasti na enciklopedijo.

Vsaka od treh značilnosti - matematično pričakovanje, mediana, način - opisuje "središče" porazdelitve verjetnosti. Koncept "središča" je mogoče definirati na različne načine - torej tri različne značilnosti. Vendar pa za pomemben razred porazdelitev – simetrično unimodalno – vse tri značilnosti sovpadajo.

Gostota porazdelitve f(x)– gostota simetrične porazdelitve, če obstaja število x 0 tako da

. (3)

Enačba (3) pomeni, da je graf funkcije y = f(x) simetrična glede na navpičnico, ki poteka skozi središče simetrije X = X 0 . Iz (3) sledi, da simetrična porazdelitvena funkcija zadosti razmerju

(4)

Za simetrično porazdelitev z enim načinom matematično pričakovanje, mediana in način sovpadajo in so enaki x 0.

Najpomembnejši primer je simetrija okoli 0, tj. x 0= 0. Potem (3) in (4) postaneta enačbi

(6)

oz. Zgornje relacije kažejo, da ni potrebe po preglednici simetričnih porazdelitev za vse X, dovolj je, da imamo mize pri x > x 0.

Naj omenimo še eno lastnost simetričnih porazdelitev, ki se nenehno uporablja v verjetnostno-statističnih metodah odločanja in drugih aplikativnih raziskavah. Za zvezno distribucijsko funkcijo

P(|X| < a) = P(-a < X < a) = F(a) – F(-a),

kje F– porazdelitvena funkcija naključne spremenljivke X. Če distribucijska funkcija F je simetrična okoli 0, tj. potem zanjo velja formula (6).

P(|X| < a) = 2F(a) – 1.

Pogosto se uporablja druga formulacija zadevne izjave: če

.

Če sta in kvantila reda oziroma (glej (2)) porazdelitvene funkcije simetrične okoli 0, potem iz (6) sledi, da

Od značilnosti položaja - matematično pričakovanje, mediana, način - pojdimo na značilnosti širjenja naključne spremenljivke X: varianca, standardni odklon in koeficient variacije v. Definicija in lastnosti disperzije za diskretne naključne spremenljivke so bile obravnavane v prejšnjem poglavju. Za zvezne naključne spremenljivke

Standardni odklon je nenegativna vrednost kvadratnega korena variance:

Koeficient variacije je razmerje med standardnim odklonom in matematičnim pričakovanjem:

Koeficient variacije se uporabi, ko M(X)> 0. Meri širjenje v relativnih enotah, standardni odklon pa v absolutnih enotah.

Primer 6. Za enakomerno porazdeljeno naključno spremenljivko X Poiščimo disperzijo, standardni odklon in koeficient variacije. Varianca je:

Spreminjanje spremenljivke omogoča zapis:

kje c = (ba)/ 2. Zato je standardna deviacija enaka in koeficient variacije je:

Za vsako naključno spremenljivko X določi še tri količine – centrirano Y, normalizirano V in dano U. Centrirana naključna spremenljivka Y je razlika med dano naključno spremenljivko X in njegovo matematično pričakovanje M(X), tiste. Y = X – M(X). Pričakovanje centrirane naključne spremenljivke Y je enaka 0, varianca pa je varianca dane naključne spremenljivke: M(Y) = 0, D(Y) = D(X). Distribucijska funkcija F Y(x) centrirana naključna spremenljivka Y povezana z distribucijsko funkcijo F(x) izvirna naključna spremenljivka X razmerje:

F Y(x) = F(x + M(X)).

Za gostote teh naključnih spremenljivk velja naslednja enakost:

f Y(x) = f(x + M(X)).

Normalizirana naključna spremenljivka V je razmerje dane naključne spremenljivke X njegovemu standardnemu odklonu, tj. . Pričakovanje in varianca normalizirane slučajne spremenljivke V izraženo skozi lastnosti X Torej:

,

kje v– koeficient variacije izvirne naključne spremenljivke X. Za distribucijsko funkcijo F V(x) in gostoto f V(x) normalizirana naključna spremenljivka V imamo:

kje F(x) – porazdelitvena funkcija izvirne naključne spremenljivke X, A f(x) – njegovo verjetnostno gostoto.

Zmanjšana naključna spremenljivka U je centrirana in normalizirana naključna spremenljivka:

.

Za dano naključno spremenljivko

Normalizirane, centrirane in reducirane naključne spremenljivke se nenehno uporabljajo tako v teoretičnih študijah kot v algoritmih, programskih izdelkih, regulativni, tehnični in inštruktorski dokumentaciji. Še posebej zato, ker enakosti omogočajo poenostavitev utemeljitve metod, formulacije izrekov in računskih formul.

Uporabljajo se transformacije naključnih spremenljivk in bolj splošne. Torej, če Y = aX + b, Kje a in b– torej nekaj številk

Primer 7.Če takrat Y je reducirana naključna spremenljivka, formule (8) pa se pretvorijo v formule (7).

Z vsako naključno spremenljivko X lahko povežete veliko naključnih spremenljivk Y, podana s formulo Y = aX + b pri različnih a> 0 in b. Ta niz se imenuje družina pomika lestvice, ki ga ustvari naključna spremenljivka X. Distribucijske funkcije F Y(x) sestavljajo družino porazdelitev po lestvici, ki jih ustvari distribucijska funkcija F(x). Namesto Y = aX + b pogosto uporabljajo snemanje

številka z se imenuje parameter premika in število d- parameter lestvice. Formula (9) to pokaže X– rezultat merjenja določene količine – gre v U– rezultat merjenja iste količine, če se začetek merjenja premakne na točko z in nato uporabite novo mersko enoto in d krat večji od starega.

Za družino lestvice (9) se porazdelitev X imenuje standardna. V verjetnostnih statističnih metodah odločanja in drugih uporabnih raziskavah se uporabljajo standardna normalna porazdelitev, standardna Weibull-Gnedenkova porazdelitev, standardna gama porazdelitev itd. (glej spodaj).

Uporabljajo se tudi druge transformacije naključnih spremenljivk. Na primer za pozitivno naključno spremenljivko X razmišljajo Y= dnevnik X, kjer je lg X– decimalni logaritem števila X.

Veriga enakosti F Y (x) = P( X< x) = P(X < 10lg 10x) = F(

x) X in Y.

povezuje distribucijske funkcije X Pri obdelavi podatkov se uporabljajo naslednje značilnosti naključne spremenljivke kot trenutki reda q , tj. matematična pričakovanja naključne spremenljivke, kot trenutki reda Xq kot trenutki reda= 1, 2, ... Tako je samo matematično pričakovanje trenutek reda 1. Za diskretno naključno spremenljivko je trenutek reda

se lahko izračuna kot

Za zvezno naključno spremenljivko kot trenutki reda Trenutki reda kot trenutki reda, imenovani tudi začetni trenutki reda kot trenutki reda, v nasprotju s sorodnimi značilnostmi – osrednjimi momenti reda

podana s formulo

Tako je disperzija osrednji moment reda 2. Normalna porazdelitev in centralni limitni izrek.

Pri verjetnostno-statističnih metodah odločanja pogosto govorimo o normalni porazdelitvi. Včasih ga poskušajo uporabiti za modeliranje distribucije začetnih podatkov (ti poskusi niso vedno upravičeni - glej spodaj). Še pomembneje je, da številne metode obdelave podatkov temeljijo na dejstvu, da imajo izračunane vrednosti porazdelitve, ki so blizu normalnim. X 1 , X 2 ,…, Naj M(X n) = m X i D(X n) = , in odstopanja = 1, 2,…, i n

,... Kot izhaja iz rezultatov prejšnjega poglavja, Upoštevajte zmanjšano naključno spremenljivko U n za znesek

, in sicer M(Upoštevajte zmanjšano naključno spremenljivko) = 0, D(Upoštevajte zmanjšano naključno spremenljivko) = 1.

Kot sledi iz formul (7), X 1 , X 2 ,…, Naj(za enako porazdeljene izraze). Naj M(X n) = m X i D(X n) = , in odstopanja = 1, 2,…, i, … – neodvisne enako porazdeljene naključne spremenljivke z matematičnimi pričakovanji

kje ,... Potem za vsak x obstaja meja F(x)

– funkcija standardne normalne porazdelitve. Več o funkciji F(x) – spodaj (beri "phi iz x", ker F

Centralni mejni izrek (CLT) je dobil svoje ime, ker je osrednji, najpogosteje uporabljen matematični rezultat teorije verjetnosti in matematične statistike. Zgodovina CLT traja približno 200 let - od leta 1730, ko je angleški matematik A. Moivre (1667-1754) objavil prvi rezultat v zvezi s CLT (glej spodaj o Moivre-Laplaceovem izreku), do dvajsetih in tridesetih let prejšnjega stoletja. dvajsetega stoletja, ko je Finn J.W. Lindeberg, Francoz Paul Levy (1886-1971), Jugoslovan V. Feller (1906-1970), Rus A.Ya. Khinchin (1894-1959) in drugi znanstveniki so dobili potrebne in zadostne pogoje za veljavnost klasičnega centralnega mejnega izreka.

Razvoj obravnavane teme se tu ni ustavil - preučevali so naključne spremenljivke, ki nimajo disperzije, tj. tiste, za katere

(akademik B.V. Gnedenko in drugi), situacija, ko se seštejejo naključne spremenljivke (natančneje, naključni elementi) bolj kompleksne narave kot števila (akademiki Yu.V. Prokhorov, A.A. Borovkov in njihovi sodelavci) itd. .d.

Distribucijska funkcija ,... Potem za vsak x obstaja meja je podana z enakostjo

,

kjer je gostota standardne normalne porazdelitve, ki ima precej zapleten izraz:

.

Tukaj je =3,1415925... število, znano v geometriji, enako razmerju med obodom in premerom, e = 2,718281828... - osnova naravnih logaritmov (če si želite zapomniti to številko, upoštevajte, da je 1828 leto rojstva pisatelja L.N. Tolstoja). Kot je znano iz matematične analize,

Pri obdelavi rezultatov opazovanja se normalna porazdelitvena funkcija ne izračuna po danih formulah, ampak se najde s pomočjo posebnih tabel ali računalniških programov. Najboljše »Tabele matematične statistike« v ruščini so sestavili dopisni člani Akademije znanosti ZSSR L.N. Bolshev in N.V. Smirnov.

Oblika gostote standardne normalne porazdelitve izhaja iz matematične teorije, ki je tukaj ne moremo upoštevati, kot tudi dokaz CLT.

Za ponazoritev podajamo majhne tabele distribucijske funkcije ,... Potem za vsak x obstaja meja(tabela 2) in njegove kvantile (tabela 3). funkcija ,... Potem za vsak x obstaja meja simetrično okoli 0, kar se odraža v tabeli 2-3.

Tabela 2.

Standardna funkcija normalne porazdelitve.

Če je naključna spremenljivka X ima distribucijsko funkcijo F(x), to matematično pričakovanje = 0, D(X) = 1. Ta trditev je dokazana v teoriji verjetnosti na podlagi oblike gostote verjetnosti. Skladen je s podobno izjavo za značilnosti reducirane naključne spremenljivke Upoštevajte zmanjšano naključno spremenljivko, kar je povsem naravno, saj CLT navaja, da z neomejenim povečanjem števila členov distribucijska funkcija Upoštevajte zmanjšano naključno spremenljivko teži k standardni funkciji normalne porazdelitve F(x), in za katerokoli X.

Tabela 3.

Kvantili standardne normalne porazdelitve.

Kvantil naročila r

Kvantil naročila r

Uvedimo koncept družine normalnih porazdelitev. Po definiciji je normalna porazdelitev porazdelitev naključne spremenljivke X, za katero je porazdelitev reducirane naključne spremenljivke F(x). Kot izhaja iz splošnih lastnosti družin porazdelitev s premikom po lestvici (glej zgoraj), je normalna porazdelitev porazdelitev naključne spremenljivke

kje X– naključna spremenljivka s porazdelitvijo F(X), in m = M(Y), = D(Y). Normalna porazdelitev s parametri premika m običajno je navedeno merilo n(m, ) (včasih se uporablja zapis n(m, ) ).

Kot sledi iz (8), gostota verjetnosti normalne porazdelitve n(m, ) Obstaja

Normalne porazdelitve tvorijo družino zamika na lestvici. V tem primeru je parameter lestvice d= 1/ in parameter premika c = - m/ .

Za središčne momente tretjega in četrtega reda normalne porazdelitve veljajo naslednje enakosti:

Te enakosti tvorijo osnovo klasičnih metod za preverjanje, ali opazovanja sledijo normalni porazdelitvi. Dandanes se običajno priporoča testiranje normalnosti z uporabo merila W Shapiro - Wilka. Problem testiranja normalnosti je obravnavan spodaj.

Če naključne spremenljivke X 1 in X 2 imajo distribucijske funkcije n(m 1 , 1) in n(m 2 , 2) torej torej X 1+ X 2 ima distribucijo Torej, če naključne spremenljivke X 1 , X 2 ,…, Naj n(m, ) , potem njihova aritmetična sredina

ima distribucijo n(m, ) . Te lastnosti normalne porazdelitve se nenehno uporabljajo v različnih verjetnostnih in statističnih metodah odločanja, zlasti pri statističnem reguliranju tehnoloških procesov in pri statističnem sprejemnem nadzoru na podlagi kvantitativnih kriterijev.

Z uporabo normalne porazdelitve so definirane tri porazdelitve, ki se danes pogosto uporabljajo pri statistični obdelavi podatkov.

Porazdelitev (hi - kvadrat) – porazdelitev naključne spremenljivke

kje so naključne spremenljivke X 1 , X 2 ,…, Naj neodvisni in imajo enako porazdelitev n(0,1). V tem primeru je število terminov, tj. i, se imenuje "število prostostnih stopinj" porazdelitve hi-kvadrat.

Distribucija t Studentov t je porazdelitev naključne spremenljivke

kje so naključne spremenljivke U in X neodvisen, U ima standardno normalno porazdelitev n(0,1) in X– porazdelitev chi – kvadrat c i stopnje svobode. Ob istem času i se imenuje "število prostostnih stopinj" Studentove porazdelitve. To porazdelitev je leta 1908 uvedel angleški statistik W. Gosset, ki je delal v tovarni piva.

V tej tovarni so za sprejemanje ekonomskih in tehničnih odločitev uporabljali verjetnostne in statistične metode, zato je njeno vodstvo V. Gossetu prepovedalo objavljanje znanstvenih člankov pod svojim imenom. Na ta način so bile zaščitene poslovne skrivnosti in »know-how« v obliki verjetnostnih in statističnih metod, ki jih je razvil V. Gosset. Imel pa je priložnost objavljati pod psevdonimom Študent. Zgodovina Gosset-Studenta kaže, da so se menedžerji v Veliki Britaniji še sto let zavedali večje ekonomske učinkovitosti verjetnostno-statističnih metod odločanja.

kje so naključne spremenljivke X 1 in X 2 Fisherjeva porazdelitev je porazdelitev naključne spremenljivke k 1 in k 2 so neodvisne in imajo hi-kvadrat porazdelitve s številom prostostnih stopenj (k 1 , k 2 ) oz. Hkrati pa par k 1 – par "stopenj svobode" Fisherjeve porazdelitve, in sicer, k 2 je število prostostnih stopenj števca in

– število prostostnih stopenj imenovalca. Porazdelitev naključne spremenljivke F je dobila ime po velikem angleškem statistiku R. Fisherju (1890-1962), ki jo je aktivno uporabljal v svojih delih.

Izraze za hi-kvadrat, Studentove in Fisherjeve porazdelitvene funkcije, njihove gostote in značilnosti ter tabele najdete v specializirani literaturi (glej na primer).

Kot smo že omenili, se normalne porazdelitve zdaj pogosto uporabljajo v verjetnostnih modelih na različnih uporabnih področjih. Kaj je razlog, da je ta dvoparametrska družina porazdelitev tako razširjena? To pojasnjuje naslednji izrek. X 1 , X 2 ,…, Naj Centralni mejni izrek M(X 1 (za različno porazdeljene izraze). NajX 2 ,… - neodvisne naključne spremenljivke z matematičnimi pričakovanjiX), M( D(X 1 ), D(X 2 ),…, D(X),…, M(

n), ... in odstopanja Upoštevajte zmanjšano naključno spremenljivko,

n), ... oz. Naj X.

Nato, če so veljavni določeni pogoji, zagotavljanje, da je prispevek katerega koli od pogojev v

za kogarkoli aditivno, tj.

z dodatkom, potem je porazdelitev rezultata meritve (opazovanja) blizu normalne. X Včasih se verjame, da je za normalno porazdelitev dovolj, da rezultat meritve (opazovanja) X se oblikuje pod vplivom številnih razlogov, od katerih ima vsak majhen vpliv. To je narobe. Pomembno je, kako ti vzroki delujejo. Če je dodatek, potem ima približno normalno porazdelitev. če multiplikativno X(tj. dejanja posameznih vzrokov se množijo in ne seštevajo), nato porazdelitev X blizu ne normalnemu, ampak tako imenovanemu. logaritemsko normalno, tj. ne X, log X pa ima približno normalno porazdelitev.

Če ni razloga za domnevo, da deluje eden od teh dveh mehanizmov za oblikovanje končnega rezultata (ali kakšen drug natančno definiran mehanizem), potem o distribuciji

nič določnega se ne da reči. Iz navedenega izhaja, da pri konkretnem aplikativnem problemu normalnosti rezultatov meritev (opazanj) praviloma ni mogoče ugotoviti iz splošnih premislekov, temveč jo je treba preveriti s statističnimi kriteriji. Ali pa uporabite neparametrične statistične metode, ki ne temeljijo na predpostavkah o pripadnosti porazdelitvenih funkcij rezultatov meritev (opazanj) eni ali drugi družini parametrov.

Zvezne porazdelitve, ki se uporabljajo v verjetnostnih in statističnih metodah odločanja. X Poleg družine normalnih porazdelitev s premikom po lestvici se široko uporabljajo številne druge družine porazdelitev - lognormalne, eksponentne, Weibull-Gnedenkove, gama porazdelitve. Y= dnevnik X Poglejmo te družine. Naključna spremenljivka ima lognormalno porazdelitev, če je naključna spremenljivka X = 2,3026…Y ima normalno porazdelitev. Potem n(a 1 Z= dnevnik X ima tudi normalno porazdelitev X,σ 1)

, kjer ln X = X 1 X 2 Naj- naravni logaritem X n, in odstopanja = 1, 2,…, i. i Gostota lognormalne porazdelitve je:

Obstajajo še drugi verjetnostni modeli, ki vodijo do lognormalnega zakona.

Klasičen primer takega modela je podal A.N. Kolmogorov, ki je iz fizikalno zasnovanega sistema postulatov prišel do zaključka, da so velikosti delcev pri drobljenju kosov rude, premoga itd. v krogličnih mlinih imajo lognormalno porazdelitev. X Preidimo k drugi družini porazdelitev, ki se pogosto uporablja v različnih verjetnostno-statističnih metodah odločanja in drugih uporabnih raziskavah – družini eksponentnih porazdelitev. Začnimo z verjetnostnim modelom, ki vodi do takih porazdelitev. Če želite to narediti, upoštevajte "tok dogodkov", tj. zaporedje dogodkov, ki se zgodijo drug za drugim v določenih časovnih točkah. Primeri vključujejo: pretok klica v telefonski centrali; potek okvar opreme v tehnološki verigi; potek napak izdelka med preskušanjem izdelka; pretok zahtev strank do bančne poslovalnice; tok kupcev, ki se prijavljajo za blago in storitve itd. V teoriji tokov dogodkov velja izrek, podoben centralnemu mejnemu izreku, vendar ne gre za seštevanje slučajnih spremenljivk, ampak za seštevanje tokov dogodkov. Obravnavamo skupni tok, sestavljen iz velikega števila neodvisnih tokov, od katerih nobeden nima prevladujočega vpliva na skupni pretok. Na primer, klicni tok, ki vstopa v telefonsko centralo, je sestavljen iz velikega števila neodvisnih klicnih tokov, ki izvirajo od posameznih naročnikov. Dokazano je, da v primeru, ko karakteristike tokov niso odvisne od časa, celoten pretok v celoti opisuje ena številka - jakost toka. Za skupni tok upoštevajte naključno spremenljivko

(10)

- dolžina časovnega intervala med zaporednimi dogodki. Njegova distribucijska funkcija ima obliko eTa porazdelitev se imenuje eksponentna porazdelitev, ker formula (10) vključuje eksponentno funkcijo x z. Vrednost 1/λ je parameter lestvice. Včasih je uveden tudi parameter prestavljanja , se porazdelitev naključne spremenljivke imenuje eksponentna X + s X, kjer je distribucija

Eksponentne porazdelitve so poseben primer t.i. Weibullova - Gnedenkova porazdelitev. Imenujejo se po imenih inženirja V. Weibulla, ki je te porazdelitve uvedel v prakso analize rezultatov preskusov utrujenosti, in matematika B. V. Gnedenka (1912-1995), ki je takšne porazdelitve prejel kot mejne pri preučevanju maksimuma rezultatov testa. Naj X- naključna spremenljivka, ki označuje trajanje delovanja izdelka, kompleksnega sistema, elementa (tj. vir, čas delovanja do mejnega stanja itd.), Trajanje delovanja podjetja ali življenja živega bitja itd. Intenzivnost okvare igra pomembno vlogo

(11)

kje F(x) in f(x) - porazdelitvena funkcija in gostota naključne spremenljivke X.

Opišimo tipično obnašanje stopnje napak. Celoten časovni interval lahko razdelimo na tri obdobja. Na prvem izmed njih funkcijo λ(x) ima visoke vrednosti in jasno tendenco zmanjšanja (najpogosteje se monotono zmanjšuje). To je mogoče razložiti s prisotnostjo zadevnih proizvodnih enot v seriji z očitnimi in skritimi napakami, ki vodijo do razmeroma hitre okvare teh proizvodnih enot. Prvo obdobje se imenuje "vdorno obdobje" (ali "vdor"). To je tisto, kar običajno pokriva garancijska doba.

Nato pride obdobje normalnega delovanja, za katerega je značilna približno konstantna in relativno nizka stopnja napak. Narava okvar v tem obdobju je nenadna (nesreče, napake operativnega osebja itd.) In ni odvisna od trajanja delovanja proizvodne enote.

Končno je zadnje obdobje delovanja obdobje staranja in obrabe. Narava okvar v tem obdobju je v ireverzibilnih fizikalnih, mehanskih in kemičnih spremembah materialov, ki vodijo v progresivno poslabšanje kakovosti proizvodne enote in njeno končno odpoved.

Vsako obdobje ima svojo vrsto funkcije λ(x). Razmislimo o razredu odvisnosti moči

λ(x) = λ 0bx b -1 , (12)

kje λ 0 > 0 in b> 0 - nekateri številski parametri. Vrednote b < 1, b= 0 in b> 1 ustreza vrsti stopnje napak v obdobjih utekanja, normalnega delovanja in staranja.

Razmerje (11) pri dani stopnji napak λ(x)- diferencialna enačba za funkcijo F(x). Iz teorije diferencialnih enačb izhaja, da

(13)

Če nadomestimo (12) v (13), dobimo to

(14)

Porazdelitev, podana s formulo (14), se imenuje Weibullova - Gnedenkova porazdelitev. Ker

potem iz formule (14) sledi, da je količina A, podana s formulo (15), je parameter lestvice. F(x - c Včasih je uveden tudi parameter premika, tj. Weibull-Gnedenkove porazdelitvene funkcije se imenujejo F(x), kje b.

) je podana s formulo (14) za nekaj λ 0 in

(16)

kje a Weibull-Gnedenkova gostota porazdelitve ima obliko b> 0 - parameter lestvice, z> 0 - parameter obrazca, A- parameter premika. V tem primeru parameter λ iz formule (16) je povezan s parametrom

0 iz formule (14) z razmerjem, podanim v formuli (15). b = 1.

Eksponentna porazdelitev je zelo poseben primer Weibull-Gnedenkove porazdelitve, ki ustreza vrednosti parametra oblike X 1 , X 2 ,…, Naj Weibull-Gnedenkova porazdelitev se uporablja tudi pri konstruiranju verjetnostnih modelov situacij, v katerih vedenje predmeta določa "najšibkejši člen". Obstaja analogija z verigo, katere varnost določa člen, ki ima najmanjšo moč. Z drugimi besedami, naj

- neodvisne enako porazdeljene naključne spremenljivke, X (1) =min(), X 1, X 2,…, X n X(n) =max().

X 1, X 2,…, X n X(1) in X(i) V številnih aplikativnih problemih igrajo pomembno vlogo X(1) in X(i) , zlasti pri preučevanju največjih možnih vrednosti ("zapisov") določenih vrednosti, na primer zavarovalnih plačil ali izgub zaradi komercialnih tveganj, pri preučevanju meja elastičnosti in vzdržljivosti jekla, številnih značilnosti zanesljivosti itd. . Dokazano je, da za velike n porazdelitve X(1) in X(i) , praviloma dobro opisujejo Weibull-Gnedenkove porazdelitve. Temeljni prispevek k študiju porazdelitev

prispeval sovjetski matematik B. V. Gnedenko. Dela V. Weibulla, E. Gumbela, V.B. so posvečena uporabi dobljenih rezultatov v ekonomiji, managementu, tehnologiji in na drugih področjih. Nevzorova, E.M. Kudlaev in mnogi drugi strokovnjaki. k Pojdimo k družini gama porazdelitev. Široko se uporabljajo v ekonomiji in managementu, teoriji in praksi zanesljivosti in testiranja, na različnih področjih tehnologije, meteorologije itd. Zlasti v mnogih primerih je porazdelitev gama odvisna od takšnih količin, kot so skupna življenjska doba izdelka, dolžina verige prevodnih prašnih delcev, čas, ko izdelek doseže mejno stanje med korozijo, čas delovanja do k-ta zavrnitev,

= 1, 2, … itd. Pričakovana življenjska doba bolnikov s kroničnimi boleznimi in čas za doseganje določenega učinka med zdravljenjem imata v nekaterih primerih gama porazdelitev. Ta porazdelitev je najbolj primerna za opisovanje povpraševanja v ekonomsko-matematičnih modelih upravljanja zalog (logistike).

(17)

Gostoto verjetnosti v formuli (17) določajo trije parametri a, b, c, Kje a>0, b>0. Ob istem času a je parameter obrazca, b- parameter lestvice in z- parameter premika. Faktor 1/Γ(а) se normalizira, je bil uveden v

Tukaj Γ(a)- ena od posebnih funkcij, ki se uporablja v matematiki, tako imenovana "funkcija gama", po kateri se imenuje porazdelitev, podana s formulo (17),

Pri fiksnem A formula (17) podaja družino porazdelitev po lestvici, ki jo ustvari porazdelitev z gostoto

(18)

Porazdelitev oblike (18) se imenuje standardna gama porazdelitev. Dobi se iz formule (17) pri b= 1 in z= 0.

Poseben primer gama porazdelitev za A= 1 so eksponentne porazdelitve (z λ = 1/b). Z naravnimi A in z=0 gama porazdelitve imenujemo Erlangove porazdelitve. Iz del danskega znanstvenika K.A.Erlanga (1878-1929), uslužbenca Kopenhagenske telefonske družbe, ki je študiral v letih 1908-1922. delovanja telefonskih omrežij se je začel razvoj teorije čakalnih vrst. Ta teorija se ukvarja z verjetnostnim in statističnim modeliranjem sistemov, v katerih se servisira tok zahtev, da se sprejmejo optimalne odločitve. z Erlangove porazdelitve se uporabljajo na istih področjih uporabe, kjer se uporabljajo eksponentne porazdelitve. To temelji na naslednjem matematičnem dejstvu: vsota k neodvisnih naključnih spremenljivk, eksponentno porazdeljenih z istimi parametri λ in , ima gama porazdelitev s parametrom oblikek a = b, parameter lestvice = 1/λ in parameter premika. pri z kc

Če je naključna spremenljivka X= 0 dobimo Erlangovo porazdelitev. A ima gama porazdelitev s parametrom oblike d = 2 a tako da b= 1 in z- celo število, X= 0, nato 2 d ima hi-kvadrat porazdelitev z

Zvezne porazdelitve, ki se uporabljajo v verjetnostnih in statističnih metodah odločanja. X stopnje svobode.

z distribucijo gvmma ima naslednje značilnosti: PričakovanjeM(X) = + c,

ab D(X) = σ 2 = M(X) = 2 ,

Varianca

Koeficient variacije

Asimetrija

Presežek

Normalna porazdelitev je skrajni primer gama porazdelitve. Natančneje, naj bo Z naključna spremenljivka s standardno porazdelitvijo gama, podano s formulo (18). Potem X za poljubno realno število ,... Potem za vsak x obstaja meja, Kje n(0,1).

- standardna funkcija normalne porazdelitve

V aplikativnih raziskavah se uporabljajo tudi druge parametrične družine porazdelitev, med katerimi so najbolj znani sistem Pearsonovih krivulj, serije Edgeworth in Charlier. Tu se ne upoštevajo. Diskretno Najpogosteje uporabljene so tri družine diskretnih porazdelitev - binomska, hipergeometrična in Poissonova ter nekatere druge družine - geometrijska, negativna binomska, multinomska, negativna hipergeometrična itd.

Kot že omenjeno, se binomska porazdelitev pojavlja v neodvisnih poskusih, v vsakem od njih z verjetnostjo r pojavi dogodek A. iČe skupno število poskusov Y podano, nato število testov A, v katerem se je dogodek pojavil Y, ima binomsko porazdelitev. Za binomsko porazdelitev je verjetnost, da bo sprejeta kot naključna spremenljivka vrednosti l

se določi s formulo iŠtevilo kombinacij vrednosti elementi po vrednosti, znano iz kombinatorike. Za vsakogar i, razen 0, 1, 2, …, p(Y= vrednosti)= , imamo i 0. Binomska porazdelitev s fiksno velikostjo vzorca str je določen s parametrom

če Y 1 in Y 2 , tj. binomske porazdelitve tvorijo družino z enim parametrom. Uporabljajo se pri analizi podatkov iz vzorčnih študij, zlasti pri študiju potrošniških preferenc, selektivnem nadzoru kakovosti izdelkov po načrtih enostopenjske kontrole, pri testiranju populacij posameznikov v demografiji, sociologiji, medicini, biologiji itd. . str 0 - neodvisne binomske naključne spremenljivke z enakim parametrom i 1 in i 2 torej torej Y 1 + Y 2 , določeno iz vzorcev z volumni r = str 0 in i = i 1 + i 2 - binomska naključna spremenljivka s porazdelitvijo (19).

. Ta pripomba razširja uporabnost binomske porazdelitve tako, da omogoča združevanje rezultatov več skupin testov, kadar obstaja razlog za domnevo, da isti parameter ustreza vsem tem skupinam.

M(Y) = Značilnosti binomske porazdelitve so bile izračunane prej:, D(Y) = Značilnosti binomske porazdelitve so bile izračunane prej:( 1- str).

n.p.

V razdelku "Dogodki in verjetnosti" je zakon velikih števil dokazan za binomsko naključno spremenljivko: Y/ i za kogarkoli. Z uporabo osrednjega mejnega izreka lahko zakon velikih števil izboljšamo tako, da navedemo, koliko r.

drugačen od De Moivre-Laplaceov izrek. b, a< b Za poljubna števila a in

kje spodaj (beri "phi iz x", ker(X, imamo

) je funkcija standardne normalne porazdelitve z matematičnim pričakovanjem 0 in varianco 1. Y Da bi to dokazali, zadostuje uporaba reprezentacije M(Y) in D(Y) v obliki vsote neodvisnih naključnih spremenljivk, ki ustrezajo rezultatom posameznih testov, formule za

in osrednji mejni izrek. r Ta izrek je za ta primer

Hipergeometrična porazdelitev se pojavi med selektivnim nadzorom končne množice objektov prostornine N v skladu z alternativnim kriterijem. Vsak nadzorovani predmet je razvrščen tako, da ima atribut A, ali da nima te lastnosti. Hipergeometrična porazdelitev ima naključno spremenljivko Y, enako številu predmetov, ki imajo atribut A v naključnem vzorcu količine i, Kje i< n. Na primer številka Y enote izdelka z napako v naključnem vzorcu količine i iz volumna serije n ima hipergeometrično porazdelitev, če i< n. Drug primer je loterija. Naj znak A vstopnica je znak "biti zmagovalec". Naj skupno število vstopnic n, in neka oseba pridobila i od njih. Nato ima število zmagovalnih listkov za to osebo hipergeometrično porazdelitev.

Za hipergeometrično porazdelitev ima verjetnost, da naključna spremenljivka Y sprejme vrednost y, obliko

(20)

kje D– število predmetov, ki imajo atribut A, v obravnavanem nizu obsega n. Ob istem času vrednosti prevzame vrednosti od max(0, i - (n - D)) do min( i, D), druge stvari vrednosti verjetnost v formuli (20) je enaka 0. Tako je hipergeometrična porazdelitev določena s tremi parametri - obsegom populacije n, število predmetov D v njem, ki ima zadevno lastnost A in velikost vzorca i.

Preprosto naključno vzorčenje volumna i od celotne prostornine n je vzorec, dobljen kot rezultat naključne izbire, v kateri je kateri koli od nizov i predmeti imajo enako verjetnost, da bodo izbrani. Metode za naključno izbiro vzorcev respondentov (intervjuvancev) ali enot kosovnega blaga so obravnavane v navodilih, metodoloških in regulativnih dokumentih. Eden od načinov izbire je naslednji: predmeti se izbirajo eden od drugega in na vsakem koraku ima vsak od preostalih objektov v nizu enako možnost, da bo izbran. V literaturi se za vrsto obravnavanih vzorcev uporabljata tudi izraza »naključni vzorec« in »naključni vzorec brez vračila«.

Ker obseg populacije (serija) n in vzorci i običajno znani, potem je parameter hipergeometrijske porazdelitve, ki ga je treba oceniti D. V statističnih metodah upravljanja kakovosti izdelkov D– običajno število okvarjenih enot v seriji. D/ n Zanimiva je tudi značilnost distribucije

– stopnja napak.

Za hipergeometrično porazdelitev n>10 i Zadnji faktor v izrazu za varianco je blizu 1, če str = D/ n, potem se bodo izrazi za matematično pričakovanje in varianco hipergeometrične porazdelitve spremenili v izraze za matematično pričakovanje in varianco binomske porazdelitve. To ni naključje. Lahko se pokaže, da

pri n>10 i, kje str = D/ n. Mejno razmerje velja

in to omejevalno razmerje je mogoče uporabiti, ko n>10 i.

Tretja pogosto uporabljena diskretna porazdelitev je Poissonova porazdelitev.

,

Naključna spremenljivka Y ima Poissonovo porazdelitev, če p(Y= vrednosti)= kjer je λ parameter Poissonove porazdelitve in vrednosti 0 za vse ostale

M(Y) = λ, D(Y) = λ.

(za y=0 je označeno z 0! =1). Za Poissonovo porazdelitev r Ta porazdelitev je dobila ime po francoskem matematiku S. D. Poissonu (1781-1840), ki jo je prvi dobil leta 1837. Poissonova porazdelitev je mejni primer binomske porazdelitve, ko je verjetnost i izvedba dogodka je majhna, a število testov Značilnosti binomske porazdelitve so bile izračunane prej: super, in

= λ. Natančneje, mejna relacija velja

Zato se Poissonova porazdelitev (v stari terminologiji »distribucijski zakon«) pogosto imenuje tudi »zakon redkih dogodkov«. t Poissonova porazdelitev izvira iz teorije toka dogodkov (glej zgoraj). Dokazano je, da je za najenostavnejši tok s konstantno intenzivnostjo Λ število dogodkov (klicev), ki se zgodijo v času t, ima Poissonovo porazdelitev s parametrom λ = Λ t. Zato je verjetnost, da se med časom e - Λ ne bo prišlo do nobenega dogodka, enako t

, tj. porazdelitvena funkcija dolžine intervala med dogodki je eksponentna.

Poissonova porazdelitev se uporablja pri analizi rezultatov vzorčnih tržnih raziskav potrošnikov, izračunavanju operativnih značilnosti načrtov nadzora statistične sprejemljivosti v primeru majhnih vrednosti stopnje sprejemljivosti napak, za opis števila okvar statistično nadzorovanega tehnološki proces na časovno enoto, število prejetih »storitvenih zahtev« na časovno enoto v čakalnem sistemu, statistični vzorci nesreč in redkih bolezni itd.


V literaturi so obravnavani opisi drugih parametričnih družin diskretnih porazdelitev in možnosti njihove praktične uporabe.

V nekaterih primerih, na primer pri preučevanju cen, obsega proizvodnje ali skupnega časa med napakami pri težavah z zanesljivostjo, so porazdelitvene funkcije konstantne v nekaterih intervalih, v katere vrednosti proučevanih naključnih spremenljivk ne morejo pasti.

V praksi se večina naključnih spremenljivk, na katere vpliva veliko število naključnih dejavnikov, drži običajnega zakona porazdelitve verjetnosti. Zato je v različnih aplikacijah teorije verjetnosti ta zakon še posebej pomemben.

Naključna spremenljivka $X$ upošteva normalni zakon porazdelitve verjetnosti, če ima njena gostota porazdelitve verjetnosti naslednjo obliko

$$f\levo(x\desno)=((1)\nad (\sigma \sqrt(2\pi )))e^(-(((\levo(x-a\desno))^2)\nad ( 2(\sigma )^2)))$$

Graf funkcije $f\left(x\right)$ je shematično prikazan na sliki in se imenuje "Gaussova krivulja". Desno od tega grafa je nemški bankovec za 10 mark, ki so ga uporabljali pred uvedbo evra. Če dobro pogledate, lahko na tem bankovcu vidite Gaussovo krivuljo in njenega odkritelja, največjega matematika Carla Friedricha Gaussa.

Vrnimo se k naši funkciji gostote $f\left(x\right)$ in dajmo nekaj razlag glede porazdelitvenih parametrov $a,\ (\sigma )^2$. Parameter $a$ označuje središče disperzije vrednosti naključne spremenljivke, to pomeni, da ima pomen matematičnega pričakovanja. Ko se spremeni parameter $a$ in parameter $(\sigma )^2$ ostane nespremenjen, opazimo premik grafa funkcije $f\left(x\desno)$ vzdolž abscise, medtem ko graf gostote sama ne spreminja svoje oblike.

Parameter $(\sigma )^2$ je varianca in označuje obliko krivulje grafa gostote $f\left(x\right)$. Pri spreminjanju parametra $(\sigma )^2$ z nespremenjenim parametrom $a$ lahko opazujemo, kako graf gostote spreminja svojo obliko, se stiska ali razteza, ne da bi se premikal vzdolž abscisne osi.

Verjetnost, da normalno porazdeljena naključna spremenljivka pade v dani interval

Kot je znano, lahko verjetnost, da naključna spremenljivka $X$ pade v interval $\left(\alpha ;\ \beta \right)$, izračunamo $P\left(\alpha< X < \beta \right)=\int^{\beta }_{\alpha }{f\left(x\right)dx}$. Для нормального распределения случайной величины $X$ с параметрами $a,\ \sigma $ справедлива следующая формула:

$$P\levo(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right)$$

Tukaj je funkcija $\Phi \left(x\right)=((1)\over (\sqrt(2\pi )))\int^x_0(e^(-t^2/2)dt)$ Laplaceova funkcija. Vrednosti te funkcije so vzete iz. Opaziti je mogoče naslednje lastnosti funkcije $\Phi \left(x\right)$.

1 . $\Phi \left(-x\desno)=-\Phi \left(x\desno)$, kar pomeni, da je funkcija $\Phi \left(x\desno)$ liha.

2 . $\Phi \left(x\right)$ je monotono naraščajoča funkcija.

3 . $(\mathop(lim)_(x\to +\infty ) \Phi \left(x\desno)\ )=0,5$, $(\mathop(lim)_(x\to -\infty ) \ Phi \ levo(x\desno)\ )=-0,5$.

Za izračun vrednosti funkcije $\Phi \left(x\right)$ lahko uporabite tudi čarovnika za funkcijo $f_x$ v Excelu: $\Phi \left(x\right)=NORMDIST\left(x ;0;1;1\desno )-0,5$. Na primer, izračunajmo vrednosti funkcije $\Phi \left(x\right)$ za $x=2$.

Verjetnost, da normalno porazdeljena naključna spremenljivka $X\in N\left(a;\ (\sigma )^2\right)$ pade v interval, simetričen glede na matematično pričakovanje $a$, je mogoče izračunati z uporabo formule

$$P\levo(\levo|X-a\desno|< \delta \right)=2\Phi \left({{\delta }\over {\sigma }}\right).$$

Pravilo treh sigm. Skoraj gotovo je, da bo normalno porazdeljena naključna spremenljivka $X$ padla v interval $\left(a-3\sigma ;a+3\sigma \right)$.

Primer 1 . Za naključno spremenljivko $X$ velja normalni zakon porazdelitve verjetnosti s parametri $a=2,\ \sigma =3$. Poiščite verjetnost, da $X$ pade v interval $\left(0,5;1\right)$ in verjetnost neenakosti $\left|X-a\right|< 0,2$.

Uporaba formule

$$P\levo(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right),$$

najdemo $P\left(0,5;1\desno)=\Phi \left(((1-2)\nad (3))\desno)-\Phi \left(((0,5-2)\ na (3) ))\desno)=\Phi \levo(-0,33\desno)-\Phi \levo(-0,5\desno)=\Phi \levo(0,5\desno)-\Phi \ levo(0,33\desno)=0,191- 0,129=0,062 $.

$$P\levo(\levo|X-a\desno|< 0,2\right)=2\Phi \left({{\delta }\over {\sigma }}\right)=2\Phi \left({{0,2}\over {3}}\right)=2\Phi \left(0,07\right)=2\cdot 0,028=0,056.$$

Primer 2 . Recimo, da je med letom cena delnic določenega podjetja naključna spremenljivka, porazdeljena po normalnem zakonu z matematičnim pričakovanjem, ki je enako 50 konvencionalnim denarnim enotam, in standardnim odklonom, ki je enak 10. Kakšna je verjetnost, da na naključno izbranem dan obravnavanega obdobja bo cena promocije:

a) več kot 70 konvencionalnih denarnih enot?

b) pod 50 na delnico?

c) med 45 in 58 konvencionalnimi denarnimi enotami na delnico?

Naj bo naključna spremenljivka $X$ cena delnic nekega podjetja. Po pogoju za $X$ velja normalna porazdelitev s parametri $a=50$ - matematično pričakovanje, $\sigma =10$ - standardni odklon. Verjetnost $P\left(\alpha< X < \beta \right)$ попадания $X$ в интервал $\left(\alpha ,\ \beta \right)$ будем находить по формуле:

$$P\levo(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right).$$

$$а)\ P\levo(X>70\desno)=\Phi \levo(((\infty -50)\nad (10))\desno)-\Phi \levo(((70-50)\ čez (10))\desno)=0,5-\Phi \levo(2\desno)=0,5-0,4772=0,0228.$$

$$b)\P\levo(X< 50\right)=\Phi \left({{50-50}\over {10}}\right)-\Phi \left({{-\infty -50}\over {10}}\right)=\Phi \left(0\right)+0,5=0+0,5=0,5.$$

$$in)\ P\levo(45< X < 58\right)=\Phi \left({{58-50}\over {10}}\right)-\Phi \left({{45-50}\over {10}}\right)=\Phi \left(0,8\right)-\Phi \left(-0,5\right)=\Phi \left(0,8\right)+\Phi \left(0,5\right)=$$

Med porazdelitvenimi zakoni za diskretne naključne spremenljivke je najpogostejši binomski porazdelitveni zakon. Binomska porazdelitev se pojavi pod naslednjimi pogoji. Naj bo naključna spremenljivka število pojavov nekega dogodka v neodvisnih poskusih; verjetnost pojava v posameznem poskusu je enaka. Ta naključna spremenljivka je diskretna naključna spremenljivka, njene možne vrednosti so . Verjetnost, da bo naključna spremenljivka prevzela vrednost, se izračuna z uporabo Bernoullijeve formule: .

Opredelitev 15. Porazdelitveni zakon diskretne naključne spremenljivke se imenuje binomski porazdelitveni zakon, če se verjetnosti vrednosti naključne spremenljivke izračunajo z Bernoullijevo formulo. Distribucijska serija bo videti takole:

Prepričajmo se, da je vsota verjetnosti različnih vrednosti naključne spremenljivke enaka 1. Dejansko,

Ker so ti izračuni privedli do Newtonove binomske formule, se zato distribucijski zakon imenuje binomski. Če ima naključna spremenljivka binomsko porazdelitev, potem njene numerične značilnosti najdemo z uporabo formul:

(42) (43)

Primer 15. Obstaja serija 50 delov. Verjetnost napak na enem delu. Naj bo naključna spremenljivka število okvarjenih delov v dani seriji. Poiščite matematično pričakovanje, varianco in standardni odklon dane naključne spremenljivke. rešitev. Naključna spremenljivka ima binomsko porazdelitev, saj se verjetnost, da bo sprejela vrednost, izračuna z uporabo Bernoullijeve formule. Nato se njegovo matematično pričakovanje najde po formuli (41), in sicer ; disperzijo najdemo s formulo (42): . Potem bo standardni odklon enak . vprašanje Kupljenih je bilo 200 srečk, verjetnost dobitka ene srečke je 0,01. Potem je povprečno število srečk, na katere bodo padli dobitki: a) 10; b) 2; c) 20; d) 1.

Poissonov zakon porazdelitve

Pri reševanju številnih praktičnih problemov se je treba ukvarjati z diskretnimi naključnimi spremenljivkami, ki upoštevajo Poissonov zakon porazdelitve. Tipični primeri naključne spremenljivke s Poissonovo porazdelitvijo so: število klicev na telefonski centrali v določenem časovnem obdobju; število okvar kompleksne opreme v času, če je znano, da so napake neodvisne ena od druge in je v povprečju napak na časovno enoto. Serija porazdelitve bo imela obliko:

To pomeni, da se verjetnost, da bo naključna spremenljivka sprejela vrednost, izračuna s Poissonovo formulo: zato se ta zakon imenuje Poissonov porazdelitveni zakon. Naključna spremenljivka, porazdeljena po Poissonovem zakonu, ima naslednje numerične značilnosti:

Poissonova porazdelitev je odvisna od enega parametra, ki je matematično pričakovanje naključne spremenljivke. Slika 14 prikazuje splošen pogled na poligon Poissonove porazdelitve za različne vrednosti parametra.

Poissonovo porazdelitev lahko uporabimo kot približek v primerih, ko je natančna porazdelitev naključne spremenljivke binomska porazdelitev, je število poskusov veliko in je verjetnost, da se zgodi dogodek v posameznem poskusu, majhna, zato Poissonov zakon porazdelitve se imenuje zakon redkih dogodkov. In tudi, če se matematično pričakovanje malo razlikuje od variance, to je, ko . V zvezi s tem ima Poissonova porazdelitev veliko različnih aplikacij. Primer 16. Tovarna v bazo pošlje 500 kakovostnih izdelkov. Verjetnost, da bo izdelek med prevozom poškodovan, je 0,002. Poiščite matematično pričakovanje števila delov, poškodovanih med transportom. rešitev. Naključna spremenljivka ima Poissonovo porazdelitev, torej . vprašanje Verjetnost, da bo simbol pri prenosu sporočila popačen, je 0,004. Da bi bilo povprečno število pokvarjenih simbolov enako 4, je treba prenesti 100 simbolov.

Namen storitve. Spletni kalkulator se uporablja za sestavo tabele porazdelitve naključne spremenljivke X - števila izvedenih poskusov in za izračun vseh karakteristik serije: matematično pričakovanje, disperzija in standardni odklon. Poročilo z odločbo se sestavi v Word formatu. Primer št. 1. Vržejo se trije kovanci. Verjetnost, da dobite grb v enem metu, je 0,5. Sestavite porazdelitveni zakon za naključno spremenljivko X - število izpadlih grbov.
rešitev.
Verjetnost, da ni bil izrisan noben emblem: P(0) = 0,5*0,5*0,5= 0,125
P(1) = 0,5 *0,5*0,5 + 0,5*0,5 *0,5 + 0,5*0,5*0,5 = 3*0,125=0,375
P(2) = 0,5 *0,5 *0,5 + 0,5 *0,5*0,5 + 0,5*0,5 *0,5 = 3*0,125=0,375
Verjetnost, da dobite tri grbe: P(3) = 0,5*0,5*0,5 = 0,125

Porazdelitveni zakon naključne spremenljivke X:

X0 1 2 3
p0,125 0,375 0,375 0,125
Preverite: P = P(0) + P(1) + P(2) + P(3) = 0,125 + 0,375 + 0,375 + 0,125 = 1

Primer št. 2. Verjetnost, da en strelec zadene tarčo z enim strelom, je za prvega strelca 0,8, za drugega strelca pa 0,85. Strelci so streljali po en strel v tarčo. Glede na to, da je zadetek v tarčo neodvisen dogodek za posamezne strelce, poiščite verjetnost dogodka A – natanko en zadetek v tarčo.
rešitev.
Razmislite o dogodku A - en zadetek v tarčo. Možne možnosti za izvedbo tega dogodka so naslednje:

  1. Prvi strelec je zadel, drugi strelec je zgrešil: P(A/H1)=p 1 *(1-p 2)=0,8*(1-0,85)=0,12
  2. Prvi strelec je zgrešil, drugi strelec je zadel tarčo: P(A/H2)=(1-p 1)*p 2 =(1-0,8)*0,85=0,17
  3. Prva in druga puščica zadeneta tarčo neodvisno druga od druge: P(A/H1H2)=p 1 *p 2 =0,8*0,85=0,68
Potem bo verjetnost dogodka A – natanko en zadetek v tarčo – enaka: P(A) = 0,12+0,17+0,68 = 0,97

Sorodni članki