Normalna porazdelitev v statistiki. Normalna porazdelitev in njeni parametri. Univariatni grafikoni normalne porazdelitve

Normalna porazdelitev je najpogostejša vrsta porazdelitve. Z njim se srečamo pri analizi merilnih napak, monitoringu tehnološki procesi in načinov, pa tudi pri analizi in napovedovanju različnih pojavov v biologija , zdravilo in druga področja znanja.

Izraz "normalna porazdelitev" se uporablja v pogojnem pomenu, kot je splošno sprejet v literaturi, čeprav ne povsem uspešen. Tako izjava, da je določena značilnost podrejena normalnemu distribucijskemu zakonu, sploh ne pomeni prisotnosti kakršnih koli neomajnih norm, ki naj bi bile v osnovi pojava, katerega odraz je zadevna lastnost, in podvrženost drugim distribucijskim zakonom ne pomeni neke vrste nenormalnosti tega pojava.

Glavna značilnost normalne porazdelitve je, da je meja, h kateri se približujejo druge porazdelitve. Prvič odkrita normalna porazdelitev Moivre leta 1733. Samo zvezne naključne spremenljivke se držijo normalnega zakona. Gostota normalnega porazdelitvenega zakona ima obliko .

Matematično pričakovanje za zakon normalne porazdelitve je . Varianca je enaka .

Osnovne lastnosti normalne porazdelitve.

1. Funkcija gostote porazdelitve je definirana na celotni numerični osi Oh , torej vsako vrednost X ustreza zelo specifični vrednosti funkcije.

2. Za vse vrednosti X (pozitivna in negativna) ima funkcija gostote pozitivne vrednosti, kar pomeni, da se normalna krivulja nahaja nad osjo Oh .

3. Limit funkcije gostote z neomejenim naraščanjem X enako nič, .

4. Normalna funkcija gostote porazdelitve v točki ima maksimum .

5. Graf funkcije gostote je simetričen glede na premico.

6. Porazdelitvena krivulja ima dve prevojni točki s koordinatami in .

7. Modus in mediana normalne porazdelitve sovpadata z matematičnim pričakovanjem A .

8. Oblika normalne krivulje se pri spreminjanju parametra ne spremeni A .

9. Kvote asimetrija in presežek normalna porazdelitev enaka nič.

Pomen izračuna teh koeficientov za nize empirične porazdelitve je očiten, saj označujejo poševnost in strmino tega niza v primerjavi z normalnim.

Verjetnost padca v interval najdemo s formulo , Kje liho tabelarno funkcijo.

Določimo verjetnost, da je a normalno porazdeljen naključna spremenljivka odstopa od svojega matematičnega pričakovanja za znesek, manjši od , kar pomeni, da bomo našli verjetnost neenakosti , ali verjetnost dvojne neenakosti. Če zamenjamo formulo, dobimo

Izražanje odstopanja slučajne spremenljivke X v delčkih standardnega odklona, ​​to je, če dodamo zadnjo enakost, dobimo .


Potem, ko dobimo,

ko dobimo,

ko prejmemo.

Iz zadnje neenakosti sledi, da je praktično razpršenost normalno porazdeljene naključne spremenljivke vsebovana v območju . Verjetnost, da naključna spremenljivka ne bo padla v to območje, je zelo majhna, in sicer enaka 0,0027, to pomeni, da se ta dogodek lahko zgodi le v treh primerih od 1000. Takšni dogodki se lahko štejejo za skoraj nemogoče. Na podlagi zgornjega sklepanja pravilo treh sigma, ki je formuliran na naslednji način: če ima naključna spremenljivka normalno porazdelitev, potem odstopanje te vrednosti od matematičnega pričakovanja v absolutni vrednosti ne presega trikratnega standardnega odstopanja.

Primer 28. Del, izdelan z avtomatskim strojem, se šteje za primernega, če odstopanje njegove nadzorovane velikosti od konstrukcijske ne presega 10 mm. Za naključna odstopanja nadzorovane velikosti od načrta velja zakon normalne porazdelitve s standardnim odstopanjem mm in matematičnim pričakovanjem. Kolikšen odstotek primernih delov proizvede stroj?

rešitev. Upoštevajte naključno spremenljivko X - odstopanje velikosti od projektirane. Del bo veljaven, če naključna spremenljivka pripada intervalu. Verjetnost izdelave ustreznega dela je mogoče najti s formulo . Posledično je odstotek primernih delov, ki jih izdela stroj, 95,44 %.

Binomska porazdelitev

Binom je verjetnostna porazdelitev pojava m število dogodkov v n neodvisni poskusi, pri vsakem od katerih je verjetnost, da se zgodi dogodek, konstantna in enaka r . Verjetnost možnega števila pojavov dogodka se izračuna z uporabo Bernoullijeve formule: ,

kje . Trajna n in r , vključeni v ta izraz, so parametri binomskega zakona. Binomska porazdelitev opisuje porazdelitev verjetnosti diskretne naključne spremenljivke.

Osnovne numerične značilnosti binomske porazdelitve. Matematično pričakovanje je . Razpršenost enako . Koeficienta naklona in kurtoze sta enaka in . Z neomejenim povečanjem števila testov A in E težijo k nič, zato lahko domnevamo, da binomska porazdelitev konvergira k normalni, ko se število poskusov poveča.

Primer 29. Neodvisni testi se izvajajo z enako verjetnostjo pojava dogodka A v vsakem testu. Poiščite verjetnost, da se dogodek zgodi A v enem poskusu, če je varianca števila pojavitev v treh poskusih 0,63.

rešitev. Za binomsko porazdelitev . Zamenjajmo vrednosti, dobimo od tukaj oz potem in .

Poissonova porazdelitev

Zakon porazdelitve redkih pojavov

Poissonova porazdelitev opisuje število dogodkov m , ki se pojavljajo v enakih časovnih obdobjih, pod pogojem, da se dogodki odvijajo neodvisno drug od drugega s konstantno povprečno intenzivnostjo. Poleg tega število testov n je visoka in verjetnost, da se dogodek zgodi v vsakem poskusu r majhna Zato Poissonovo porazdelitev imenujemo zakon redkih dogodkov ali najenostavnejši tok. Parameter Poissonove porazdelitve je vrednost, ki označuje intenzivnost pojava dogodkov v n testi. Poissonova porazdelitvena formula .

Poissonova porazdelitev dobro opiše število zahtevkov za izplačilo zavarovalnine na leto, število prejetih klicev na telefonski centrali v določenem času, število okvar elementov pri testiranju zanesljivosti, število okvarjenih izdelkov itd. .

Osnovne numerične značilnosti za Poissonovo porazdelitev. Matematično pričakovanje je enako varianci in je enako A . To je . To je posebnost to distribucijo. Koeficienta asimetrije in kurtoze sta enaka.

Primer 30. Povprečno število zavarovalnin na dan je dve. Poiščite verjetnost, da boste v petih dneh morali plačati: 1) 6 zavarovalnih zneskov; 2) manj kot šest zneskov; 3) vsaj šest. oz eksponentno distribucija.

To porazdelitev pogosto opazimo pri preučevanju življenjske dobe različnih naprav, časa delovanja posamezne elemente, deli sistema in sistem kot celota, če upoštevamo naključne časovne intervale med pojavom dveh zaporednih redkih dogodkov.

Gostoto eksponentne porazdelitve določa parameter, ki ga imenujemo stopnja napak. Ta izraz je povezan s posebnim področjem uporabe - teorijo zanesljivosti.

Izraz za integralno funkcijo eksponentne porazdelitve je mogoče najti z uporabo lastnosti diferencialne funkcije:

Pričakovanje eksponentne porazdelitve, variance, standardnega odklona. Tako je za to porazdelitev značilno, da je standardni odklon številčno enak matematičnemu pričakovanju. Za katero koli vrednost parametra sta koeficienta asimetrije in kurtoze konstante.

Primer 31. Povprečni čas delovanja televizorja pred prvo okvaro je 500 ur. Poiščite verjetnost, da bo naključno izbrani televizor deloval brez okvar več kot 1000 ur.

rešitev. Ker je povprečni čas delovanja do prve okvare 500, potem . Želeno verjetnost poiščemo s formulo.

Definicija 1

Naključna spremenljivka $X$ ima normalno porazdelitev (Gaussovo porazdelitev), če je njena gostota porazdelitve določena s formulo:

\[\varphi \left(x\desno)=\frac(1)(\sqrt(2\pi )\sigma )e^(\frac(-((x-a))^2)(2(\sigma )^ 2))\]

Tu je $aϵR$ matematično pričakovanje, $\sigma >0$ pa standardni odklon.

Gostota normalne porazdelitve.

Pokažimo, da je ta funkcija res porazdelitvena gostota. Za to preverimo naslednji pogoj:

Razmislimo nepravilni integral$\int\limits^(+\infty )_(-\infty )(\frac(1)(\sqrt(2\pi)\sigma )e^(\frac(-((x-a))^2)( 2(\sigma )^2))dx)$.

Naredimo zamenjavo: $\frac(x-a)(\sigma )=t,\ x=\sigma t+a,\ dx=\sigma dt$.

Ker je $f\left(t\right)=e^(\frac(-t^2)(2))$ soda funkcija, potem

Enakost je izpolnjena, kar pomeni, da je funkcija $\varphi \left(x\right)=\frac(1)(\sqrt(2\pi )\sigma )e^(\frac(-((x-a))^2 )(2 (\sigma )^2))$ je res porazdelitvena gostota neke naključne spremenljivke.

Oglejmo si nekaj preprostih lastnosti funkcije gostote verjetnosti normalne porazdelitve $\varphi \left(x\right)$:

  1. Graf funkcije gostote verjetnosti normalne porazdelitve je simetričen glede na premico $x=a$.
  2. Funkcija $\varphi \left(x\right)$ doseže svoj maksimum pri $x=a$ in $\varphi \left(a\right)=\frac(1)(\sqrt(2\pi )\sigma ) e^(\frac(-((a-a))^2)(2(\sigma )^2))=\frac(1)(\sqrt(2\pi )\sigma )$
  3. Funkcija $\varphi \left(x\right)$ pada kot $x>a$ in narašča kot $x
  4. Funkcija $\varphi \left(x\right)$ ima prevojni točki pri $x=a+\sigma $ in $x=a-\sigma $.
  5. Funkcija $\varphi \left(x\right)$ se asimptotično približuje osi $Ox$ kot $x\to \pm \infty $.
  6. Shematski graf je videti tako (slika 1).

Slika 1. Sl. 1. Graf gostote normalne porazdelitve

Upoštevajte, da če je $a=0$, potem je graf funkcije simetričen glede na os $Oy$. Zato je funkcija $\varphi \left(x\right)$ soda.

Normalna funkcija porazdelitve verjetnosti.

Za iskanje funkcije porazdelitve verjetnosti za normalno porazdelitev uporabimo naslednjo formulo:

torej

Definicija 2

Funkcija $F(x)$ se imenuje standardna normalna porazdelitev, če je $a=0,\ \sigma =1$, to je:

Tukaj $Ф\levo(x\desno)=\frac(1)(\sqrt(2\pi ))\int\limits^x_0(e^(\frac(-t^2)(2))dt)$ - Laplaceova funkcija.

Definicija 3

Funkcija $Ф\levo(x\desno)=\frac(1)(\sqrt(2\pi ))\int\limits^x_0(e^(\frac(-t^2)(2))dt)$ imenujemo verjetnostni integral.

Numerične značilnosti normalne porazdelitve.

Matematično pričakovanje: $M\levo(X\desno)=a$.

Varianca: $D\levo(X\desno)=(\sigma )^2$.

Srednja kvadratna porazdelitev: $\sigma \left(X\desno)=\sigma $.

Primer 1

Primer reševanja problema na konceptu normalne porazdelitve.

Problem 1: Dolžina poti $X$ je naključna zvezna spremenljivka. $X$ je porazdeljen po normalnem zakonu porazdelitve, katerega srednja vrednost je enaka $4$ kilometrov, standardna deviacija pa je enaka $100$ metrov.

  1. Poiščite funkcijo gostote porazdelitve $X$.
  2. Nariši shematski graf gostote porazdelitve.
  3. Poiščite porazdelitveno funkcijo naključne spremenljivke $X$.
  4. Poišči varianco.
  1. Za začetek si predstavljajmo vse količine v eni dimenziji: 100m=0,1km

Iz definicije 1 dobimo:

\[\varphi \left(x\desno)=\frac(1)(0,1\sqrt(2\pi ))e^(\frac(-((x-4))^2)(0,02 ))\]

(ker $a=4\ km,\ \sigma =0,1\ km)$

  1. Z uporabo lastnosti funkcije gostote porazdelitve imamo, da je graf funkcije $\varphi \left(x\right)$ simetričen glede na premico $x=4$.

Funkcija doseže svoj maksimum v točki $\left(a,\frac(1)(\sqrt(2\pi )\sigma )\right)=(4,\ \frac(1)(0.1\sqrt(2\) pi )))$

Shematski graf izgleda takole:

Slika 2.

  1. Po definiciji porazdelitvene funkcije $F\left(x\right)=\frac(1)(\sqrt(2\pi )\sigma )\int\limits^x_(-\infty )(e^(\frac( -( (t-a))^2)(2(\sigma )^2))dt)$, imamo:
\
  1. $D\levo(X\desno)=(\sigma )^2=0,01$.

Članek podrobno prikazuje, kaj je normalno pravo porazdelitev naključne spremenljivke in kako jo uporabiti pri reševanju praktičnih problemov.

Normalna porazdelitev v statistiki

Zgodovina prava sega 300 let nazaj. Prvi odkritelj je bil Abraham de Moivre, ki je leta 1733 prišel do približka. Mnogo let pozneje sta Carl Friedrich Gauss (1809) in Pierre-Simon Laplace (1812) izpeljala matematične funkcije.

Tudi Laplace je odkril izjemen vzorec in ga oblikoval centralni mejni izrek (CPT), po katerem znesek velika količina majhne in neodvisne količine ima normalno porazdelitev.

Normalni zakon ni fiksna enačba odvisnosti ene spremenljivke od druge. Zabeležena je samo narava te odvisnosti. Konkretno obliko distribucije določimo s posebnimi parametri. na primer y = ax + b je enačba ravne črte. Kje točno poteka in pod kakšnim kotom pa določajo parametri A in b. Enako z normalno distribucijo. Jasno je, da je to funkcija, ki opisuje težnjo visoke koncentracije vrednosti okoli središča, vendar je njena natančna oblika določena s posebnimi parametri.

Gaussova krivulja normalne porazdelitve izgleda takole.

Graf normalne porazdelitve spominja na zvonec, zato boste morda videli ime zvončasta krivulja. Graf ima "grbo" na sredini in močno zmanjšanje gostote na robovih. To je bistvo normalne porazdelitve. Verjetnost, da bo naključna spremenljivka blizu središča, je veliko večja kot da bo močno odstopala od središča.

Zgornja slika prikazuje dve območji pod Gaussovo krivuljo: modro in zeleno. Razlogi, tj. Intervali so enaki za oba dela. Toda višine so opazno drugačne. Modri ​​del je dlje od središča in ima bistveno nižjo višino kot zeleni del, ki se nahaja v samem središču porazdelitve. Posledično se razlikujejo tudi območja, torej verjetnosti padca v označene intervale.

Formula za normalno porazdelitev (gostoto) je naslednja.

Formula je sestavljena iz dveh matematičnih konstant:

π – število pi 3,142;

e– osnova naravnega logaritma 2,718;

dva spremenljiva parametra, ki določata obliko določene krivulje:

m– matematično pričakovanje (in različnih virov Uporabijo se lahko tudi drugi zapisi, npr. µ oz a);

σ 2– disperzija;

in sama spremenljivka x, za katerega se izračuna gostota verjetnosti.

Posebna oblika normalne porazdelitve je odvisna od dveh parametrov: ( m) In ( σ 2). Na kratko označeno N(m, σ 2) oz N(m, σ). Parameter m(matematično pričakovanje) določa središče porazdelitve, ki mu ustreza maksimalna višina grafika. Razpršenost σ 2 označuje obseg variacije, to je "razmazanost" podatkov.

Parameter matematičnega pričakovanja premakne središče porazdelitve v desno ali levo, ne da bi vplival na obliko same krivulje gostote.

Toda disperzija določa ostrino krivulje. Ko imajo podatki majhen razpršitev, je vsa njihova masa koncentrirana v središču. Če imajo podatki velik razpršitev, so "razpršeni" v širokem obsegu.

Gostota porazdelitve nima neposredne praktična uporaba. Za izračun verjetnosti morate integrirati funkcijo gostote.

Verjetnost, da bo naključna spremenljivka manjša od določene vrednosti x, je odločen normalna porazdelitvena funkcija:

Z uporabo matematičnih lastnosti katere koli zvezne porazdelitve je enostavno izračunati vse druge verjetnosti, saj

P(a ≤ X< b) = Ф(b) – Ф(a)

Standardna normalna porazdelitev

Normalna porazdelitev je odvisna od parametrov povprečja in variance, zato so njene lastnosti slabo vidne. Lepo bi bilo imeti nek distribucijski standard, ki ne bi bil odvisen od obsega podatkov. In obstaja. Poklican standardna normalna porazdelitev. Pravzaprav je to navadna normalna porazdelitev, le da ima parametra matematično pričakovanje 0 in varianco 1, na kratko N(0, 1).

Vsako normalno porazdelitev je mogoče zlahka pretvoriti v standardno porazdelitev z normalizacijo:

kje z– nova spremenljivka, ki se uporablja namesto tega x;
m– matematično pričakovanje;
σ – standardni odklon.

Za vzorčne podatke se vzamejo ocene:

Aritmetična sredina in varianca nove spremenljivke z sta zdaj tudi 0 oziroma 1. To lahko enostavno preverimo z uporabo elementarnih algebrskih transformacij.

Ime se pojavlja v literaturi z-rezultat. To je to – normalizirani podatki. Z-rezultat lahko neposredno primerjamo s teoretičnimi verjetnostmi, saj njegova lestvica sovpada s standardom.

Poglejmo zdaj, kako izgleda gostota standardne normalne porazdelitve (npr z-rezultati). Naj vas spomnim, da ima Gaussova funkcija obliko:

Namesto tega zamenjajmo (x-m)/σ pismo z, in namesto tega σ – ena, dobimo funkcija gostote standardne normalne porazdelitve:

Tabela gostote:

Središče je po pričakovanju v točki 0. Na isti točki Gaussova funkcija doseže svoj maksimum, kar ustreza temu, da naključna spremenljivka sprejme svojo povprečno vrednost (tj. x-m=0). Gostota na tej točki je 0,3989, kar je mogoče izračunati tudi v glavi, ker e 0 =1 in vse kar ostane je izračunati razmerje 1 proti korenu iz 2 pi.

Tako je na grafu jasno razvidno, da se vrednosti, ki imajo majhna odstopanja od povprečja, pojavljajo pogosteje kot druge, tiste, ki so zelo oddaljene od središča, pa veliko manj pogosto. Lestvica osi x se meri v standardnih odstopanjih, kar vam omogoča, da se znebite merskih enot in pridobite univerzalno strukturo normalne porazdelitve. Gaussova krivulja za normalizirane podatke odlično prikazuje druge lastnosti normalne porazdelitve. Na primer, da je simetričen glede na ordinatno os. Večina vseh vrednosti je koncentrirana znotraj ±1σ od aritmetične sredine (zaenkrat ocenjujemo na oko). Večina podatkov je znotraj ±2σ. Skoraj vsi podatki so znotraj ±3σ. Zadnja lastnost je splošno znana kot pravilo treh sigm za normalno porazdelitev.

Standardna funkcija normalne porazdelitve vam omogoča izračun verjetnosti.

Jasno je, da nihče ne šteje ročno. Vse je izračunano in postavljeno v posebne tabele, ki so na koncu vsakega statističnega učbenika.

Normalna distribucijska tabela

Obstajata dve vrsti normalnih porazdelitvenih tabel:

- miza gostota;

- miza funkcije(integral gostote).

Tabela gostota redko uporabljen. Vendar pa poglejmo, kako izgleda. Recimo, da moramo dobiti gostoto za z = 1, tj. gostota vrednosti, ločena od pričakovanja z 1 sigmo. Spodaj je del tabele.

Odvisno od organizacije podatkov, ki jih iščemo želeno vrednost po imenih stolpcev in vrstic. V našem primeru vzamemo linijo 1,0 in stolpec 0 , ker stotink ni. Vrednost, ki jo iščete, je 0,2420 (0 pred 2420 je izpuščena).

Gaussova funkcija je simetrična glede na ordinato. zato φ(z)= φ(-z), tj. gostota za 1 je enaka gostoti za -1 , kar je jasno vidno na sliki.

Da ne bi porabili papirja, so tabele natisnjene samo za pozitivne vrednosti.

V praksi se vrednosti pogosteje uporabljajo funkcije standardna normalna porazdelitev, to je verjetnost za različne z.

Tudi takšne tabele vsebujejo samo pozitivne vrednosti. Zato razumeti in najti katerikoli morate poznati zahtevane verjetnosti lastnosti standardne normalne porazdelitve.

funkcija F(z) simetrična glede na svojo vrednost 0,5 (in ne ordinatne osi, kot gostota). Torej velja enakost:

To dejstvo je prikazano na sliki:

Funkcijske vrednosti F(-z) in F(z) razdeli graf na 3 dele. Poleg tega sta zgornji in spodnji del enaka (označeno s kljukicami). Za dopolnitev verjetnosti F(z) na 1, samo dodajte manjkajočo vrednost F(-z). Dobite zgoraj navedeno enakost.

Če morate najti verjetnost padca v interval (0; z), to je verjetnost odstopanja od nič v pozitivni smeri do določenega števila standardnih odklonov, je dovolj, da od vrednosti standardne normalne funkcije porazdelitve odštejemo 0,5:

Za jasnost si lahko ogledate risbo.

Na Gaussovi krivulji je ta ista situacija videti kot območje od središča desno do z.

Pogosto analitika zanima verjetnost odstopanja v obe smeri od nič. In ker je funkcija simetrična glede na središče, je treba prejšnjo formulo pomnožiti z 2:

Slika spodaj.

Pod Gaussovo krivuljo je osrednji del, omejeno na izbrano vrednost –z levo in z desno.

Te lastnosti je treba upoštevati, ker tabelarične vrednosti redko ustrezajo intervalu zanimanja.

Za lažjo nalogo so v učbenikih običajno objavljene tabele za funkcije oblike:

Če potrebujete verjetnost odstopanja v obe smeri od nič, potem, kot smo pravkar videli, vrednost tabele za to funkcijo preprosto pomnožimo z 2.

Zdaj pa poglejmo konkretni primeri. Spodaj je tabela standardne normalne porazdelitve. Poiščimo tabelo vrednosti za tri z: 1,64, 1,96 in 3.

Kako razumeti pomen teh številk? Začnimo z z=1,64, za katero je vrednost tabele 0,4495 . Pomen si najlažje razložimo na sliki.

To je verjetnost, da standardizirana normalno porazdeljena naključna spremenljivka pade v interval od 0 do 1,64 , je enako 0,4495 . Pri reševanju nalog je običajno treba izračunati verjetnost odstopanja v obe smeri, zato pomnožimo vrednost 0,4495 za 2 in dobimo približno 0,9. Zasedena površina pod Gaussovo krivuljo je prikazana spodaj.

Tako 90% vseh normalno porazdeljenih vrednosti spada v interval ±1,64σ iz aritmetične sredine. Pomen nisem izbral naključno z=1,64, ker okolica okoli aritmetične sredine, ki zavzema 90 % celotne površine, se včasih uporablja za izračun intervalov zaupanja. Če vrednost, ki se testira, ne spada v označeno območje, potem je njen pojav malo verjeten (le 10%).

Za testiranje hipotez pa se pogosteje uporablja interval, ki zajema 95% vseh vrednosti. Pol možnosti 0,95 - To 0,4750 (glej drugo označeno vrednost v tabeli).

Za to verjetnost z=1,96. Tisti. znotraj skoraj ±2σ 95% vrednosti je iz povprečja. Le 5 % jih je zunaj teh meja.

Druga zanimiva in pogosto uporabljena vrednost tabele ustreza z=3, je enako po naši tabeli 0,4986 . Pomnožite z 2 in dobite 0,997 . Torej znotraj ±3σ Skoraj vse vrednosti so izpeljane iz aritmetične sredine.

Takole izgleda pravilo 3 sigme za normalno porazdelitev v diagramu.

Z uporabo statističnih tabel lahko dobite katero koli verjetnost. Vendar je ta metoda zelo počasna, neprijetna in zelo zastarela. Danes se vse dela na računalniku. Nato preidemo na prakso izračunov v Excelu.

Normalna porazdelitev v Excelu

Excel ima več funkcij za izračun verjetnosti ali inverzov normalne porazdelitve.

Funkcija NORMAL DIST

funkcija NORM.ST.DIST. namenjen za izračun gostote ϕ(z) ali verjetnosti Φ(z) po normaliziranih podatkih ( z).

=NORM.ST.DIST(z;integral)

z– vrednost standardizirane spremenljivke

integral– če je 0, se izračuna gostotaϕ(z) , če je 1 vrednost funkcije Ф(z), tj. verjetnost P(Z

Izračunajmo gostoto in vrednost funkcije za različne z: -3, -2, -1, 0, 1, 2, 3(označili jih bomo v celici A2).

Za izračun gostote boste potrebovali formulo =NORM.ST.DIST(A2;0). V spodnjem diagramu je to rdeča pika.

Za izračun vrednosti funkcije =NORM.ST.DIST(A2;1). Diagram prikazuje zasenčeno območje pod normalno krivuljo.

V resnici je pogosteje treba izračunati verjetnost, da naključna spremenljivka ne bo presegla določenih meja od povprečja (v standardnih odstopanjih, ki ustrezajo spremenljivki z), tj. P(|Z| .

Določimo verjetnost, da naključna spremenljivka pade v meje ±1z, ±2z in ±3z od nule. Potrebujem formulo 2Ф(z)-1, v Excelu =2*NORM.ST.DIST(A2;1)-1.

Diagram jasno prikazuje glavne osnovne lastnosti normalne porazdelitve, vključno s pravilom treh sigm. funkcija NORM.ST.DIST. je avtomatska tabela normalnih vrednosti porazdelitvenih funkcij v Excelu.

Obstaja lahko tudi obratni problem: glede na razpoložljivo verjetnost P(Z poiščite standardizirano vrednost z, to je kvantil standardne normalne porazdelitve.

Funkcija NORMAL REV

NORM.ST.REV izračuna obratno funkcijo standardne normalne porazdelitve. Sintaksa je sestavljena iz enega parametra:

=NORM.ST.REV(verjetnost)

verjetnost je verjetnost.

Ta formula se uporablja tako pogosto kot prejšnja, ker morate z uporabo istih tabel iskati ne samo verjetnosti, ampak tudi kvantile.

Na primer, pri izračunu intervalov zaupanja je določena verjetnost zaupanja, po kateri je treba izračunati vrednost z.

Glede na to, da je interval zaupanja sestavljen iz zgornje in spodnje meje in da je normalna porazdelitev simetrična okoli ničle, je dovolj, da dobimo zgornjo mejo (pozitivno odstopanje). Spodnja meja se vzame z negativnim predznakom. Označimo verjetnost zaupanja kot γ (gama), potem se zgornja meja intervala zaupanja izračuna po naslednji formuli.

Izračunajmo vrednosti v Excelu z(kar ustreza odstopanju od povprečja v sigmah) za več verjetnosti, tudi tiste, ki jih vsak statistik zna na pamet: 90 %, 95 % in 99 %. V celici B2 označimo formulo: =NORM.ST.REV((1+A2)/2). S spreminjanjem vrednosti spremenljivke (verjetnost v celici A2) dobimo različne meje intervalov.

95-odstotni interval zaupanja je 1,96, to je skoraj 2 standardni odklon. Od tu je enostavno, celo miselno, oceniti možno širjenje normalne naključne spremenljivke. Na splošno 90 %, 95 % in 99 % intervali zaupanja ustrezajo intervalom zaupanja ±1,64, ±1,96 in ±2,58σ.

Na splošno vam funkciji NORM.ST.DIST in NORM.ST.REV omogočata izvajanje katerega koli izračuna, povezanega z normalno porazdelitvijo. Da pa bi bilo stvari lažje in manj zapleteno, ima Excel še nekaj drugih funkcij. Na primer, lahko uporabite CONFIDENCE NORM za izračun intervalov zaupanja za povprečje. Za preverjanje aritmetične sredine obstaja formula Z.TEST.

Oglejmo si še nekaj uporabnih formul s primeri.

Funkcija NORMAL DIST

funkcija NORMALNA DIST. drugačen od NORM.ST.DIST. samo zato, ker se uporablja za obdelavo podatkov katerega koli obsega in ne le normaliziranih. Parametri normalne porazdelitve so podani v sintaksi.

=NORM.DIST(x,povprečje,standardni_odklon,integral)

povprečje– matematično pričakovanje, ki se uporablja kot prvi parameter modela normalne porazdelitve

standard_off– standardni odklon – drugi parameter modela

integral– če je 0, se izračuna gostota, če je 1 – se izračuna vrednost funkcije, tj. P(X

Na primer, gostota za vrednost 15, ki je bila pridobljena iz običajnega vzorca s pričakovanjem 10, standardni odklon 3, se izračuna na naslednji način:

Če je zadnji parameter nastavljen na 1, potem dobimo verjetnost, da bo normalna naključna spremenljivka manjša od 15 za dane parametre porazdelitve. Tako je mogoče verjetnosti izračunati neposredno iz izvirnih podatkov.

funkcija NORM.REV

To je kvantil normalne porazdelitve, tj. vrednost inverzne funkcije. Sintaksa je naslednja.

=NORM.REV(verjetnost,povprečje,standardni_odklon)

verjetnost- verjetnost

povprečje– matematično pričakovanje

standard_off– standardni odklon

Namen je enak kot NORM.ST.REV, samo funkcija deluje s podatki poljubnega obsega.

Primer je prikazan v videu na koncu članka.

Modeliranje normalne porazdelitve

Nekatere težave zahtevajo generiranje običajnih naključnih števil. Za to ni pripravljene funkcije. Vendar ima Excel dve funkciji, ki vrneta naključna števila: PRIMER VMES in RAND. Prvi proizvaja naključna, enakomerno porazdeljena cela števila v določenih mejah. Druga funkcija generira enakomerno porazdeljena naključna števila med 0 in 1. Če želite narediti umetni vzorec s katero koli dano porazdelitvijo, potrebujete funkcijo RAND.

Recimo, da je za izvedbo poskusa potrebno pridobiti vzorec iz normalno porazdeljene populacije s pričakovanjem 10 in standardnim odklonom 3. Za eno naključno vrednost bomo zapisali formulo v Excelu.

NORM.INV(RAND();10;3)

Razširimo ga na zahtevano število celic in običajni vzorec je pripravljen.

Za modeliranje standardiziranih podatkov bi morali uporabiti NORM.ST.REV.

Postopek pretvorbe enotnih števil v običajna števila je lahko prikazan v naslednjem diagramu. Iz enotnih verjetnosti, ki jih ustvari formula RAND, se na graf funkcije normalne porazdelitve narišejo vodoravne črte. Nato se iz točk presečišča verjetnosti z grafom projekcije spustijo na vodoravno os.

Sorodni članki

  • Hrestač in mišji kralj - E. Hoffmann

    Dogajanje poteka na predvečer božiča. V hiši svetnika Stahlbauma se vsi pripravljajo na praznik, otroka Marie in Fritz pa se veselita daril. Sprašujejo se, kaj jim bo tokrat podaril njihov boter, urar in čarovnik Drosselmeyer. Med...

  • Pravila ruskega črkovanja in ločil (1956)

    Tečaj ločil nove šole temelji na intonacijsko-slovničnem principu, v nasprotju s klasično šolo, kjer se intonacija praktično ne preučuje. Čeprav nova tehnika uporablja klasične formulacije pravil, dobijo...

  • Kozhemyakins: oče in sin Kozhemyakins: oče in sin

    | Kadetska ustvarjalnost Pogledali so smrti v oči | Kadetski zapiski vojaka Suvorova N*** Heroja Ruske federacije Dmitrija Sergejeviča Kožemjakina (1977-2000) Takšen je ostal v srcih padalcev. Bilo je konec aprila. jaz...

  • Opažanje profesorja Lopatnikova

    Grob Stalinove matere v Tbilisiju in judovsko pokopališče v Brooklynu Zanimivi komentarji na temo spopada med Aškenazi in Sefardi k videu Alekseja Menjailova, v katerem govori o skupni strasti svetovnih voditeljev do etnologije,...

  • Odlični citati velikih ljudi

    35 353 0 Pozdravljeni! V članku se boste seznanili s tabelo, v kateri so navedene glavne bolezni in čustvene težave, ki so jih povzročile, po Louise Hay. Tukaj so tudi afirmacije, ki vam bodo pomagale pri zdravljenju teh...

  • Knjižni spomeniki Pskovske regije

    Roman Evgenij Onjegin je obvezno branje za vse poznavalce Puškinovega dela. To veliko delo igra eno ključnih vlog v pesnikovem delu. To delo je imelo neverjeten vpliv na celotno rusko umetniško...