Contacte

Funcțiile distribuției normale logaritmice cu. Distribuția logaritmică. Comunicarea cu alte distribuții

Funcția de distribuție normală logaritică a fost utilizată pe scară largă în analiza fiabilității obiectelor de tehnologie, biologie, economie etc. De exemplu, funcția este utilizată cu succes pentru a descrie operația la rulment, dispozitivele electronice și alte produse.

Valorile aleatorie non-negative ale unor parametri sunt distribuite în mod normal, dacă logaritmul său este distribuit în mod normal. Densitatea distribuției pentru diferite valori σ este prezentată în fig. 4.3.

Smochin. 4.3.

Densitatea distribuției este descrisă de dependență

unde M.x și σ - parametrii măsurați prin rezultate p. Teste pentru refuz:

(4.4)

Pentru legea normală de distribuție logaritmică, funcția de fiabilitate

(4.5)

Probabilitatea de funcționare fără probleme poate fi determinată de tabele pentru distribuție normală (a se vedea tabelul P6.1 Anexa 6) în funcție de valoarea cantitativantului

Așteptarea matematică a evoluțiilor înainte de refuz

Deviația medie și coeficientul de variație medie va fi egală

În cazul în care un v.x. 0.3, se crede că ν x \u003d σ, și eroarea nu mai este 1%.

Înregistrările dependențelor se aplică adesea legii normale de distribuție logaritmic în logaritmii zecimal. În conformitate cu această lege, densitatea distribuției

Estimări ale parametrilor LG. x.0 și Σ sunt determinate de rezultatele testelor:

Valorea estimata M.x, deviația patrată secundară σ x și coeficientul de variație ν x Extensii la eșec, respectiv, egale

Exemplul 4.6.

Determinați probabilitatea de funcționare fără probleme a cutiei de viteze pentru t. \u003d 103 ore dacă resursa este distribuită logaritmic în mod normal cu parametrii LG t.0 \u003d 3,6; Σ \u003d 0,3.

Decizie

Vom găsi valoarea cuanticului și vom determina probabilitatea de funcționare fără probleme:

Răspuns: R.(t.) = 0,0228.

Distribuția Waibulla.

Funcția de distribuție WAIBULLA este o distribuție cu două parametri. Legea descrisă de acesta este universală, deoarece la valorile corespunzătoare ale parametrilor se transformă în tipuri normale, exponențiale și alte tipuri de distribuții. Autorul acestei legi a distribuției V. Weibull a folosit-o atunci când descrie și analizează scattrele experimentale observate ale forței de oboseală a oțelului, limitele elasticității sale. Legea Weibulla descrie în mod satisfăcător dezvoltarea rulmentului, elemente de echipamente electronice, este utilizat pentru a evalua fiabilitatea pieselor și a componentelor mașinii, inclusiv a autoturismelor, precum și evaluarea fiabilității mașinilor în procesul de precizie. Densitatea distribuției este descrisă de dependență

unde α este parametrul formei curbei de distribuție; λ este parametrul scării curbei de distribuție.

Graficul funcției de densitate a distribuției este prezentat în fig. 4.4.

Smochin. 4.4.

Funcția de distribuție WAIBULLA.

Funcția de fiabilitate pentru această lege de distribuție

Așteptarea matematică a unei variabile aleatorii h. in aceeasi masura

unde r ( x.) - Funcția Gamma.

Pentru valori continue h.

Pentru valori întregi h. Funcția gamma este calculată prin formula

de asemenea, adevărată formulă

Variația aleatorie este egală cu

Utilizarea largă în analiza și calculele fiabilității produselor din Legea distribuției Waibulla se explică prin faptul că această lege, rezumând distribuția exponențială, conține un parametru suplimentar α.

Selectarea parametrilor necesari ai parametrilor A și λ, este posibil să se obțină o mai bună respectare a valorilor calculate ale datelor experimentale comparativ cu legea exponențială, care este un parametru (parametrul λ).

Deci, pentru produsele care au defecte ascunse, dar care nu sunt utilizate pentru o lungă perioadă de timp (și, prin urmare, au convenit mai lent), pericolul refuzului este de cea mai mare valoare din perioada inițială și apoi se încadrează rapid. Funcția de fiabilitate pentru un astfel de produs este bine descrisă de Legea lui Waibulla cu parametrul α< 1.

Dimpotrivă, dacă produsul este bine controlat în fabricație și aproape nu are defecte ascunse, dar este supus îmbătrânirii rapide, funcția de fiabilitate este descrisă de Legea Weibulla cu parametrul α\u003e 1. cu α \u003d 3.3, Waibulla Distribuția este aproape de normal.


Variabila aleatorie Y are o distribuție normală logaritmic cu parametrii μ și Σ, dacă variabila aleatorie x \u003d Lny are o distribuție normală cu aceiași parametri μ și Σ. Cunoașterea naturii legăturii dintre variabilele X și Y poate construi cu ușurință o diagramă a unei probabilități de variabilă aleatorie cu o distribuție normală logaritmică (Figura 4.2).

Figura 4.2 - Curbele densității distribuției normale logaritmic la diferite valori ale parametrilor μ și Σ

Dacă variabila randomă X are o funcție de densitate a probabilității definită prin formula (4.6) și dacă X \u003d Lny, atunci:

Unde avem pentru y\u003e 0:

Din definiție rezultă că o variabilă aleatorie supusă distribuției normale logaritmic nu poate lua decât valori pozitive. După cum se arată în figura 4.2, curbele funcției F (y) au asimetria la stânga, care este cea mai puternică decât valoarea parametrilor μ și σ. Fiecare curbă are un maxim și este definită pentru toate valorile pozitive.

Calculul așteptării matematice și dispersiei unei variabile aleatorii cu o distribuție normală logaritmic nu este deosebit de dificilă:

Prin înlocuirea și introducerea unor noi variabile în Integral 4.15 și 4.16, obținem:

În general, pentru a calcula probabilitatea ca variabila aleatorie Y cu distribuția și densitatea normală logaritmic F (Y, μ, Σ) să ia o valoare în intervalul (A, B), trebuie luat integralul:

Cu toate acestea, în practică este mai convenabil să se folosească faptul că logaritmul unei variabile aleatorie are o distribuție normală. Probabilitatea ca ≤ y ≤ b să fie echivalentă cu probabilitatea ca
LNA ≤ Lny ≤ LNB.

Calculăm probabilitatea ca o variabilă aleatorie cu o distribuție logaritmică μ \u003d 1, σ \u003d 0,5, va avea o valoare în intervalul (2, 5). Avem:

Din tabelele logaritmilor găsim LN2 \u003d 0,6932 și LN5 \u003d 1,6094.

Proiectat Lny \u003d x, putem scrie:

Mai mult, variabila aleatorie X este subordonată distribuției normale cu valoarea medie μ \u003d 1 și deviația standard σ \u003d 0,5. Acum probabilitatea dorită este ușor de calculat pe tabelele funcției integrale a distribuției normale:

Întrebări pentru auto-control

1 Definiția distribuției dreptunghiulare.

2 diagramă a probabilității unei variabile aleatorie cu o distribuție dreptunghiulară

3 Distribuția dreptunghiulară fundamentală.

4 așteptări matematice și dispersie a unei variabile aleatorie în distribuția dreptunghiulară.

5 Rolul distribuției normale în statisticile matematice.

6 Care este distribuția normală și cum este legată de binomial?

7 diagramă a densității de probabilitate a unei variabile aleatorie cu distribuție normală.

8 Ce parametri statistici pot fi setați la distribuție normală?

9 De ce distribuția normală este continuă?

10 ecuația unei curbe normale.

11 Care este abaterea normalizată?

12 Ecuația curbei normale de distribuție în forma normalizată.

13 Ce valori ale μ și σ sunt setate normală în formă normalizată?

14 Ce parte din aceste eșantioane este așezată în ± 1σ, ± 2σ, ± 3σ?

15 Ce arată tabelul de integrare normală a probabilităților?

16 ecuația unei curbe normale logaritmic.

17 diagrama densității de probabilitate a unei variabile aleatorie cu o distribuție normală logaritmic.

18 Care sunt transformările necesare pentru a obține o distribuție normală din distribuția normală logaritmic?

19 Ce parametri statistici sunt distribuția normală logaritmică?

Subiectul 5 Distribuția parametrilor de eșantionare

5.1 T - Distribuția studenților

5.2 F-Distribution Fischer-Sedekora

5.3 χ 2-Distribuție

5.1 T - Distribuția studenților

Legea distribuției normale se manifestă cu numărul de semne n\u003e 20-30. Cu toate acestea, experimentatorul desfășoară adesea un număr limitat de măsurători, pe baza concluziilor sale pe eșantioane mici. Cu un număr mic de observații, rezultatele sunt de obicei aproape și abateri mari rareori apar. Acest lucru este ușor de explicat legea distribuției normale, conform căreia probabilitatea apariției unor abateri mici este mai mare decât abaterile semnificative. Astfel, probabilitatea abaterilor care depășesc valoarea absolută de ± 2σ este de 0,05 sau un caz cu 20 măsurători și abateri ± 3σ - 0,01 sau un caz la 100.

Dacă experiența pe teren se efectuează, de exemplu, în reparații 4 - 6, este normal să se aștepte ca printre mărturia recoltelor pe delicatese paralele, vor exista abateri foarte mari. Prin urmare, deviația standard, calculată de un eșantion mic, în majoritatea cazurilor, va fi mai mică decât prin întreaga populație generală. În consecință, în aceste cazuri, este imposibil să se bazeze pe criteriile de distribuire normală în concluziile lor.

De la începutul secolului al XX-lea, o nouă direcție a devenit dezvoltată în statisticile matematice, care pot fi numite statistici mici de eșantionare. Cea mai mare importanță practică pentru lucrările experimentale a fost deschisă în 1908 de către statistica engleză și chimist V. Gosset T-Distribution, numit Distribuția studenților (limba engleză. Student - Student, Pseudonim V. Gosset).

Distribuția studenților T pentru mediul de eșantion este determinată de egalitate:

Numărul de formulare înseamnă abaterea mediului de probă pe mijlocul întregii totalități și numitorul:

- Este un indicator care estimează valoarea erorii standard a agregatului selectiv mediu.

Astfel, valoarea T este măsurată prin deviația mediului de probă pe agregatul mijlociu, exprimată în acțiunile erorii de eșantionare adoptate pe unitate.

Maxima frecvenței distribuției normale și T coincid, dar forma curbei de distribuție T depinde în întregime de numărul de grade de libertate. Cu valori foarte mici de grade de libertate, aceasta ia forma unei curbe pe termen lung, iar zona curbei este mai mare decât în \u200b\u200btimpul distribuției normale și cu o creștere a numărului de observații (n\u003e 30 ), distribuția se apropie normal și tranzițiile la acesta la n \u003d ∞.

Figura 1.1 prezintă distribuția diferențială și integrală a studentului T la 10 grade de libertate.

Figura 5.1 - Diferențial (stânga) și integral (dreapta) Distribuția studenților T

Distribuția lui T-Student este importantă atunci când lucrați cu mostre mici: vă permite să determinați intervalul de încredere care acoperă agregatul mediu , și verificați una sau o altă ipoteză cu privire la populația generală. Cu toate acestea, nu este necesar să se cunoască setările agregatului și , Este suficient să aveți estimările lor μ și Σ pentru o anumită sumă de eșantionare N.

5.1.1 Problema lui Berens-Fisher

Verificarea ipotezei despre grupurile medii generale cu distribuție normală și dispersii inegale în statisticile matematice se numește problema lui Berens-Fisher și are doar soluții aproximative. De ce este atât de important să se solicite egalitatea de dispersii în grupurile comparate? Fără a intra în detalii despre această problemă, observăm că cele mai mari dispersiile și volumele eșantionului diferă între ele, cu atât este mai puternică distribuirea "criteriului T calculat" din distribuția criteriului elevului T. În acest caz, valoarea diferită a criteriului T și un astfel de parametru al acestor distribuții, ca număr de grade de libertate. La rândul său, numărul de grade de libertate afectează amploarea nivelului de semnificație realizat (critic) (P< ...) определяемого для вычисленного значения t-критерия.

Neglijarea cercetătorilor enumerați mai presus de condițiile de admisibilitate a utilizării criteriului T a elevului duce la o denaturare semnificativă a rezultatelor inspecției ipotezelor asupra egalității mediului. Prin urmare, în lucrările în care testarea ipotezelor asupra egalității celor două medii a fost efectuată utilizând criteriul studentului T și nu se menționează criteriile de verificare a normalității de distribuție și egalitate de dispersie, există motive să se asigure incorect Folosind autorii acestui criteriu și, prin urmare, duzioasa concluziilor declarate de ei.

O altă greșeală comună este utilizarea criteriilor de studenți T pentru a testa ipotezele cu privire la egalitatea a trei și mai multe medii de grup. În acest caz, este necesar să se aplice așa-numitul model liniar general implementat în procedura de analiză de dispersie unică cu efecte fixe.

Luați în considerare în detaliu caracteristicile utilizării elevului T-criteriu. Cel mai adesea, criteriul T este utilizat în două cazuri. În primul caz, este folosit pentru a testa ipoteza cu privire la egalitatea mediei generale a două eșantioane independente, independente (așa-numitul criteriu T de două descărcare). În acest caz, există un grup de control și un grup experimentat format din obiecte diferite, numărul căruia în grupuri poate fi diferit. În al doilea caz, se utilizează așa-numitul pereche T-criterion, atunci când același grup de obiecte generează un material numeric pentru verificarea ipotezelor cu privire la media. Prin urmare, aceste eșantioane se numesc dependente. De exemplu, conținutul de leucocit este măsurat la animale sănătoase și apoi la aceleași animale după iradierea unei anumite doze de radiații. În ambele cazuri, ar trebui efectuată cerința de normalitate a distribuției caracteristicilor studiate în fiecare dintre grupurile comparate. Dominația elevului T-criteriul în majoritatea covârșitoare a muncii reflectă două aspecte importante.

În al doilea rând, se vorbește, de asemenea, că acești autori sunt necunoscuți orice alternative la acest criteriu sau nu le pot folosi independent. Este posibilă fără exagerare să spunem că, în prezent, utilizarea fără grijă a elevului T-criteriu în majoritatea lucrărilor biologice aduce mai mult rău decât beneficiul.

5.2 F-Distribution Fischer-Sedekora

Dacă dintr-un set normal distribuit de două eșantioane independente cu volumul N 1 și N2 și calculați dispersia și cu grade de libertate ν 1 \u003d n -1 și ν 2 \u003d n2 -1, puteți determina raportul de dispersie:

Raportul de dispersie este luat astfel încât o dispersie mare să fie în numărător și, prin urmare, F ≥ 1.

Distribuția F depinde numai de numărul de grade de libertate ν 1 și ν 2 (legea distribuției F a fost deschisă R.A. FINE). Atunci când cele două eșantioane comparative sunt aleatoare independente de totalul total cu media generală, valoarea reală F nu va fi eliberată pentru anumite limite și nu va depăși valoarea critică pentru datele ν 1 și ν 2 valoarea teoretică a criteriului F (F fapt< F теор). Если генеральные параметры сравниваемых групп различны, то F факт > F teste. Valorile teoretice ale F pentru un nivel de 5% și 1% de semnificație sunt prezentate în tabel, unde numai punctele critice din dreapta sunt tabelete pentru F ≥ 1, deoarece este întotdeauna luată pentru a găsi un raport de dispersie mai mare la Mai puțin.

Curbele obținute din funcția de distribuție pentru toate valorile posibile ale F, în special cu un număr mic de observații, au o formă asimetrică - o lungă "coadă" de valori mari și o concentrație mare de valori mici F ( Figura 5.2).

Figura 5.2 - Diferențial (stânga) și integral (dreapta)
F-Distribuția lui Fisher-Snedel

Rețineți că distribuția T a elevului este un caz special de distribuție F cu numărul de grade de libertate ν 1 \u003d 1 și ν 2 \u003d v, adică egală cu numărul de grade de libertate pentru distribuție t. În acest caz, se observă următorul raport între F și T:

5.3 χ 2-Distribuție

Multe distribuții reale corespund modelelor de distribuții teoretice (normale, binomiale, Poisson), totuși, în practică există distribuții care sunt foarte diferite de normale. Pentru a evalua gradul de discrepanțe sau gradul de acord între numărul de distribuții reale și teoretice, sunt introduse criterii statistice de consimțământ, de exemplu, criteriul χ 2. Acest criteriu se aplică pentru rezolvarea problemelor de analiză statistică, de exemplu, pentru testarea ipotezelor: independența celor două principii bazate pe gruparea rezultatelor de observare de la o combinație; despre omogenitatea grupurilor în raport cu unele caracteristici; Cu privire la consimțământul curbelor teoretice și experimentale ale numerelor. Criteriul χ 2 poate fi denumit criteriul consimțământului și criteriului de independență, criteriul de omogenitate. Legea distribuției χ 2 (chi-pătrat) a deschis K. Pearson. Curba de distribuție obținută din funcția Chi-Square:

unde F este frecvențele actuale și f - teoretice ale numărului de obiecte de probă. Forma sa la un puternic depinde de numărul de grade de libertate. Pentru un număr mic de grade de libertate ν, curba asimetrică (Figura 5.3), dar cu o creștere a asimetriei ν scade și la ν \u003d ∞ curba devine normală Gaussian.

Distribuție χ 2, precum și distribuția T, caz privat
F - Distribuția cu ν 1 \u003d ν și ν 2 \u003d ∞.

Figura 5.3 - Diferențial (stânga) și integral (dreapta)
χ 2-Distribuție

Întrebări pentru auto-control

1 În ce cazuri, este de preferat să se utilizeze distribuția T a elevului și nu o distribuție normală?

2 Ce valori ar trebui evaluate pentru a utiliza distribuția T a elevului?

3 Care este esența problemei lui Berens-Fisher?

4 Ce este exprimat numeric prin distribuția F pentru două eșantioane independente din setul total de variabile?

5 Din ce valori caracteristice ale variabilelor aleatorii depind de distribuția F?

6 Ce întrebări pot răspunde la valoarea criteriului χ 2 în timpul procesării statistice a datelor experimentale?

Tema 6 Bazele statisticilor matematice

6.1 Valori medii

6.2 Aritmeticul de mijloc

6.3 Mediu Geometric.

6.4 Armonic mediu

Variabila aleatorie Y are o distribuție normală logaritmic cu parametrii μ și Σ, dacă variabila aleatorie x \u003d Lny are o distribuție normală cu aceiași parametri μ și Σ. Cunoașterea naturii legăturii dintre variabilele X și Y poate construi cu ușurință o diagramă a unei probabilități de variabilă aleatorie cu o distribuție normală logaritmică (Figura 4.2).

Figura 4.2 - Curbele densității distribuției normale logaritmic la diferite valori ale parametrilor μ și Σ

Dacă variabila randomă X are o funcție de densitate a probabilității definită prin formula (4.6) și dacă X \u003d Lny, atunci:

Unde avem pentru y\u003e 0:

Din definiție rezultă că o variabilă aleatorie supusă distribuției normale logaritmic nu poate lua decât valori pozitive. După cum se arată în figura 4.2, curbele funcției F (y) au asimetria la stânga, care este cea mai puternică decât valoarea parametrilor μ și σ. Fiecare curbă are un maxim și este definită pentru toate valorile pozitive.

Calculul așteptării matematice și dispersiei unei variabile aleatorii cu o distribuție normală logaritmic nu este deosebit de dificilă:

Prin înlocuirea și introducerea unor noi variabile în Integral 4.15 și 4.16, obținem:

În general, pentru a calcula probabilitatea ca variabila aleatorie Y cu distribuția și densitatea normală logaritmic F (Y, μ, Σ) să ia o valoare în intervalul (A, B), trebuie luat integralul:

Cu toate acestea, în practică este mai convenabil să se folosească faptul că logaritmul unei variabile aleatorie are o distribuție normală. Probabilitatea ca ≤ y ≤ b să fie echivalentă cu probabilitatea ca
LNA ≤ Lny ≤ LNB.

Calculăm probabilitatea ca o variabilă aleatorie cu o distribuție logaritmică μ \u003d 1, σ \u003d 0,5, va avea o valoare în intervalul (2, 5). Avem:

Din tabelele logaritmilor găsim LN2 \u003d 0,6932 și LN5 \u003d 1,6094.

Proiectat Lny \u003d x, putem scrie:

Mai mult, variabila aleatorie X este subordonată distribuției normale cu valoarea medie μ \u003d 1 și deviația standard σ \u003d 0,5. Acum probabilitatea dorită este ușor de calculat pe tabelele funcției integrale a distribuției normale:

Întrebări pentru auto-control

1 Definiția distribuției dreptunghiulare.

2 diagramă a probabilității unei variabile aleatorie cu o distribuție dreptunghiulară

3 Distribuția dreptunghiulară fundamentală.

4 așteptări matematice și dispersie a unei variabile aleatorie în distribuția dreptunghiulară.



5 Rolul distribuției normale în statisticile matematice.

6 Care este distribuția normală și cum este legată de binomial?

7 diagramă a densității de probabilitate a unei variabile aleatorie cu distribuție normală.

8 Ce parametri statistici pot fi setați la distribuție normală?

9 De ce distribuția normală este continuă?

10 ecuația unei curbe normale.

11 Care este abaterea normalizată?

12 Ecuația curbei normale de distribuție în forma normalizată.

13 Ce valori ale μ și σ sunt setate normală în formă normalizată?

14 Ce parte din aceste eșantioane este așezată în ± 1σ, ± 2σ, ± 3σ?

15 Ce arată tabelul de integrare normală a probabilităților?

16 ecuația unei curbe normale logaritmic.

17 diagrama densității de probabilitate a unei variabile aleatorie cu o distribuție normală logaritmic.

18 Care sunt transformările necesare pentru a obține o distribuție normală din distribuția normală logaritmic?

19 Ce parametri statistici sunt distribuția normală logaritmică?

Subiectul 5 Distribuția parametrilor de eșantionare

5.1 T - Distribuția studenților

5.2 F-Distribution Fischer-Sedekora

5.3 χ 2-Distribuție

5.1 T - Distribuția studenților

Legea distribuției normale se manifestă cu numărul de semne n\u003e 20-30. Cu toate acestea, experimentatorul desfășoară adesea un număr limitat de măsurători, pe baza concluziilor sale pe eșantioane mici. Cu un număr mic de observații, rezultatele sunt de obicei aproape și abateri mari rareori apar. Acest lucru este ușor de explicat legea distribuției normale, conform căreia probabilitatea apariției unor abateri mici este mai mare decât abaterile semnificative. Astfel, probabilitatea abaterilor care depășesc valoarea absolută de ± 2σ este de 0,05 sau un caz cu 20 măsurători și abateri ± 3σ - 0,01 sau un caz la 100.

Dacă experiența pe teren se efectuează, de exemplu, în reparații 4 - 6, este normal să se aștepte ca printre mărturia recoltelor pe delicatese paralele, vor exista abateri foarte mari. Prin urmare, deviația standard, calculată de un eșantion mic, în majoritatea cazurilor, va fi mai mică decât prin întreaga populație generală. În consecință, în aceste cazuri, este imposibil să se bazeze pe criteriile de distribuire normală în concluziile lor.

De la începutul secolului al XX-lea, o nouă direcție a devenit dezvoltată în statisticile matematice, care pot fi numite statistici mici de eșantionare. Cea mai mare importanță practică pentru lucrările experimentale a fost deschisă în 1908 de către statistica engleză și chimist V. Gosset T-Distribution, numit Distribuția studenților (limba engleză. Student - Student, Pseudonim V. Gosset).

Distribuția studenților T pentru mediul de eșantion este determinată de egalitate:

Numărul de formulare înseamnă abaterea mediului de probă pe mijlocul întregii totalități și numitorul:

- Este un indicator care estimează valoarea erorii standard a agregatului selectiv mediu.

Astfel, valoarea T este măsurată prin deviația mediului de probă pe agregatul mijlociu, exprimată în acțiunile erorii de eșantionare adoptate pe unitate.

Maxima frecvenței distribuției normale și T coincid, dar forma curbei de distribuție T depinde în întregime de numărul de grade de libertate. Cu valori foarte mici de grade de libertate, aceasta ia forma unei curbe pe termen lung, iar zona curbei este mai mare decât în \u200b\u200btimpul distribuției normale și cu o creștere a numărului de observații (n\u003e 30 ), distribuția se apropie normal și tranzițiile la acesta la n \u003d ∞.

Figura 1.1 prezintă distribuția diferențială și integrală a studentului T la 10 grade de libertate.

Figura 5.1 - Diferențial (stânga) și integral (dreapta) Distribuția studenților T

Distribuția lui T-Student este importantă atunci când lucrați cu mostre mici: vă permite să determinați intervalul de încredere care acoperă agregatul mediu , și verificați una sau o altă ipoteză cu privire la populația generală. Cu toate acestea, nu este necesar să se cunoască setările agregatului și , Este suficient să aveți estimările lor μ și Σ pentru o anumită sumă de eșantionare N.

5.1.1 Problema lui Berens-Fisher

Verificarea ipotezei despre grupurile medii generale cu distribuție normală și dispersii inegale în statisticile matematice se numește problema lui Berens-Fisher și are doar soluții aproximative. De ce este atât de important să se solicite egalitatea de dispersii în grupurile comparate? Fără a intra în detalii despre această problemă, observăm că cele mai mari dispersiile și volumele eșantionului diferă între ele, cu atât este mai puternică distribuirea "criteriului T calculat" din distribuția criteriului elevului T. În acest caz, valoarea diferită a criteriului T și un astfel de parametru al acestor distribuții, ca număr de grade de libertate. La rândul său, numărul de grade de libertate afectează amploarea nivelului de semnificație realizat (critic) (P< ...) определяемого для вычисленного значения t-критерия.

Neglijarea cercetătorilor enumerați mai presus de condițiile de admisibilitate a utilizării criteriului T a elevului duce la o denaturare semnificativă a rezultatelor inspecției ipotezelor asupra egalității mediului. Prin urmare, în lucrările în care testarea ipotezelor asupra egalității celor două medii a fost efectuată utilizând criteriul studentului T și nu se menționează criteriile de verificare a normalității de distribuție și egalitate de dispersie, există motive să se asigure incorect Folosind autorii acestui criteriu și, prin urmare, duzioasa concluziilor declarate de ei.

O altă greșeală comună este utilizarea criteriilor de studenți T pentru a testa ipotezele cu privire la egalitatea a trei și mai multe medii de grup. În acest caz, este necesar să se aplice așa-numitul model liniar general implementat în procedura de analiză de dispersie unică cu efecte fixe.

Luați în considerare în detaliu caracteristicile utilizării elevului T-criteriu. Cel mai adesea, criteriul T este utilizat în două cazuri. În primul caz, este folosit pentru a testa ipoteza cu privire la egalitatea mediei generale a două eșantioane independente, independente (așa-numitul criteriu T de două descărcare). În acest caz, există un grup de control și un grup experimentat format din obiecte diferite, numărul căruia în grupuri poate fi diferit. În al doilea caz, se utilizează așa-numitul pereche T-criterion, atunci când același grup de obiecte generează un material numeric pentru verificarea ipotezelor cu privire la media. Prin urmare, aceste eșantioane se numesc dependente. De exemplu, conținutul de leucocit este măsurat la animale sănătoase și apoi la aceleași animale după iradierea unei anumite doze de radiații. În ambele cazuri, ar trebui efectuată cerința de normalitate a distribuției caracteristicilor studiate în fiecare dintre grupurile comparate. Dominația elevului T-criteriul în majoritatea covârșitoare a muncii reflectă două aspecte importante.

În al doilea rând, se vorbește, de asemenea, că acești autori sunt necunoscuți orice alternative la acest criteriu sau nu le pot folosi independent. Este posibilă fără exagerare să spunem că, în prezent, utilizarea fără grijă a elevului T-criteriu în majoritatea lucrărilor biologice aduce mai mult rău decât beneficiul.

5.2 F-Distribution Fischer-Sedekora

Dacă dintr-un set normal distribuit de două eșantioane independente cu volumul N 1 și N2 și calculați dispersia și cu grade de libertate ν 1 \u003d n -1 și ν 2 \u003d n2 -1, puteți determina raportul de dispersie:

Raportul de dispersie este luat astfel încât o dispersie mare să fie în numărător și, prin urmare, F ≥ 1.

Distribuția F depinde numai de numărul de grade de libertate ν 1 și ν 2 (legea distribuției F a fost deschisă R.A. FINE). Atunci când cele două eșantioane comparative sunt aleatoare independente de totalul total cu media generală, valoarea reală F nu va fi eliberată pentru anumite limite și nu va depăși valoarea critică pentru datele ν 1 și ν 2 valoarea teoretică a criteriului F (F fapt< F теор). Если генеральные параметры сравниваемых групп различны, то F факт > F teste. Valorile teoretice ale F pentru un nivel de 5% și 1% de semnificație sunt prezentate în tabel, unde numai punctele critice din dreapta sunt tabelete pentru F ≥ 1, deoarece este întotdeauna luată pentru a găsi un raport de dispersie mai mare la Mai puțin.

Curbele obținute din funcția de distribuție pentru toate valorile posibile ale F, în special cu un număr mic de observații, au o formă asimetrică - o lungă "coadă" de valori mari și o concentrație mare de valori mici F ( Figura 5.2).

Figura 5.2 - Diferențial (stânga) și integral (dreapta)
F-Distribuția lui Fisher-Snedel

Rețineți că distribuția T a elevului este un caz special de distribuție F cu numărul de grade de libertate ν 1 \u003d 1 și ν 2 \u003d v, adică egală cu numărul de grade de libertate pentru distribuție t. În acest caz, se observă următorul raport între F și T:

5.3 χ 2-Distribuție

Multe distribuții reale corespund modelelor de distribuții teoretice (normale, binomiale, Poisson), totuși, în practică există distribuții care sunt foarte diferite de normale. Pentru a evalua gradul de discrepanțe sau gradul de acord între numărul de distribuții reale și teoretice, sunt introduse criterii statistice de consimțământ, de exemplu, criteriul χ 2. Acest criteriu se aplică pentru rezolvarea problemelor de analiză statistică, de exemplu, pentru testarea ipotezelor: independența celor două principii bazate pe gruparea rezultatelor de observare de la o combinație; despre omogenitatea grupurilor în raport cu unele caracteristici; Cu privire la consimțământul curbelor teoretice și experimentale ale numerelor. Criteriul χ 2 poate fi denumit criteriul consimțământului și criteriului de independență, criteriul de omogenitate. Legea distribuției χ 2 (chi-pătrat) a deschis K. Pearson. Curba de distribuție obținută din funcția Chi-Square:

unde F este frecvențele actuale și f - teoretice ale numărului de obiecte de probă. Forma sa la un puternic depinde de numărul de grade de libertate. Pentru un număr mic de grade de libertate ν, curba asimetrică (Figura 5.3), dar cu o creștere a asimetriei ν scade și la ν \u003d ∞ curba devine normală Gaussian.

Distribuție χ 2, precum și distribuția T, caz privat
F - Distribuția cu ν 1 \u003d ν și ν 2 \u003d ∞.

Figura 5.3 - Diferențial (stânga) și integral (dreapta)
χ 2-Distribuție

Întrebări pentru auto-control

1 În ce cazuri, este de preferat să se utilizeze distribuția T a elevului și nu o distribuție normală?

2 Ce valori ar trebui evaluate pentru a utiliza distribuția T a elevului?

3 Care este esența problemei lui Berens-Fisher?

4 Ce este exprimat numeric prin distribuția F pentru două eșantioane independente din setul total de variabile?

5 Din ce valori caracteristice ale variabilelor aleatorii depind de distribuția F?

6 Ce întrebări pot răspunde la valoarea criteriului χ 2 în timpul procesării statistice a datelor experimentale?

Tema 6 Bazele statisticilor matematice

6.1 Valori medii

6.2 Aritmeticul de mijloc

6.3 Mediu Geometric.

6.4 Armonic mediu

Modelul de distribuție logaritmic al faimosului Fisher de Matematică Engleză a fost prima încercare de a descrie relația dintre numărul de specii și numărul de indivizi ai acestor specii. Acest model a fost special de succes în studiile entomologice și a fost aplicat pentru prima dată de către Fisher ca model teoretic pentru descrierea distribuției speciilor în colecții. Un studiu detaliat al L. R. Taylor cu coautori a fost dedicat acestui model și statistici de diversitate.

Distribuția frecvenței speciilor pentru distribuția logaritmică este descrisă de următoarea secvență:

unde . h.- numărul de specii reprezentate de un individ, x 2/2 - numărul de specii reprezentate de două persoane etc.

Modelul logaritm are doi parametri  și x.. Aceasta înseamnă că pentru eșantionare N. și numărul de specii S. Există o singură distribuție posibilă a frecvențelor speciilor în funcție de abundența lor relativă, deoarece ambele  și H. sunt funcții N. și S.. Cu cât este mai mare probă extrasă din această comunitate, cu atât este mai mare valoarea h. Și cu atât mai puțin proporția indivizilor referitoare la speciile prezentate de un singur individ în eșantion. Doi parametri S. și N. (Numărul total de indivizi) este dependența legată
, în cazul în care - - indicele diversității care poate fi obținut din ecuație:

,

unde este suma tuturor persoanelor N.aparținând S. Vizualizări:

Modelul distribuției logaritmice, caracterizat printr-un număr mic de specii abundente și o mare parte din "rare", cu cea mai mare probabilitate a acestor comunități, a cărei structură este determinată de unul sau puțini factori de mediu.

Ca studii efectuate de Maharan în Irlanda, un astfel de rând corespunde distribuției abundenței de plante ale nivelului de bază în culturile de conifere în condiții de lumină scăzută.

5.3.3. Distribuția solidă logaritmică

Pentru majoritatea comunităților, distribuția normală a abundenței speciilor este caracteristică, dar, de obicei, acest model indică o comunitate mare, matură și diversă. O astfel de distribuție este tipică pentru sistemele atunci când valoarea unei variabile este determinată de un număr mare de factori.

Acest model a fost aplicat pentru prima dată distribuției abundenței speciilor de preston. Pe o varietate de materiale empirice, el a arătat că frecvențele speciilor în eșantioane mari sunt distribuite în conformitate cu legea logaritmică. Conform procedurii dezvoltate de el, speciile cu numărul de persoane încheiate în intervale, care sunt limitate de numărul de progresie geometrică sunt grupate. Preston provocat pe axa atmosferei în scara logaritmului bazată pe baza 2 (log 2) și numită clasele rezultate cu octas. Dar pentru a descrie modelul, puteți utiliza orice bază a logaritmului. Graficul frecvenței de frecvență a speciilor conform claselor calculate obținute în această metodă corespunde curbei cunoscute a distribuției normale trunchiate în stânga, în gama de frecvență a speciilor rare.

Distribuția este de obicei scrisă în forma:

Unde

S. R. - numărul teoretic al speciilor în octavă, situat în octatul R de la Octave Modal; S. mo. - numărul de specii din octavadă modală; - Abaterea standard a curbei de log-normale teoretice, exprimată între octavă.

Smochin. 5.3.2. Log-Normal Distribution

Distribuția log-normală este descrisă de "normal normal" simetric, adică curba în formă de clopot (figura 5.3.2). Cu toate acestea, dacă datele cu care corespund este obținută dintr-o probă limitată, partea stângă a curbei (adică, specia rară, neînsoțită) va fi exprimată fuzzy. Preston a numit acest punct de trunchiere a curbei de pe "linia de perdea stânga". "Cortina" se poate deplasa la stânga cu o creștere a dimensiunii eșantionului. În figura este indicată de săgeată. Pentru majoritatea eșantioanelor, doar o parte din curbă este exprimată în partea dreaptă a dreptului de modă. Numai cu o cantitate imensă de date colectate pe teritorii biogeografice extinse, poate fi urmărită o curbă completă. S.- CurbaForning Curve indică natura complexă a diferențierii și a nișei suprapuse. Cele mai multe specii din ecosistemele naturale deschise există în condițiile concurenței pentru resurse și nu în ceea ce privește concurența directă; Multe adaptări fac posibilă împărțirea nișelor fără o excludere competitivă din habitate. Acest model este cel mai probabil pentru comunitățile neperturbate.

Dacă aveți în continuare termeni negativi sau zero, atunci puteți adăuga o anumită constantă fiecărui membru al seriei, de exemplu. Una dintre proprietățile așteptărilor matematice, această operație nu va schimba principalele caracteristici statistice ale rândului. Această operație vă permite să vă deplasați la distribuția loggnormală în cazul specificat.

Ca urmare a aplicării operației de logarith (36), împrăștierea dintre date este redusă la seria de studiu. Acest lucru poate fi văzut din fig. 9.16: Evident, asta.

Funcția distribuției noului rând va fi egală

(37)

Dar apoi

(38)
(39)

Și, în sfârșit

(40)

Formulele (37) - (40) dau legătura dintre logare și distribuțiile sursei.


Smochin. 9.16.

Legea privind distribuția Poisson (Legea distribuției fenomenelor rare)

Toate distribuțiile cu un număr suficient de mare de teste caută legea normală de distribuție. Cu toate acestea, dacă există rezultate excepționale, excepționale între date, apoi distribuția acestor fenomene rare, în timp ce masa principală se angajează într-o lege normală, urmărește o altă lege. poisson Distributions.. Pentru această lege, este caracteristică că atunci când probabilitățile fie tind să zero. În acest caz distribuția binominală Poisson merge B.

(41)

Unde are același înțeles ca și în distribuția normală.

Lege poisson Distributions.Formula (41) definită prin formula (41) descrie probabilitatea apariției evenimentelor care apar după intervale egale, cu condiția ca toate evenimentele să apară independent unul de celălalt și cu o anumită intensitate, chiar să fie foarte mici, dar neapărat constantă. Numărul de teste este mare, iar probabilitatea apariției evenimentului așteptat este foarte mică și egală. Parametrul va caracteriza apoi intensitatea aspectului evenimentului așteptat în secvența de testare.

În acest caz, vom încerca să calculam melodiile.

Caracteristica caracteristică a acestui tip de distribuție va fi următoarele rapoarte matematice:

Exemplul 5.. La depozitul de deșeuri, au fost selectate 150 de eșantioane. Unii dintre ei au găsit prezența unui element rar:

Determină legea distribuției elementului dorit.

Decizie. Pentru a răspunde la întrebarea sarcinii, trebuie să verificați implementarea egalității (45), care este o caracteristică caracteristică poisson Distributions.. Pentru simplitatea calculelor, nu vom lua nici o sută, iar numerele lărgite de 100 de ori, adică.

Datorită faptului că concluzionăm că distribuția elementului dorit este supusă legii poisson Distributions.. Acum, folosind relațiile (42), calculați prin teoretic, comparabil cu frecvența inițială și



Ți-a plăcut articolul? Împărtășește-l