Contacte

Folosit pentru a compara mai multe cantități. Diagrama este un mijloc de imagine grafică vizuală a informațiilor destinate comparațiilor mai multor cantități sau mai multe valori ale unuia. Formatarea celulelor. Formatul numerelor în Microsoft Excel

În notele anterioare, au fost descrise procedurile de verificare a ipotezelor datelor numerice și categorii: mai multe și, de asemenea, să învețe una sau. În acest articol, vom lua în considerare metodele de testare a ipotezelor cu privire la diferențele dintre acțiunile trăsăturii din agregatele generale bazate pe mai multe eșantioane independente.

Pentru a ilustra metodele utilizate, scenariul este utilizat în care este estimată gradul de satisfacție a oaspeților de hoteluri deținute de proprietățile T. S. Resort. Imaginați-vă că sunteți un manager de companie care deține cinci hoteluri situate pe cele două insule stațiune. Dacă oaspeții sunt mulțumiți de serviciu, probabilitatea este că vor reveni anul viitor și vor recomanda prietenilor lor să rămână în hotelul dvs. Pentru a evalua calitatea serviciului, oaspeții sunt rugați să completeze chestionarul și să indice dacă sunt mulțumiți de ospitalitate. Trebuie să analizați datele sondajului, să determinați gradul comun de satisfacție a cererilor de oaspeți, să evaluați probabilitatea ca oaspeții să vină din nou anul viitor, precum și să stabilească cauzele unei posibile nemulțumiri ale unor clienți. De exemplu, pe una din insulele companiei, hotelurile de la Beachcomber și Windsurfer sunt deținute. Este serviciul în aceste hoteluri în mod egal? Dacă nu, cum pot fi utilizate aceste informații pentru a îmbunătăți calitatea companiei? Mai mult, dacă unii oaspeți au afirmat că nu vor veni mai mult la voi, ce motive indică mai des decât altele? Este posibil ca aceste motive să privească doar un anumit hotel și nu se aplică întregii companii ca un întreg?

Următoarea notație este utilizată aici: X. 1 - numărul de succes în primul grup, X. 2 - numărul de succes în cel de-al doilea grup, n. 1 X. 1 - numărul de eșecuri din primul grup, n. 2 X. 2 - numărul de eșecuri din cel de-al doilea grup, X \u003d.X. 1 + X. 2 - numărul total de succes, n.X. = (n. 1 X. 1 ) + (n. 2 X. 2 ) - numărul total de eșecuri, n. 1 - volumul primului eșantion, n. 2 - volumul celui de-al doilea eșantion, n. = n. 1 + n. 2 - eșantioane sumare. Tabelul prezentat are două linii și două coloane, deci se numește o masă de 2 × 2 factor. Celulele formate din intersecția fiecărui rând și coloană conțin numărul de succes sau defecțiuni.

Ilustram aplicarea tabelului de confruntare cu privire la exemplul scriptului descris mai sus. Să presupunem că întrebarea "vă veți întoarce anul viitor?" 163 din 227 de oaspeți ai hotelului Beachcomber, și 154 hotelul hotelului Windsurfer, a răspuns afirmativ. Există o diferență semnificativă din punct de vedere statistic între gradul de satisfacție al oaspeților hotelului (care este probabilitatea ca oaspeții să se întoarcă anul viitor), dacă nivelul de semnificație este de 0,05?

Smochin. 2. Tabelul de fata 2x2 pentru a evalua calitatea serviciului oaspeților

Prima linie indică numărul de oaspeți ai fiecărui hotel, care și-a declarat dorința de a se întoarce anul viitor (succes); În a doua linie - numărul oaspeților a exprimat nemulțumirea (eșec). Celulele situate în coloana "Total" conțin numărul total de oaspeți care intenționează să se întoarcă la hotel anul viitor, precum și numărul total de oaspeți nemulțumiți de serviciu. Celulele situate în linia "Total" conțin numărul total de oaspeți chestionați fiecare hotel. Ponderea oaspeților care intenționează să se întoarcă este calculată prin împărțirea numărului de oaspeți care au declarat acest lucru pe numărul total de oaspeți chestionați. Apoi, χ 2 -Criteria este utilizată pentru a compara fracțiunile calculate.

Pentru a verifica ipotezele zero și alternative H 0: P 1 \u003d P 2; H 1: P 1 ≠ P 2 Utilizați testul χ 2-statistici.

Criteriul "Chi-Square" pentru compararea a două bucăți.Testul χ 2 - Stația este egală cu suma pătratelor diferențelor dintre numărul observat și așteptat de succes împărțit la numărul așteptat de succes în fiecare celulă a tabelului:

unde f 0. - numărul observat de succes sau defecțiuni în celula specifică a tabelului de confruntare, f e

Test χ 2 - Stația este aproximată de distribuția χ 2 cu un grad de libertate.

Sau eșecuri în fiecare celulă a masa de conjugacie a semnelor, este necesar să se înțeleagă semnificația lor. Dacă ipoteza zero este adevărată, adică. Ponderea succesului în doi colaboratori generali este egală, acțiunile selective calculate pentru fiecare dintre cele două grupuri pot diferi de motive aleatorii, iar ambele acțiuni sunt o evaluare parametru comun Agregați generali r.. În această situație, statisticile care unesc ambele acțiuni într-o estimare comună (medie) a parametrilor r. Reprezintă o parte comună de succes în grupurile combinate (adică este egală cu numărul total de succes împărțit la dimensiunea totală a probelor). Adăugarea ei 1 – este o parte comună de eșecuri în grupurile combinate. Utilizarea notației, a cărei semnificație este descrisă în tabel din fig. 1. Puteți scoate formula (2) pentru a calcula parametrul :

unde - cota medie a semnului.

Pentru a calcula numărul așteptat de succes f. E. (adică conținutul primei linii a tabelului de conjugacie), trebuie să multiplicați dimensiunea eșantionului pe parametru . Pentru a calcula numărul așteptat de eșecuri f e (adică, conținutul celei de-a doua linii a tabelului de confruntare), trebuie să multiplicați dimensiunea eșantionului pe parametru 1 – .

Statisticile de testare calculate cu formula (1) sunt aproximate de distribuția χ 2 cu un grad de libertate. La un anumit nivel de semnificație, ipoteza α zero se abatează dacă acea χ 2 calculată este mai mare decât χ U2, valoarea critică superioară a distribuției χ 2 cu un grad de libertate. În acest fel, regula decisivă Arata astfel: ipoteza H. 0 Deflectează dacă χ 2\u003e χ U 2, în caz contrar ipoteza H 0. Nu se abate (fig.3).

Smochin. 3. Regiunea critică χ 2 -Criteria pentru compararea acțiunilor la nivelul semnificației α

Dacă ipoteza zero este adevărată, calculată χ 2 -Statismul este aproape de zero, deoarece pătratul diferenței dintre observat f. 0 și se așteaptă f. E. Valorile din fiecare celulă sunt foarte mici. Pe de altă parte, dacă ipoteza zero H 0. Este falsă și între proporțiile de succes în agregatele generale Există o diferență semnificativă, calculată χ 2 -Statismul ar trebui să fie mare. Acest lucru se explică prin diferența dintre numărul observat și așteptat de succes sau defecțiuni din fiecare celulă, ceea ce crește atunci când este ridicat în piață. Cu toate acestea, contribuțiile diferențelor dintre valorile așteptate și cele observate în totalul χ 2-statistici pot fi inegale. Aceeași diferență reală între f 0. și f e Este posibil să aibă o influență mai mare asupra statisticilor χ 2, dacă celula conține rezultatele unei mici cantități de observații decât diferența corespunzătoare unui număr mai mare de observații.

Pentru a ilustra x 2 -Criterid pentru a verifica ipoteza egalității celor două fracții, înapoi la scenariul descris în cea anterioară, rezultatele fiind prezentate în fig. 2. Ipoteza zero (H 0: P 1 \u003d P 2) susține că atunci când compară calitatea serviciului în două hoteluri, ponderea oaspeților care intenționează să se întoarcă anul viitor sunt aproape la fel. Pentru a evalua parametrul r.reprezentând ponderea oaspeților care intenționează să se întoarcă la hotel dacă ipoteza zero este adevărată, valoarea este folosită care este calculată prin formula

Ponderea oaspeților care au rămas nemulțumiți de serviciu \u003d 1 - 0,6483 \u003d 0,3517. Multiplicând aceste două mize asupra numărului de oaspeți chestionați de Hotel Beachcomber, obținem numărul așteptat de oaspeți care intenționează să se întoarcă în sezonul următor, precum și numărul de turiști care nu se mai opresc la acest hotel. În mod similar, cota așteptată a oaspeților hotelului Windsurfer este calculată:

Da - Beachcomber: = 0,6483, n. 1 \u003d 227, prin urmare, f e = 147,16.
Da - Windsurfer: = 0,6483, n. 2 \u003d 262, prin urmare, f e = 169,84.
Nu - Beachcomber: 1 - = 0,3517, n. 1 \u003d 227, prin urmare, f e = 79,84.
NO - Windsurfer: 1 - = 0,3517, n. 2 \u003d 262, prin urmare, f e = 92,16.

Calculele sunt prezentate în fig. patru.

Smochin. 4. χ 2 -Statismul pentru hoteluri: (a) date sursă; (b) tabelul de factor 2x2 pentru compararea respectării ( f. 0 ) și așteptat ( f. E.) numărul oaspeților mulțumiți și nu este mulțumit de serviciu; (c) calcularea statisticilor χ 2 atunci când comparăm ponderea oaspeților mulțumiți de serviciu; (d) Calculul valorii critice a testului χ 2-)

Pentru a calcula valoarea critică a testului χ 2 aplicată funcția Excel. \u003d Hay2.ob (). Dacă nivelul de semnificație α \u003d 0,05 (probabilitatea substituită în funcția HA2 este 1 -a), iar distribuția χ 2 pentru un factor Tabelul 2 × 2 are un grad de libertate, valoarea critică a χ 2-Stonstructists este 3.841 . De la valoarea calculată a χ 2-), egală cu 9,053 (figura 4b), depășește numărul 3,841, ipoteza zero se abate (fig.5).

Smochin. 5. Determinarea valorii critice a testului χ 2 - Statisticile cu un grad de libertate la nivelul semnificației α \u003d 0,05

Probabilitate r. Faptul că ipoteza zero este valabilă pentru χ 2 -Setural egal cu 9,053 (și un grad de libertate) este calculat în Excel folosind funcția \u003d 1 - Hea2.sp (9,053; 1, adevăr) \u003d 0,0026. r.-Noon, egal cu 0,0026, este probabilitatea ca diferența dintre acțiunile selective ale oaspeților satisfăcute cu serviciul în hoteluri de plajă și Windsurfer, este egală sau mai mare de 0,718 - 0,588 \u003d 0,13, dacă împărtășesc efectiv acțiunile în ambele colecții generale la fel. Astfel, există motive bune pentru a susține că există o diferență statistic semnificativă în serviciul între două hoteluri. Studiile arată că numărul oaspeților satisfăcuți de serviciul de la Hotelul Beachcomber, mai mult decât numărul de oaspeți care intenționează să stea la Hotelul Windsurfer.

Verificarea ipotezelor referitoare la un factor Tabelul 2 × 2.Pentru a obține rezultate exacte pe baza datelor date în Tabelul 2 × 2, este necesar ca numărul de succes sau defecțiuni să depășească numărul 5. Dacă această condiție nu este executată, trebuie aplicată o precizie exactă criteriul Fisher..

Atunci când compară procentajul de clienți, mulțumiți de calitatea serviciului în două hoteluri, criteriile Z și χ 2 conduc la aceleași rezultate. Acest lucru poate fi explicat prin existența unei legături strânse între standardizate distributie normala și χ 2-distribuție cu un grad de libertate. În acest caz, χ 2 este întotdeauna un pătrat al Z-Statistici. De exemplu, atunci când evaluează gradul de satisfacție al oaspeților, am constatat că Z.- stația este de +3,01 și χ 2 statică - 9.05. Neglijarea erorilor de rotunjire, este ușor să vă asigurați că a doua valoare este primul pătrat (adică 3.01 2 \u003d 9.05). În plus, comparativ cu valorile critice ale ambelor statistici la nivelul semnificației α \u003d 0,05, se poate constata că valoarea lui χ 1 2 este de 3,841, este pătratul valorii critice superioare a statisticii Z, egal cu +1.96 (adică χ 1 2 \u003d z 2). În plus, r.-Noții de ambele criterii sunt aceleași.

Astfel, se poate argumenta că atunci când verificăm ipotezele zero și alternative H 0: P 1 \u003d P 2; H 1: P 1 ≠ P 2 Criteriile Z și χ 2 sunt echivalente. Cu toate acestea, dacă este necesar să nu se detecteze diferențele, dar determină, de asemenea, ce proporție este mai mult (P 1\u003e P 2), urma Aplicați un criteriu Z cu o zonă critică limitată de coada distribuției normale standardizate. Apoi, aplicarea criteriului χ 2 va fi descrisă pentru compararea partajării unui semn în mai multe grupuri. Trebuie remarcat faptul că criteriul Z nu poate fi aplicat în această situație.

Utilizarea χ 2 -Criteriei pentru a testa ipoteza cu privire la egalitatea mai multor fracțiuni

Criteriul Chi-pătrat poate fi extins la un caz mai general și se aplică pentru a testa ipoteza cu privire la egalitatea mai multor acțiuni. Denotă numărul de scrisori anexe anexeze independente din. Acum, tabelul de confruntare constă din două linii și din coloane. Pentru a verifica ipotezele zero și alternative H 0: P 1 \u003d P 2 = … = p 2., H 1:nu tot R. J. egale unul cu celălalt (j. = 1, 2, …, c.), Testul folosit χ 2 -Statism:

unde f 0. - numărul observat de succes sau defecțiuni într-o celulă specifică a unui factor de tabel 2 * din, f. E. - numărul teoretic sau așteptat, de succes sau defecțiuni într-o celulă specifică a mesei de conjugitate, cu condiția ca ipoteza zero să fie adevărată.

Pentru a calcula numărul așteptat de succes sau defecțiuni în fiecare celulă a tabelului de confruntare, este necesar să se țină cont de următoarele. Dacă ipoteza zero este adevărata și ponderea succesului în toate cu agregatele generale egale, acțiunile selective corespunzătoare pot diferi doar din motive aleatorii, deoarece toate acțiunile sunt estimări ale ponderii semnului semnului r. În populația generală generală. În această situație, statisticile care combină toate acțiunile într-o estimare comună (sau moderată) a parametrului r., conține mai multe informații decât fiecare dintre ele individual. Aceste statistici au fost denotate de simbol Reprezintă o parte comună (sau medie) de succes în eșantionul unic.

Calculul lobului mijlociu:

Pentru a calcula numărul așteptat de succes f e În prima linie a tabelului de confruntare, trebuie să multiplicați volumul fiecărui eșantion la parametru. Pentru a calcula numărul așteptat de eșecuri f e În a doua linie a tabelului de configurare a simptomelor, trebuie să multiplicați volumul fiecărui probă la parametru 1 – . Statisticile de testare calculate cu formula (1) sunt aproximate de distribuția χ 2. Numărul de grade de libertate a acestei distribuții este stabilit de magnitudinea (R - 1) (c. – 1) Unde r.- numărul de rânduri dintr-un tabel factor, din - Numărul de coloane din tabel. Pentru tabelul factorului 2 * S. Numărul de grade de libertate este egal (2 - 1) (C - 1) \u003d C - 1. La un anumit nivel de semnificație α, ipoteza zero deviază dacă "- stația calculată este mai mare decât valoarea critică superioară χ U 2 inerente în distribuția χ 2 cu c - 1. grade de libertate. Astfel, regula decisivă este după cum urmează: ipoteza H 0. Dejectat dacă χ 2\u003e χ U2 (figura 6), altfel ipoteza deviază.

Smochin. 6. Regiunea critică χ 2 -Criteria pentru comparație cu o fracțiune la nivelul semnificației α

Verificarea ipotezelor referitoare la un factor de tabel 2 * p. Pentru rezultate precise pe baza datelor prezentate într-un factor Tabel 2 * dinEste necesar ca numărul de succes sau defecțiuni să fie destul de mare. Unele statistici consideră că criteriul oferă rezultate exacte dacă frecvențele preconizate depășesc 0,5. Mai mulți cercetători conservatori necesită nu mai mult de 20% din semnele de conjugiu de semne conținute valori așteptate care sunt mai mici de 5, și nici o celulă nu trebuie să conțină valoarea așteptată mai mică de una. Ultima condiție Ne pare a fi un compromis rezonabil între aceste extreme. Pentru a satisface această condiție, categoriile care conțin mici valori așteptate ar trebui combinate într-una. După aceasta, criteriul devine mai precis. Dacă din orice motiv, trebuie să se unească mai multe categorii, trebuie aplicate proceduri alternative.

Pentru a ilustra x 2 -Criteria pentru verificarea ipotezei despre egalitatea cota în mai multe grupuri, înapoi la scriptul descris la începutul capitolului. Luați în considerare un studiu similar, în care oaspeții a trei hoteluri aparținând companiei T. S. Resorts Resurse (figura 7a) iau parte.

Smochin. 7. Masă de fabricație 2 × 3 Pentru comparație, numărul oaspeților mulțumiți și nu este mulțumit de serviciu: (a) numărul observat de succes sau de eșecuri - f 0.; (b) numărul așteptat de succes sau defecțiuni - f. E.; (c) calcularea statisticilor χ 2 atunci când comparăm ponderea oaspeților mulțumiți de serviciu

Ipoteza zero susține că ponderea clienților intenționează să se întoarcă anul viitor, în toate hotelurile aproape la fel. Pentru a evalua parametrul r.reprezentând ponderea oaspeților care intenționează să se întoarcă la hotel, utilizează valoarea R. = X /n. \u003d 513/700 \u003d 0,733. Ponderea oaspeților care au rămas nemulțumiți este de 1 - 0,733 \u003d 0,267. Multiplicând trei acțiuni pe numărul de oaspeți chestionați în fiecare dintre hoteluri, obținem numărul așteptat de oaspeți care intenționează să se întoarcă în sezonul următor, precum și numărul de clienți care nu se mai opresc la acest hotel (fig.7b).

Pentru a verifica ipotezele zero și alternative, utilizați test χ 2-statistici calculate utilizând valorile așteptate și observate cu formula (1) (fig.7b).

Valoarea critică a testului χ 2 este determinată de formula \u003d hi2.ob (). Deoarece oaspeții participă la sondaj, sunt implicați oaspeții din trei hoteluri, χ 2 -Stația are (2 - 1) (3 - 1) \u003d 2 grade de libertate. La nivelul semnificației α \u003d 0,05, valoarea critică a χ 2 -Statistică este de 5,991 (figura 7g). De la calculata χ 2 -Sathet, egală cu 40.236, depășește valoarea critică, ipoteza zero se abate (fig.8). Pe de altă parte, probabilitatea r. Faptul că ipoteza zero este valabilă pentru χ 2 -Statural egală cu 40.236 (și două grade de libertate) se calculează în Excel folosind funcția \u003d 1-HI2.mp () \u003d 0,000 (fig.7 g). r.-Neniunea este de 0,000 și mai puțină semnificație α \u003d 0,05. În consecință, ipoteza zero deviază.

Smochin. 8. Domenii de adoptare și abatere a ipotezei privind egalitatea celor trei fracții la un nivel de semnificație egale cu 0,05 și două grade de libertate

Dejectarea ipotezei zero la compararea acțiunilor indicate într-un factor de tabel 2 * dinPutem doar susține că ponderea oaspeților satisfăcuți de serviciul în trei hoteluri nu coincid. Pentru a afla care acțiuni sunt diferite de celelalte, trebuie aplicate alte metode, de exemplu, procedura Maraskuil.

Procedura Maracouquilo. Vă permite să comparați toate grupurile din perechi. În prima etapă a procedurii, se calculează diferența P S J - P S J (unde j.j.) între c (C - 1) / 2 vapori. Domeniul critic corespunzător este calculat prin formula:


Cu nivelul general de semnificație α, valoarea este o rădăcină pătrată din valoarea critică superioară a valorii de distribuție "Chi-Square" având c - 1. grade de libertate. Pentru fiecare pereche de fracțiuni selective, este necesar să se calculeze un domeniu critic separat. În ultima etapă, fiecare c (C - 1) / 2 Pereche de fracțiuni comparativ cu domeniul critic corespunzător. Acțiunile care formează o pereche specifică sunt considerate statistic semnificativ diferite dacă diferența absolută a fracțiunilor de probă P S J - P S J | depășește domeniul critic.

Voi ilustra procedura Marasko cu privire la exemplul unui sondaj de trei hoteluri (Figura 9a). Aplicând criteriul "Hee-Square", am fost convinși că există o diferență statistic semnificativă între acțiunile oaspeților oaspeților oaspeților de la diverse hoteluri în anul următor. Deoarece oaspeții a trei hoteluri sunt implicați în sondaj, este necesar să se efectueze 3 (3 - 1) / 2 \u003d 3 comparații pereche și calculează trei domenii critice. Pentru a începe cu, calculăm trei lobi selectivi (figura 9b). Cu un nivel general de semnificație, egal cu 0,05, valoarea critică superioară a testului χ 2-statistici pentru distribuția "Chi-pătrat" \u200b\u200bavând (C - 1) \u003d 2 grade de libertate este determinată de formula \u003d Hay2.ob (0,95; 2) \u003d 5.991. Deci, \u003d 2,448 (figura 9b). Apoi, calculează trei perechi de diferențe absolute și leziunile critice corespunzătoare. Dacă diferența absolută este mai mult din domeniul său critic, atunci acțiunile corespunzătoare sunt considerate semnificativ diferite (figura 9g).

Smochin. 9. Rezultatele punerii în aplicare a procedurii Marasko de a testa ipoteza privind egalitatea ponderii oaspeților satisfăcuți de trei hoteluri: (a) date de votare; (b) acțiuni selective; (c) valoarea critică superioară a testului χ 2 -Statisticile pentru distribuția "chi-pătrat"; (d) trei perechi de diferențe absolute și leziunile critice corespunzătoare

După cum putem vedea, la un nivel de semnificație egal cu 0,05, gradul de satisfacție al oaspeților hotelului Palm Royal (P S2 \u003d 0,858) este mai mare decât oaspeții hotelurilor de aur Palm (P S1 \u003d 0,593) și Palm Printesa (P S3 \u003d 0.738). În plus, satisfacția oaspeților hotelului Palm Princess este mai mare decât oaspeții hotelului Golden Palm. Aceste rezultate trebuie să forțeze conducerea să analizeze cauzele unor astfel de diferențe și să încerce să determine de ce gradul de satisfacție al oaspeților de la Golden Palm Hotel este semnificativ mai mic decât oaspeții altor hoteluri.

Materialele cărții Levin și colab. Statistici pentru manageri. - M.: Williams, 2004. - Cu. 708-730.

Cartea discută principalele tehnici de lucru pe computerul Macintosh. Caracteristicile de lucru în sala de operație sunt afișate mac sistem. OS X: interfața cu utilizatorul, Instalarea / eliminarea programelor, Burn CD / DVD, Documente de imprimare, conectare la Internet etc. descrie principalele aplicații incluse în OS: client de poștă electronică Poștă; Browser-ul web Safari; Calendar-jurnal iCal; Aplicația care controlează widget-urile, tabloul de bord; Photo Booth Program pentru a lucra cu încorporarea camera digitala; Editor de muzică Garajerband; Aplicație pentru mașină de timp pentru copie de rezervă și colab. Lucrul cu aplicațiile media integrate IWORGE: editor de text Pagini, numere de foi de calcul, program pentru a crea prezentări cheie. Caracteristicile tastaturii Macintosh sunt afișate și sunt efectuate analogii cu o tastatură a computerului IBM PC. CD-ul conține sarcini pentru muncă independentă Cu aplicațiile Mac OS X și IWork, materiale pentru îndeplinirea sarcinilor, exemple de prezentare.

Pentru utilizatorii novici.

Carte:

Secțiuni de pe această pagină:

Diagramă - reprezentare grafică Date din intervalul selectat.

Pentru a construi diagrame, urmați următorul algoritm

1. Creați un tabel de valori de decontare.

2. Evidențiați intervalul dorit (Poate constata în intervale dreptunghiulare non-adiacente).

3. Selectați tipul dorit de diagramă din lista organizată de buton Diagrame.(Grafice):


Sau din lista meniului Introduce.(Introduce)? Diagramă(Diagramă).

4. Creați setări pentru diagrama creată din fereastra Inspector din fila Diagramă(Diagramă).

În detaliu, luați în considerare setările parametrilor diagramei din această secțiune, deoarece această întrebare a înțeles anterior în cerere Pagini (vezi secțiunea 5.1.14), Iar practica de a lucra cu grafice va fi dezmembrată în secțiune. 6.2.8.

Tipuri de diagrame și exemple de utilizare a acestora

aplicație Numere.oferă aceeași listă de diagrame ca Pagini.Lucrul cu diagrame în Paginia fost considerat in secțiune. 5.1.14, în care atenția a fost plătită numai diferitelor setări de diagrame, dar nu a fost dată caracteristici comparative Diferite specii. În această secțiune vom analiza câteva exemple de utilizare a anumitor tipuri de diagrame care demonstrează în mod clar domeniul lor de aplicare.

Diagrama circulară

Circular diagramă (PLĂCINTĂ)și versiunea sa volumetrică (Piele 3D)folosit pentru a compara mai multe valori la un punct sau mai multe părți ale unui întreg. După cum urmează numele, diagrama este un cerc care este împărțit în sectoare. Cercul corespunde cu suma totală a tuturor datelor și este de 100%, fiecare sector corespunde unui anumit, care face parte din ( procent) Din total.

Exemplul 1.Într-o zi, unchiul Fedor sa dus la pădure pe ciuperci și a adunat: 24 de chanterelles, 9 Mokhovikov, 15 valuri, 5 alb. Construiți o diagramă de colectare a ciupercilor circulare care arată ce procent din cantitățile totale reprezintă ciupercile albe.

Trebuie să pre-pregătiți un tabel de valori pentru care va fi construită diagrama. Tabelul trebuie adăugat la numele de ciuperci și date numerice, apoi evidențiază intervalul A1: D2 (figura 5.86) și selectați tipul de diagramă Plăcintă (Circular). Celulele primei linii ale gamei selectate sunt numele sectoarelor cercului, celulele al doilea șir conțin date de diagramă numerică. Întregul cerc este numărul total de ciuperci colectate - 45, fiecare sector reflectă procentul fiecărui nume de ciuperci din cantitățile totale, fig. 5.86).


Utilizarea unei diagrame circulare nu este întotdeauna convenabilă și clar, de exemplu, o creștere a numărului de ciuperci colectate va conduce la o creștere a sectoarelor, ceea ce va afecta pernicabil informativitatea diagramei. În acest caz, ar trebui utilizate alte tipuri.

Diagrame coloane

Numere. oferă mai multe variante ale diagramei coloanei: Coloană. (Coloană) - coloane verticale, Bar (Histogramă) - coloane orizontale, 3D coloană. (Coloană tridimensională), Bar 3D. (Histogramă tridimensională).

Coloană Diagrama și diferite opțiuni sunt utilizate pentru a compara mai multe cantități în mai multe puncte, dar pot fi de asemenea utilizate pentru a compara mai multe valori la un moment dat ca în exemplul anterior (vezi figura 5.86).

După cum urmează numele, diagrama coloanei constă din coloane, a căror înălțime corespunde valorilor valorilor comparate, în exemplul 1, înălțimea coloanelor este determinată de cantitatea de ciuperci colectate. Fiecare coloană este legată de un anumit punct de referință. În exemplul 1, punctul de referință corespunde denumirii ciupercii, câte elemente (4), atât de multe coloane (vezi figura 5.86).

Luați în considerare sarcina pentru care diagrama circulară nu este potrivită pentru rezolvare. În exemplul 2, de mai multe ori trebuie comparate de mai multe ori.

Exemplul 2. Să presupunem că prietenii săi s-au alăturat unchiului Fedor pe colecția de ciuperci: pisica lui Matroskin și câinele, datele sunt prezentate în tabel (figura 5.87). Construiți o diagramă în care se reflectă rezultatele tuturor colectorilor.


Înălțimea coloanei reflectă, ca în exemplul 1, numărul de ciuperci colectate rămâne în continuare 4 puncte de referință, dar în contrast cu exemplul 1, în fiecare punct de referință nu este o coloană, dar trei (o coloană pentru fiecare colector). Toate coloanele unui colector vor fi vopsite într-o singură culoare. Pentru a construi o diagramă, ar trebui izolată o gamă A1: E4 (vezi figura 5.87), în fig. 5.87 Tipul diagramei Coloană. (Coloană).

Diagrama liniară

Liniar Diagrama ( Linia) Se intenționează să urmărească modificările în mai multe cantități atunci când se deplasează de la un punct la altul.

Exemplul 3.Construiți o diagramă liniară bazată pe o masă din exemplul 2, reflectând modificarea numărului de ciuperci colectate în funcție de tipul lor.

Punctele de referință rămân încă patru în numărul de specii de ciuperci. Numărul de ciuperci colectate este marcat pe graficul etichetelor conectate la fiecare segment. Ca rezultat, graficul reprezintă o linie întreruptă formată din mai multe segmente, de aici această specie Graficele sunt așa-numite - liniare. Diagrama prezentată în fig. 5.88, conține trei linii, fiecare dintre care corespunde unui colector. Liniile diferă una de cealaltă: culoarea, tipul de accident vascular cerebral, markeri.

Diagrama pătratului

Diagramă pătrat Reprezintă un hibrid de diagrame liniare și de coloane, reflectă în mod clar compararea mai multor valori la un moment dat.

Exemplul 4.Construiți o diagramă a unui pătrat bazat pe o masă din exemplul 1, reflectând colecția de unchiul Fedor.

Dacă pe vârfurile coloanelor prezentate în fig. 5.86, puncte de marcare, conectați-le cu segmente și zona rezultată pentru a picta în orice culoare, apoi zona zonei, prezentată în fig. 5.88. Pentru a afișa mai multe colectoare, acest tip de diagramă nu este informativ.

Numere. oferă două opțiuni ale zonei graficului: Zonă (Pătrat) și versiunea sa în vrac 3D. Zonă (zonă tridimensională).


Diagrame multi-nivelate

Multi-tier. Diagrama vă permite să comparați vizual sumele valorilor multiple la mai multe puncte și, în același timp, arată contribuția fiecărei valori în suma totală.

Exemplul 5.Construiți diagrame multi-nivel bazate pe o masă din exemplul 2.

Numere.oferă șase variante ale unei diagrame multi-tier: Coloană stivuită.(Coloane cu mai multe niveluri) și versiunea sa în vrac Coloana 3D stivuită(Coloane tridimensionale cu mai multe dimensiuni), Stacked bar.(Histogramă multi-nivel) și 3D Stacked Bar.(Histogramă tridimensională cu mai multe dimensiuni), Zona stivuită(Zona multi-tier) și Zona 3D stivuită(Zona multi-tier tridimensională).

Cu toate acestea, diagrama circulară nu asigură întotdeauna vizibilitatea necesară a prezentării informațiilor. În primul rând, într-un cerc poate exista prea multe sectoare. În al doilea rând, toate sectoarele pot avea aproximativ aceeași dimensiune. Împreună, aceste două motive fac o diagramă circulară a unei ardezie.

2.Graficul Star (Histogram) - Acesta servește pentru a compara mai multe cantități la mai multe puncte.

Diagramele de stele (după cum urmează din nume) constau în coloane. Înălțimea coloanei este determinatăvalorile valorilor comparate . Fiecare coloană este legată depunct de sprijin. .

3.Diagrama liniară (grafic) -Acesta servește pentru a urmări modificările în mai multe valori în timpul tranziției de la un punct la altul.

Construcția unei diagrame liniare este similară construirii unei coloane. Dar, în loc de coloane, înălțimea lor este marcată pur și simplu (puncte, liniuțe, cruci) și semnele obținute sunt conectate prin linii drepte. În loc de incubație diferită (coloane), se utilizează diferite mărci (rombice, triunghiuri, cruci etc.), grosime diferite și tip de linii (solide, punctate etc.), culoarea diferită.

4. Diagrama Yarus (histogramă de acumulare) - vă permite să comparați vizual sumele valorilor multiple la mai multe puncte și, în același timp, să indice contribuția fiecărei valori în suma totală.

Ordinea construirii unei diagrame de lungă durată este foarte asemănătoare cu ordinea construirii unei diagrame a coloanei. Diferența este că coloanele din diagrama lungă nu sunt plasate unul lângă celălalt, ci unul pe altul. În consecință, regulile de calcul al mărimii verticale și orizontale ale diagramei sunt schimbate.

5. Diagrama regională (diagrama zonei) - Diagrama nucleară hibridă cu o linie liniară vă permite să urmăriți simultan schimbarea fiecăruia dintre puținele valori și schimbarea sumei în mai multe puncte.

Coloanele separate se îmbină, formând zone continue. Prin urmare, numele - diagrama zonelor sau diagramei zonei. Fiecare zonă corespunde unui anumit tip de valoare, pentru a indica cantitatea de incubație (colorarea). Anterior, nivelurile au fost localizate coloane, acum - linii (și zona subliniată).

    Formatarea celulelor. Formatul numerelor B. Microsoft Excel..

Formatarea în Excel este utilizată pentru a facilita percepția datelor, care joacă un rol important în productivitatea muncii.

Pentru a atribui formatul de care aveți nevoie pentru a face următoarele:

2. Selectați comanda "Format" - "Cell" (Ctrl + 1).

3. În caseta de dialog care apare, introduceți parametrii de formatare dorită.

4. Apăsați butonul "OK".

Celula formatată salvează formatul său până când se aplică un nou format sau cel vechi nu va fi eliminat. Când introduceți valoarea în celulă, formatul este utilizat pentru aceasta.

Pentru a elimina formatul de care aveți nevoie pentru a face următoarele:

1. Selectați celula (gama de celule).

2. Selectați comanda "Editați" - "Clear" - "Formate".

3. Pentru a elimina valorile din celule, selectați comanda "All" "Clear".

Ar trebui să se țină cont de faptul că atunci când copiază celula, împreună cu conținutul său, formatul celular este copiat. Astfel, puteți economisi timp prin formatarea celulei sursă înainte de a utiliza comenzile de copiere și de inserare

Formatarea poate fi, de asemenea, produsă utilizând bare de instrumente. Comenzile de formatare cele mai frecvent utilizate sunt transferate în bara de instrumente "Formatare". Pentru a aplica formatul utilizând butonul Bara de instrumente, selectați celula sau intervalul de celule și apoi apăsați butonul mouse-ului. Pentru a elimina formatul, faceți clic pe butonul repetat.

Pentru a copia rapid formate din celulele selectate la alte celule, puteți utiliza formatul "Formatare" "format"

Formatarea poate fi aplicată pentru a separa simbolurile textuale din celulă în același mod ca și întreaga celulă. Pentru aceasta, selectați caracterele dorite și apoi selectați comanda "Cell" din meniul "Format". Apoi, setați atributele dorite și faceți clic pe butonul "OK". Apăsați tasta Enter pentru a vedea rezultatele muncii dvs.

Setarea formatului numerelor din Excel

La fel de programul Excel. Proiectat pentru prelucrarea numerelor, configurația corectă a formatului lor joacă un rol important. Pentru o persoană, numărul 10 este doar o unitate și zero. Din punctul de vedere al lui Excel, aceste două cifre pot avea o informație complet diferită în funcție de faptul că indică numărul de angajați ai companiei, valoarea monetară, procentul întregului sau fragmentului antetului "10 firmei de vârf". În toate cele patru situații, acest număr ar trebui să fie afișat și procesat în moduri diferite. Excel suportă următoarele formate de date:

* Uzual - Textul I. valori numerice. tip arbitrar; * Numeric - Cel mai mod general. reprezentări ale numerelor; * Monetar - valori de bani; * Financiar - valorile banilor cu aliniere pe separatorul părților întregi și fracționate; * Data - data sau data și ora; * Timp - timpul sau data și ora; * Procent - valoarea celulară înmulțită cu 100 cu simbolul "%" la sfârșit; * Fractional - fracțiuni raționale cu numărător și numitor; * Exponențială - zecimal numere fracționate; * Text - datele de text sunt afișate în același mod în care sunt introduse și procesate liniile, indiferent de conținutul acestora; * Adiţional - Formate pentru lucrul cu baze de date și liste de adrese; * Personalizat - Formatul este personalizabil de către utilizator.

Cele mai frecvente opțiuni de format de date pot fi atribuite utilizând bara de instrumente de formatare.

1. Faceți clic pe celula C4 și apoi pe buton Format procentual.. Valoarea celulei C4 va fi înmulțită cu 100, iar semnul "%" va fi adăugat la acesta.

Smochin. 9.14. Forma de selectare a formatului de date

2. Apăsați în jos și faceți clic pe buton. Formatul de bani.

3. Faceți clic pe celula SAT și apoi pe buton Formatul cu separatoarele. Acest buton determină alinierea numerelor în coloana de pe separatorul părților întregi și fracționate.

4. Selectați celula C7 și faceți clic pe buton. Creșteți bit.. Acest buton nu modifică formatul principal, dar adaugă un semn în partea fracțională a numărului.

5. Apăsați tasta Enter și faceți clic pe buton. Reduceți bitul. Această operație elimină o parte de parte fracțională și rundă numărul. Acum, celulele cu C4 pe C9 arata complet diferit, deși simultan aceleași numere au fost introduse în ele. Alte formate sunt atribuite utilizând următoarele acțiuni.

6. Faceți clic pe celula C10 și selectați comanda. Format\u003e Celule.

7. În caseta de dialog care se deschide, extindeți fila. Număr (Figura 9.14).

8. În listă Formate numerice Faceți clic pe elementul Data.

9. În lista care apare Un fel Faceți clic pe linia 14 Mar 01 (14-Mar-01). Apoi faceți clic pe buton O.K.

Smochin. 9.15. Diverse formate de numere

10. În mod similar, atribuiți un format exponențial cu o celulă C11, iar celula C12 este un format numeric. Acum, tabelul va arăta astfel (figura 9.15). Rețineți că valoarea medie a tabelului nu sa schimbat, adică atunci când formatul este modificat, numai metoda de modificare a afișajului și valorile numerice rămân neschimbate. Pentru a verifica acest fapt, urmați acești pași.

11. Faceți dublu clic pe celula C11 și schimbați suma 03.01.1900 la 03.02.1900.

12. Apăsați tasta Enter. Valoarea medie a tabelului (care este afișată în formatul monetar) se modifică instantaneu cu 15.41. Cum să vă conectați, puteți rezuma datele cu dobândă și rezultă din primirea de ruble. Acesta este un exemplu tipic de formate de date incorecte.

    Protecția foilor. Protecția celulelor în Microsoft Excel.

    Autoformate și stiluri în Microsoft Excel.

    Folosind formatarea condiționată în Microsoft Excel.

    Crearea unei liste și forme de date în Microsoft Excel. Cerințe pentru realizarea unei liste.

    Sortarea și filtrarea datelor în Microsoft Excel (Autofilter, Filtru avansat).

    Gruparea și strângerea datelor în Microsoft Excel.

    Rezultate automată: crearea unei tabele finale, reflectată pe ecranul rezultat în contextul uneia sau mai multor grupuri de înregistrări.

    Creatură tabelul rezumat în Microsoft Excel. (în notebook)

    Legarea și consolidarea datelor. (în notebook)

    Conceptele teoriei bazelor de date. Principiile organizării datelor.

    Modele ierarhice și de rețea ale organizării datelor.

    Modelul relațional al organizației de date. Forme normale.

    Conceptele sistemelor de control ale BD (DBMS) și scopul acestora.

    Sisteme profesionale de gestionare a bazelor de date (DBMS).

    Alocarea, ordinea de lucru, crearea bazelor de date MS Access.

    Tabele Baza de date MS Access: scop, structură, opțiuni de creație.

    Tipuri de date și proprietăți ale câmpurilor DBMS MS Access.

    Conceptul unui domeniu, atribut, o cheie de bază de date relațională.

    Crearea unei structuri de conexiuni între tabelele bazei de date.

    Tipuri de relații și restricții în DBMS MS Access.

    Concepte, numire și proprietăți ale formularelor.

    Opțiuni pentru crearea de formulare. Folosind maestrul principal.

    Lucrul cu designerul de forme. Secțiuni de formă.

    Utilizarea expresiilor și a câmpurilor calculate.

    Tipuri de controale de formă.

    Scop, tipuri și opțiuni pentru crearea de solicitări.

    Ordinea de a lucra cu designerul de solicitări.

    Filtrarea și sortarea datelor în interogări.

    Utilizați operatori și condiții în interogări.

    Crearea câmpurilor calculate, asociații în interogări.

    Procedura de lucru cu solicitări multi-locuri de muncă.

    Interogări finale. Operațiuni de grup în MS Access.

    Schimbarea informațiilor utilizând solicitări de modificare.

    Alocarea și modalitățile de a crea rapoarte de acces MS.

    Folosind un expert pentru a crea un raport.

    Lucrul cu designerul de raport.

    Gruparea datelor și a rezultatelor intermediare în rapoarte.

    Macrocomenzile în acces și designul acestora.

    Protecția informațiilor în baze de date.

    Clasificare retele de calculatoare. Conceptul de server, stații de lucru.

    Software pentru lucrul în rețelele locale și pe Internet.

    Schimbul de date în rețele, protocoale. Hardware de rețea. Comunicarea între rețele. Rețele fără fir.

    Internet, structură de rețea, concepte de bază. Servicii de internet.

    Principiile căutării de informații.

    Indexarea și motorul de căutare.

    Schema de recuperare a informațiilor. Strategii de căutare. Interfață.

    Programe antivirus și clasificarea acestora.

    Fundamentale pentru protecția informațiilor și a informațiilor care constituie un secret de stat.

    Modalități de a proteja programele și datele.

    Echipamente de protecție hardware.

Criteriile parametrice pe care le-am considerat până acum se bazează pe faptul că eșantioanele comparate pot fi caracterizate de doi parametri: deviație medie și standard (sau altă măsură de variabilitate). Și dacă distribuția în eșantioane (sau, mai precis, în generalul general, de unde au provenit aceste probe) este complet diferită?

Dacă numărul fiecăruia dintre eșantioanele comparabile este suficient de mare (mai mult de o sută), pot fi utilizate oricum criteriile parametrice. Indiferent de distribuția aceste eșantioane, media "comportament" este aproximativ aceeași cu probele medii cu distribuție normală. Cu toate acestea, dacă mărimea eșantioanelor este mai mică, trebuie utilizate criterii non-parametrice.

De exemplu, un analog non-parametric al elevului T-criterion este criteriul U Mann-Whitney. Criteriul elevului se bazează pe distribuție, care descrie abaterile valorii medii ale eșantionului unui anumit număr din jurul valorii de moderator general distribuit în mod normal. Cu cât deviația este mai puternică, cu atât este mai mică probabilitatea ca acesta să se datoreze accidentului atunci când se formează o probă. Și cum să acționăm, dacă nu știm nimic despre natura distribuției agregatelor generale?

Luați în considerare un exemplu destul de simplu, explicând modul în care un grup mare de metode non-parametrice lucrează - criterii de rang. Avem două eșantioane. Plasați elementele lor în ordine ascendentă: primul - A1, A2, A3, A4, A5; Al doilea - B1, B2, B3, B4, B5, B6. Vom face elementele acestor eșantioane, un interval comun construit în ordinea creșterii valorilor acestora. Comparați trei cazuri diferite:
Nr. 1: A1, A2, A3, A4, A5, B1, B2, B3, B4, B5, B6;
Nr. 2: A1, A2, A3, A4, B1, A5, B2, B3, B4, B5, B6;
Nr. 3: B1, A1, B2, A2, B3, A3, B4, B5, A4, A5, B6.

În cazul numărul 1, toate elementele unui eșantion sunt situate pe o parte a totalului, și toate elementele unui alt rând - pe de altă parte. În cazul nr. 2 al unui permutare (elemente B1 și A5), ar fi de ajuns ca ordinea elementelor, ca în cazul nr. 1. În cele din urmă, în cazul nr. 3, elementele a două Probele sunt confuze și pentru a le construi la rând, unde vor sta singuri și apoi - alții, este necesar să se facă 5 permutări. Trebuie să alegem între o ipoteză alternativă (conform căreia eșantioanele A și B sunt luate din diferite agregate) și ipoteza zero (conform căreia aceste eșantioane sunt luate din aceeași compatibilitate). Este probabilitatea de ipoteze alternative și zero pentru trei cazuri diferite care demonstrează de noi? Nu; Ipoteza alternativă este mai probabilă în primul caz și zero - în a treia.

Ideea unui criteriu non-parametric de rang este că putem folosi numărul de permutări necesare ca măsură pentru evaluarea ipotezei zero și alternative. Valorile specifice care sunt calculate la aplicarea criteriilor non-parametrice sunt diferite, dar logica comparației corespunde cu exemplul considerat de noi.

Deci, datorită utilizării abordărilor vrăjitoare, analogii lor non-parametrici sunt selectați pentru metodele de comparare a eșantionului parametric (Tabelul 4.8.1). Cel mai adesea, metodele non-parametrice au mai puțină putere (adică respingerea mai des o ipoteză alternativă în situația atunci când este de fapt adevărată), dar vă permite să lucrați cu o varietate de date distribuite și mai puțin sensibile la numărul mic de eșantioane comparate.

Tabelul 4.8.1. Analogi non-parametrici ai metodelor parametrice

Tipul de comparație

Metode parametrice

Metode non-parametrice

Compararea valorilor de mărime în două eșantioane independente

t-criteriul elevului;
Analiza dispersiei (ANOVA)

U-criteriu mann-whitney;
Criteriul seriei Wald-Wolfovitsa;
Criteriul de evacuare al lui Kolmogorov-Smirnova

Compararea valorilor de mărime în două eșantioane dependente

elevul de criteriu pentru comparații pereche

Criteriul semnelor.
Criteriul lui Vilkoxon

Compararea valorilor de mărime în mai multe eșantioane independente

Analiza dispersiei (ANOVA)

Analiza dispersiei de la KraklaLa-Wallis;

Testul median

4.9. U-criteriu mann-whitney

Pentru a lua în considerare aplicarea criteriului Mann-Whitney asupra fișierului nostru-exemplu Pelophylax_example.sta, va trebui să folosim un exemplu multiplu artificial. Ca valoare de exemplu, a căror distribuție este foarte diferită de normal, putem folosi un semn numit ADN - conținutul de ADN pe celulă (în picograme, pg), măsurat folosind citometria ADN care curge.

Smochin. 4.9.1. Semnul "ADN" are o distribuție, drastic diferit de normal

Aflați dacă semnificația acestui semn de femei și bărbați diferă Pelophylax esculentus.. Pentru a profita de criteriul lui Mann-Whitney, să mergem la meniul statistic / nonparametrics. Acordați atenție pictogramelor din meniu: acestea corespund celor utilizate pentru comparații similare utilizând testul T.

Smochin. 4.9.2. U-Criteriul Mann-Whitney este calculat aici

În caseta de dialog, trebuie să specificați variabilele dependente (dependente) și de grupare; Dacă variabila de grupare are mai mult de două valori, trebuie să selectați cele două valori care compară mostrele comparate. Pentru a alege numai reprezentanți Pelophylax esculentus., Folosim fereastra Select Cazuri și folosim denumirile textuale-digitale introduse la punctul 3.1, când descrieți fișierul de probă.

Smochin. 4.9.3. Instalații selectate pentru compararea descrisă

Puteți vedea că Statistica calculează toate cele trei menționate în tabelul. 4.9.1. Criteriile care sunt utilizate pentru a compara două eșantioane independente, dar "recomandă" (pornește de la butonul situat în stânga colțul superior) Criteriul mann-whitney. Eu o calculează și asigură că diferențele dintre femele și bărbați în numărul de ADN care apar pe celulă sunt nesemnificative din punct de vedere statistic.

Smochin. 4.9.4. Rezultatul comparației pe Manna-Whitney

Dacă nu suntem interesați de criteriul unic, este recomandabil să se utilizeze valoarea P, calculată cu modificarea (care este după coloana "Z ajustată, adică 0,906780). Acest amendament mărește puterea criteriului în cazul eșantioanelor, Numărul de care depășește 20. Deci, altfel, nu a fost găsită o diferență semnificativă între bărbați și femei.

Dialogul pe care l-am folosit pentru comparație pe Manno-Whitney oferă posibilitatea de a construi casete. Deoarece folosim o metodă non-parametrică, parametrii de eșantion nu sunt prinși pe diagramă (de exemplu, valoarea sa medie), iar măsurile neparametrice sunt utilizate - mediană și quartile (valori, "felii" în a patra parte a Distribuție).

Smochin. 4.9.5. Comparație grafică a semnelor de distribuție ADN pentru femei și bărbați Pelophylax esculentus.

Poate părea ciudat de ce primul (de la min la 25%) și ultimul (de la 75% la max) este deja al doilea și al treilea? Pentru a înțelege acest lucru, construim o histogramă clasificată.

Smochin. 4.9.6. Histogramă, care prezintă valorile de distribuție ale semnului ADN, înregistrat pentru femele și bărbați Pelophylax esculentus.

Devine clar că proprietatea distribuțiilor prezentate în desenul anterior al distribuțiilor este o consecință a bimodalității caracteristicilor în cauză.

4.10. Criteriul semnelor pentru comparații de perechi

În numele nostru de fișier Pelophylax_example.sta Nu există date care necesită compararea valorilor a două eșantioane conectate, așa că le creăm artificial. Imaginați-vă că eșantionul de 25 de broaște a măsurat două persoane. Rezultatele lor de măsurare sunt în prima și a doua coloană. Distribuția dimensională din această probă a fost inițial departe de normal.

Smochin. 4.10.1. Distribuția broaștelor (0,1 mm) în funcție de măsurătorile făcute de două persoane pe același material

Cu toate acestea, pentru mulți dintre broaște, rezultatele măsurătorilor făcute de primul și al doilea cercetător diferă. Sarcina noastră este de a stabili dacă lungimea broaștelor sunt măsurate în mod egal de doi cercetători. Pentru a căuta un răspuns la această întrebare, folosim criteriul semnelor.

Smochin. 4.10.2. Utilizarea criteriilor pentru semne pentru a compara rezultatele măsurătorilor efectuate de doi cercetători diferiți

Criteriul semnelor determină pur și simplu proporția cazurilor în care valoarea dintr-o probă este mai mare decât valoarea dintr-o altă probă.

Smochin. 4.10.3. Diferențele sunt semnificative din punct de vedere statistic!

Putem stabili că al doilea cercetător statistic a supraestimat mai des rezultatele măsurătorilor comparativ cu primul cercetător.

Comparați rezultatul obținut cu rezultatul utilizării metodei parametrice - criteriul T pentru eșantioane asociate.

Smochin. 4.10.4. Metoda parametrică a dat același rezultat, dar cu o fiabilitate ușor mai mare

Valoarea inferioară p, determinată de criteriul parametric, este pe deplin compatibilă cu faptul că metodele parametrice au o putere mai mare decât ne-parametria. Dar am priorit criteriul parametric? De fapt, cu competență. Comparațiile asociate nu consideră o totalitate de valori în prima și a doua probă și diferența pentru fiecare element între primul și al doilea eșantion. Construim distribuția diferenței dintre eșantioanele primului și al doilea.

Smochin. 4.10.5. Distribuirea diferenței dintre măsurătorile a doi cercetători

Se poate observa că abaterea distribuției diferenței dintre cele două dimensiuni din normal este nesemnificativă statistic. Utilizarea testului parametric a fost complet eligibilă.

Și am putea folosi metode pentru comparând eșantioane independente? În cazul comparării eșantioanelor independente, distribuția intereselor de interes pentru noi este foarte diferită de normală, se dovedește a fi importantă. Astfel, trebuie să folosim un criteriu non-T, ci un criteriu de U. Pentru a utiliza criteriul U-Whitney, fișierul de date va trebui să reconstruiască: Toate măsurătorile trebuie să fie în aceeași coloană, iar a doua coloană va deveni grupare.

Smochin. 4.10.6. Potrivit lui Mannu-Whitney, rezultatele măsurătorilor efectuate de doi oameni diferiți nu diferă

Cum de a explica o astfel de diferență? Ca și în multe alte cazuri, primul lucru care trebuie făcut în caz de neînțelegere - Este necesar să se uite la distribuția mărimii de interes pentru noi.

Smochin. 4.10.7. Distribuția rezultatelor de măsurare efectuate de două persoane sunt aproape la fel. Dar, la urma urmei, conform fig. 4.10.3, Pentru 75% broaște, rezultatele măsurătorilor al doilea cercetător sunt mari decât rezultatele măsurării primului cercetător!

Desigur, rezultatul obținut este destul de natural. Folosind criteriul lui Mann-Whitney în loc de criterii pentru semne (sau criteriul lui Wilcoxon), am pierdut informații esențialecare caracterizează modelele de modificări ale valorii în cauză.

Apropo, datele pe care le-am utilizat au fost generate artificial. Prima coloană a fost un fragment din fișierul Pelophylax_example.sta, unde au fost în mare parte cele mai mici și cele mai mari persoane, iar a doua coloană a fost obținută utilizând Formula \u003d TRNC (First-2,4 + RND (8)). Înțelegeți ce și cum "face" această formulă?

4.11. Analiza dispersiei de la KraklaLa-Wallis

Până la trecerea timpului, am folosit doar comparații de pereche de mostre. Acum ne vom uita la metoda care vă permite să comparați unul cu celălalt în același timp mai multe eșantioane. Testul Kraklala Wallis este un analog non-parametric al analizei de dispersie (ANOVA), care este discutat în detaliu în următoarea secțiune a beneficiului nostru. Din punct de vedere computațional, este o generalizare multidimensională a aluatului Mann-Whitney. Deși testul de aspect-Wallis se află în unele privințe și este inferior analizei dispersiei (de exemplu, în faptul că aceasta nu permite simultan să evalueze acțiunile a două sau mai mult Factori), este un instrument puternic care este potrivit pentru rezolvarea multor sarcini.

Afișim acțiunea testului Kraklala Wallis pe exemplul fișierului nostru Pelophylax_example.Sta (a se vedea clauza 3.1). Trebuie să aflăm dacă reprezentanții diferitelor genotipuri se deosebesc de-a lungul lungimii boologului de vindecare interior semnificativ din punct de vedere statistic. Aceasta este o sarcină complet semnificativă, deoarece dimensiunea și forma boologului interior de vindecare este o caracteristică importantă de diagnosticare utilă pentru determinarea diferite forme Broaște verzi.

Smochin. 4.11.1. Acordați atenție pictogramei selectate corespunzătoare comparației mai multor grupuri independente

În mod natural, variabila dependentă este lungimea fasciculului de călcâi (CI), iar gruparea este genotip.

Smochin. 4.11.2. Sunt selectate instalațiile. Dacă trebuie să comparați toate valorile variabilei de grupare, ar trebui să utilizați dialogul care apelează butonul de cod

Făcând clic pe butonul Rezumat, veți primi imediat rezultatele a două teste: analiza dispersiei non-parametrice a vopselei și a testului median, care se bazează pe metoda Pearson. Utilizarea Citiți mai mult este discutată într-unul din următoarele capitole din acest manual, iar aici este suficient să spunem că această metodă este utilizată pentru compararea non-parametrică a distribuțiilor. Dacă distribuția valorii dependente pentru diferite grupuri izolate de valoarea caracteristicilor de grupare este diferită, acest lucru sugerează că gruparea și variabila dependentă este conectată. Metoda de spravel wallis, după cum vă amintiți, se referă la metode non-parametrice. Aceste două metode funcționează diferite principii Și de multe ori dau rezultate foarte diferite.

Smochin. 4.11.3. Ambele metode demonstrează statistic influență semnificativă Gruparea variabilă pe variabila dependentă. Metoda Mask-Wallis dă p \u003d 0,0047, iar testul median - p \u003d 0,0112

Notă: în virtutea unor snobbers incomprehensibilă în unele ferestre Statistică 0 înainte de separatorul zecimal (cu setările utilizate sistem de operare - Sein) nu este pusă.

Făcând clic pe mai multe comparații ale rangurilor medii pentru toate grupurile, puteți obține rezultatele unei comparații pereche a tuturor grupurilor. De fapt, acest lucru este echivalent cu efectuarea unei comparații a lui Mann-White pentru toate perechile posibile de grupuri. Programul afișează două ferestre: valorile valorii Z utilizate în calculele de pe Mannu-White și calculate pentru fiecare pereche nivelul semnificației statistice a diferențelor.

Smochin. 4.11.4. Comparațiile părintești ale grupurilor din dialogul de dialog Kraklala Wallis sunt echivalente cu mai multe comparații utilizând criteriul Mann-Whitney

Rețineți că atunci când efectuați mai multe comparații, pericolul erorii statistice a venit să facă o eroare statistică (să adopte o ipoteză alternativă la un moment dat când zero este adevărat). Pentru a evita acest pericol, ar trebui să utilizați modificarea descrisă mai sus privind mai multe comparații.

În cele din urmă, butonul cutie și whisker permite vizibil pentru a compara distribuțiile diferitelor grupuri.

Smochin. 4.11.5. Compararea distribuțiilor de lungimea fasciculului de călcâi de la reprezentanți ai diferitelor genotipuri

Un alt buton "grafic" al dialogului care este discutat permite construirea histogramelor clasificate pentru grupurile comparate; Din punctul de vedere al autorului, această metodă de rezultate a rezultatelor este mai puțin vizuală.

2

Am ascultat o prelegere cu privire la măsurarea performanței calculatorului, iar profesorul a dat o analogie cu măsurarea performanței aeronavelor. El a arătat un tabel care conținea diverși parametri ai diferitelor aeronave, cum ar fi:

Avioane: Capacitate pasagerilor Viteza Concord 132 1350 mph DC9 146 544 mph

apoi a pus întrebări de la studenți " Cât de repede concordanța în comparație cu DC9? ". Apoi a explicat-o de mai bine de 2 ori. Întrebarea mea: De ce a folosit divizia pentru a compara două valori și nu scade? Știu întrebarea lui foarte fundamentală, dar vă rog, îmi pare rău de incompetența mea.

0

Uneori trebuie să utilizați raportul pentru a descrie fenomenele, de exemplu, probabilitatea de a câștiga jocul. Uneori este opțional, ca în cazul tău. Puteți găsi interesant: https: //en.wikipedia.org/wiki/relative_change_and_diFference - Nici o sansa. 06 Mar. 16 2016-03-06 17:40:56.

  • 2 Răspuns
  • Triere:

    Activitate

0

Am postat aceeași întrebare despre Dr.Maths și am primit următorul răspuns, care, în opinia mea, este mai precis și detaliat.

Întrebați-vă ce ar fi mai semnificativ: Concordul este de 806 mph mai repede decât DC9. Concordul este de 2,5 ori la fel de repede ca DC9. Dacă nu aveți nicio idee cât de repede este DC9, prima declarație ar fi aproape lipsită de sens - nu puteți spune dacă este doar o mică îmbunătățire (! De la, de la 100.000 mph la 100,806 mph) sau o îmbunătățire uriașă (de la 10 Mph la 816 mph). I Exagerând pentru a face un punct: Interpretarea semnificației numărului depinde de faptul că a avut cel puțin unele cunoștințe despre numerele aferente raportul, pe de altă parte, nu necesită nici o astfel de cunoaștere, și poate chiar mai important, raportul va .. să fie același indiferent de unitățile utilizate. Nu trebuie să știm dacă vitezele au fost măsurate în MPH sau KPH sau inci pe secundă. În vigoare, raportul se ridică la utilizarea DC9 în sine ca o unitate de măsurare - Concordul zboară la 2,5 DC9 ", același lucru este probabil adevărat în compararea vitezelor computerului care știe, în aceste zile, ceea ce este o viteză bună, dar ... Oricine Poate spune că de două ori mai repede este mult mai bine. Este ceva ce putem vizualiza mult mai bine decât nanosecunde sau gigabytes!

1

Luați în considerare situația - am mâncat $ 1000 $ mere. Prietenul meu a mâncat mere 1050 de dolari.

Două declarații Prietenul meu a mâncat $ 50 $ mere mai mult decât mine din diferența Prietenul meu a mâncat $ 1,05 $ mere ca mine Din raport.

Luați în considerare o altă situație când mănânc 100 $ mere și prietenul meu $ 105 $

Două declarații vor fi Prietenul meu a mâncat $ 5 $ mere mai mult decât mine și
Prietenul meu a mâncat $ 1,05 ori mai multe mere ca mine

A treia am mâncat cu situații de $ 1 $ Apple, prietenul meu mănâncă $ 51 $

două declarații - Prietenul meu a mâncat $ 50 $ mere mai mult - și
Prietenul meu a mâncat $ 51 astăzi un număr de mere ca mine

Concluzie - Avem nevoie de o diferență și o atitudine în mod clar pentru a cunoaște situația. Cu toate acestea, folosim lucruri diferite în diferite scenarii, care, după cum sper, sunt clare din exemplul de mai sus.



Ți-a plăcut articolul? Împărtășește-l