Používa na porovnanie viacerých množstiev. Diagram je prostriedkom vizuálneho grafického obrazu informácií určených na porovnanie viacerých množstiev alebo niekoľkých hodnôt jedného. Formátovanie buniek. Čísla Formát v programe Microsoft Excel

V predchádzajúcich poznámkach boli opísané postupy kontroly hypotéz numerických a kategórie údajov:, niekoľko, a tiež naučiť jednu alebo. V tomto článku zvážime metódy testovania hypotéz o rozdieloch medzi akciami vlastnosti vo všeobecných agregátoch založených na niekoľkých nezávislých vzorkách.

Na ilustráciu použitých metód sa používa skript, v ktorom sa odhaduje stupeň spokojnosti hostí, ktorí vlastníctva T. S. Resort nehnuteľnosti. Predstavte si, že ste firemný manažér, ktorý vlastní päť hotelov umiestnených na dvoch letoviskách. Ak sú hostia spokojní so službou, pravdepodobnosť, že sa vrátia budúci rok a odporučia ich priateľom, aby zostali vo vašom hoteli. Na vyhodnotenie kvality služieb sú hostia požiadaní, aby vyplnili dotazník a uviedli, či sú spokojní s pohostinnosťou. Musíte analyzovať údaje prieskumu, určiť spoločný stupeň spokojnosti požiadaviek hosťa, zhodnotiť pravdepodobnosť, že hostia prídu budúci rok, ako aj vytvoriť príčiny možnej nespokojnosti niektorých zákazníkov. Napríklad na jednom z ostrovov spoločnosti sa vlastnia plážové a windsurfer hotely. Je služba v týchto hotelov rovnako? Ak nie, ako sa tieto informácie môžu použiť na zlepšenie kvality spoločnosti? Okrem toho, ak niektorí hostia uviedli, že by vám neprišli viac, aké dôvody naznačujú častejšie ako iné? Je možné, že tieto dôvody sa týkajú len konkrétneho hotela a nevzťahujú sa na celú spoločnosť ako celok?

Používa sa tu nasledujúci notácia: X. 1 - počet úspechov v prvej skupine, \\ t X. 2 - počet úspechov v druhej skupine, \\ t n. 1 – X. 1 - počet porúch v prvej skupine, \\ t n. 2 – X. 2 - počet zlyhaní v druhej skupine, \\ t X \u003d.X. 1 + X. 2 - celkový počet úspechov, \\ t n. – X. = (n. 1 – X. 1 ) + (n. 2 – X. 2 ) - celkový počet porúch, \\ t n. 1 - objem prvej vzorky, \\ t n. 2 - objem druhej vzorky, \\ t n. = n. 1 + n. 2 - Súhrnné vzorky. Predložená tabuľka má dva riadky a dva stĺpce, takže sa nazýva 2 × 2 faktor tabuľka. Bunky tvorené priesečníkom každého riadku a stĺpca obsahujú počet úspechov alebo zlyhaní.

Upozorňujeme aplikáciu tabuľky konfrontácie na príklad skriptu opísaného vyššie. Predpokladajme, že otázka "sa vrátiš v budúcom roku?" 163 z 227 hostí hotela BeachComber a 154 hotela Hotel Windsurfer odpovedal kladne. Existuje štatisticky významný rozdiel medzi stupeň spokojnosti hotelových hostí (čo je pravdepodobnosť, že hostia sa vracajú v budúcom roku), ak je úroveň významu 0,05?

Obr. 2. Svetová tabuľka 2x2 na posúdenie kvality služieb hostí

Prvý riadok označuje počet hostí každého hotela, ktorý vyhlásil svoju túžbu vrátiť sa budúci rok (úspech); V druhom riadku - počet hostí vyjadrených nespokojnosť (zlyhanie). Bunky umiestnené v stĺpci "Celkom" obsahujú celkový počet hostí, ktorí plánujú vrátiť sa do hotela v budúcom roku, ako aj celkový počet hostí nespokojných so službou. Bunky umiestnené v polohe "Celkom" obsahujú celkový počet skúmaných hostí každý hotel. Podiel hostí, ktorí plánujú vrátiť sa, sa vypočíta vydelením počtu hostí, ktorí to vyhlásili na celkovom počte skúmaných hostí. Potom sa používa χ 2 -cteriária na porovnanie vypočítaných frakcií.

Kontrola nulových a alternatívnych hypotéz H 0: P1 \u003d P2; H1: P 1 ≠ P2 Použite test χ 2-štatistiky.

Kritérium "Chi-Square" na porovnanie dvoch kusov.Test χ 2 -station sa rovná súčtu štvorcov rozdielov medzi pozorovaným a očakávaným počtom úspechu vydelený očakávaným počtom úspechu v každej bunke tabuľky:

kde f 0. - pozorovaný počet úspechov alebo zlyhaní v špecifickej bunke tabuľky konfrontácie, \\ t f E.

Test χ 2 -station je aproximovaný χ 2-distribúcia s jedným stupňom slobody.

Alebo zlyhania v každej bunke konjucovacej tabuľky tabuliek, je potrebné pochopiť ich význam. Ak je nulová hypotéza pravdivá, t.j. Podiel úspechu v dvoch všeobecných spolupracovníkov je rovnaký, selektívne akcie vypočítané pre každú z týchto dvoch skupín sa môžu náhodnými dôvodmi líšiť a obe akcie sú hodnotením bežný parameter Všeobecný agregát ročník. V tejto situácii štatistika spájajú obe akcie jedným spoločným (stredným) odhadom parametra ročník Predstavuje spoločný podiel úspechu v kombinovaných skupinách (to znamená, že sa rovná celkovému počtu úspechu vydelených celkovou veľkosťou vzoriek). Jej pridávanie 1 – je spoločným podielom nedostatkov v kombinovaných skupinách. Použitie notácie, ktorého význam je opísaný v tabuľke na obr. 1. Formula (2) môžete vydať na výpočet parametra :

kde - Priemerný podiel označenia.

Vypočítať očakávaný počet úspechov f. E. (t.j. obsah prvého riadku konjuccovej tabuľky), musíte znásobiť veľkosť vzorky na parametri . Vypočítať očakávaný počet porúch f E. (t.j., obsah druhého riadku tabuľky konfrontácie), musíte znásobiť veľkosť vzorky na parametri 1 – .

Skúšobné štatistiky vypočítané vzorcom (1) je aproximované χ 2-distribúciou s jedným stupňom slobody. Na danej úrovni významnosti sa α nula hypotéza odchyľuje, ak vypočítaná χ 2 -station je väčšia ako χ u 2, horná kritická hodnota χ 2-distribúcie s jedným stupňom slobody. Touto cestou, rozhodujúce pravidlo Vyzerá takto: hypotéza H. 0 vychyľuje, ak χ 2\u003e χ u 2, inak hypotéza H 0 Sa neodlišuje (obr. 3).

Obr. 3. Kritická oblasť χ 2 -Kritia na porovnanie akcií na úrovni významu α

Ak je nulová hypotéza pravdivá, vypočítaná χ 2 -tatizmus je blízko nulovej, pretože štvorec rozdielu medzi pozorovaným f. 0 a očakáva sa f. E. Hodnoty v každej bunke sú veľmi malé. Na druhej strane, ak nulová hypotéza H 0 Je nepravdivé a medzi pomermi úspechu vo všeobecných agregátoch existuje významný rozdiel, vypočítaný χ 2 -tatizmus by mal byť veľký. To je vysvetlené rozdielom medzi pozorovaným a očakávaným počtom úspechu alebo zlyhania v každej bunke, ktorý sa zvyšuje pri postavení na námestí. Príspevky rozdielov medzi očakávanými a pozorovanými hodnotami do celkového počtu χ 2-štatistiky však môžu byť nerovnaké. Rovnaký skutočný rozdiel medzi f 0. a f E. Môže mať väčší vplyv na χ 2-štatistiky, ak bunka obsahuje výsledky malého množstva pozorovaní ako rozdiel zodpovedajúci väčšiemu počtu pozorovaní.

Aby bolo možné ilustrovať χ 2 -Criterid na kontrolu hypotézy rovnosti oboch frakcií, späť do scenára opísaného v predchádzajúcom, ktorých výsledky sú znázornené na obr. 2. Nulová hypotéza (H 0: P1 \u003d P 2) Tvrdí, že pri porovnávaní kvality služieb v dvoch hoteloch je podiel hostí, ktorí plánujú vrátiť sa v budúcom roku takmer rovnaký. Vyhodnotiť parameter ročníkzastupovanie podielu hostí, ktorí plánujú vrátiť sa do hotela, ak je nula hypotéza pravdivá, hodnota sa používa ktorý je vypočítaný vzorcom

Podiel hostí, ktorí zostali nespravodlivá služba \u003d 1 - 0,6483 \u003d 0,3517. Vynásobenie týchto dvoch stávok na počet hostí, ktorí sa skúmali Hotel BeachComber, dostaneme očakávaný počet hostí, ktorí plánujú vrátiť ďalšiu sezónu, ako aj počet turistov, ktorí sa v tomto hoteli nebudú zastaviť. Podobne sa vypočíta očakávaný podiel hostí hostia Windsurfer:

Áno - BeachComber: = 0,6483, n. 1 \u003d 227, preto, f E. = 147,16.
ÁNO - WINDSURFER: = 0,6483, n. 2 \u003d 262, preto, f E. = 169,84.
NO - BeachComber: 1 - = 0,3517, n. 1 \u003d 227, preto, f E. = 79,84.
NO - WINDSURFER: 1 - = 0,3517, n. 2 \u003d 262, preto, f E. = 92,16.

Výpočty sú uvedené na obr. štyri.

Obr. 4. χ 2 -tatizmus pre hotely: (a) Zdrojové údaje; b) Svetná tabuľka 2x2 na porovnanie pozorovaného ( f. 0 ) a očakáva sa ( f. E.) počet hostí spokojných a nie je spokojný so službou; c) výpočet χ 2-štatistiky pri porovnávaní podielu hostí spokojných so službou; (D) Výpočet kritickej hodnoty testu χ 2 -sTartria

Vypočítať kritickú hodnotu testu χ 2 funkcia programu Excel \u003d Hay2.ob (). Ak je hladina významnosti a \u003d 0,05 (pravdepodobnosť substituovaná do funkcie HA2 je 1 -α) a χ 2-distribúcia pre faktorovú tabuľku 2 × 2 má jeden stupeň voľnosti, kritická hodnota χ 2 -statistiky je 3,841 . Pretože vypočítaná hodnota χ 2 -startria, rovná 9,053 (obr. 4b), presahuje číslo 3,841, nulová hypotéza sa líši (obr. 5).

Obr. 5. Stanovenie kritickej hodnoty testu χ 2 -statistika s jedným stupňom slobody na úrovni významnosti α \u003d 0,05

Pravdepodobnosť ročník Skutočnosť, že nulová hypotéza je platná pre χ 2 -statestural rovná 9,053 (a jeden stupeň slobody) sa vypočíta v Excel s použitím funkcie \u003d 1 - HEA2.SP (9.053; 1; pravda) \u003d 0,0026. ročník-Notion, rovný 0,0026, je pravdepodobnosť, že rozdiel medzi selektívnymi akciami hostí spokojných so službou v hoteloch Beachcomber a Windsurfer Hotely sa rovná alebo viac ako 0,718 - 0,588 \u003d 0,13, ak skutočne zdieľajú svoje akcie v oboch všeobecných zbierkach rovnaké. Existujú teda dobré dôvody tvrdiť, že existuje štatisticky významný rozdiel v prevádzke medzi dvoma hotelom. Štúdie ukazujú, že počet hostí spokojných so službou na hoteli BeachComber, viac ako počet hostí, ktorí plánujú zostať v hoteli Windsurfer.

Overovanie predpokladov týkajúcich sa tabuľky faktora 2 × 2.Ak chcete získať presné výsledky na základe údajov uvedených v tabuľke 2 × 2, je potrebné, aby počet úspechov alebo zlyhaní prekročil číslo 5. Ak sa táto podmienka nevykonáva, malo by sa uplatňovať presnosť kritérium Fisher.

Pri porovnávaní percentuálneho podielu klientov, spokojní s kvalitou služby v dvoch hoteloch, kritériá Z a χ 2 vedú k rovnakým výsledkom. To možno vysvetliť existenciou úzkeho spojenia medzi štandardizovanými normálna distribúcia a χ 2-distribúcia s jedným stupňom slobody. V tomto prípade je χ 2 vždy štvorcovým z-štatistiky. Napríklad pri hodnotení stupňa spokojnosti hostí sme zistili, že Z.-station je +3.01, a χ 2 static - 9.05. Zanedbávanie chýb zaokrúhľovania, je ľahké sa uistiť, že druhá hodnota je prvým štvorcom (tj 3,01 2 \u003d 9,05). Okrem toho, porovnanie kritických hodnôt oboch štatistík na úrovni významnosti α \u003d 0,05, možno zistiť, že hodnota χ 1 2 je 3,841, je námet hornej kritickej hodnoty Z-štatistiky, rovný +1.96 (tj χ 1 2 \u003d Z 2). Okrem toho, ročník-Notácie oboch kritérií sú rovnaké.

Takto je možné argumentovať, že pri kontrole nulových a alternatívnych hypotéz H 0: P1 \u003d P2; H1: P 1 ≠ P2 Kritériá Z a χ 2 sú ekvivalentné. Avšak, ak je to potrebné, nie je ľahké detekovať rozdiely, ale tiež určiť, aký pomer je viac (p 1\u003e p 2), sledovať Použite kritérium Z s jednou kritickou oblasťou ohraničujúcou chvostom štandardizovanej normálnej distribúcie. Ďalej bude aplikácia kritéria χ 2 opísaná na porovnanie zdieľania označenia v niekoľkých skupinách. Treba poznamenať, že kritérium Z nemožno uplatňovať v tejto situácii.

Použitie χ 2 -kritia na testovanie hypotézy o rovnosti niekoľkých frakcií

Kritérium CHI-Square možno rozšíriť na všeobecnejší prípad a aplikovať na testovanie hypotézy o rovnosti niekoľkých akcií. Označuje počet analyzovaných nezávislých celkových agregovaných listov z. Teraz sa tabuľka konfrontácie skladá z dvoch riadkov a z stĺpce. Kontrola nulových a alternatívnych hypotéz H 0: P1 \u003d P 2 = … = p 2., H1:nie všetko Ročník J. vzájomne sa rovná (j. = 1, 2, …, c.), Použitý test χ 2 -tatizmus:

kde f 0. - pozorovaný počet úspechov alebo zlyhaní v špecifickej bunke tabuľky faktora 2 * z, f. E. - teoretické alebo očakávané, počet úspechov alebo zlyhaní v špecifickej bunke konjucovacej tabuľky za predpokladu, že nulová hypotéza je pravdivá.

Ak chcete vypočítať očakávaný počet úspechov alebo zlyhaní v každej bunke tabuľky konfrontácie, je potrebné mať na pamäti nasledovné. Ak je nulová hypotéza pravdivá a podiel úspechu vo všetkých s všeobecnými agregátmi rovnakými, zodpovedajúce selektívne akcie sa môžu od seba líšiť len náhodnými dôvodmi, pretože všetky akcie sú odhady podielu označenia ročník Vo všeobecnej všeobecnej populácii. V tejto situácii štatistiky, ktorá kombinuje všetky akcie v jednom spoločnom (alebo miernom) odhadom parametra ročník, obsahuje viac informácií ako každý z nich individuálne. Táto štatistika označená symbolom Predstavuje spoločný (alebo priemerný) podiel úspechu v zjednotenej vzorke.

Výpočet stredného laloku:

Vypočítať očakávaný počet úspechov f E. V prvom riadku tabuľky konfrontácie musíte znásobiť objem každej vzorky na parameter. Vypočítať očakávaný počet porúch f E. V druhom riadku konfiguračného tabuľky príznakov musíte znásobiť objem každej vzorky na parameter 1 – . Skúšobné štatistiky vypočítané vzorcom (1) je aproximované χ 2-distribúciou. Počet stupňov slobody tejto distribúcie je nastavený rozsahom (R - 1) (c. – 1) kde r.- počet riadkov v tabuľke faktora, \\ t z - počet stĺpcov v tabuľke. Pre tabuľku faktora 2 * S. počet stupňov slobody je rovnocenný (2 - 1) (C - 1) \u003d C - 1. Na danej úrovni významnosti α, nulová hypotéza sa líši, ak vypočítaná χ 2 -station je väčšia ako horná kritická hodnota χ u 2 inherentná v χ 2-distribúcii s c - 1. stupne slobody. Rozhodujúce pravidlo je teda nasledovné: hypotéza H 0 Vtedy, ak χ 2\u003e χ u 2 (obr. 6), inak sa hypotéza odchyľuje.

Obr. 6. Kritická oblasť χ 2 -Kritácia na porovnanie s frakciou na úrovni významu α

Overovanie predpokladov týkajúcich sa tabuľky faktora 2 * p. Pre presné výsledky na základe údajov uvedených v tabuľke faktora 2 * zJe potrebné, aby sa počet úspechov alebo zlyhaní bol dosť veľký. Niektoré štatistiky sa domnievajú, že kritérium dáva presné výsledky, ak očakávané frekvencie presahujú 0,5. Ďalšie konzervatívni výskumníci nevyžadujú viac ako 20% známok príznakov konjuccovej tabuľky príznakov obsahovalo očakávané hodnoty, ktoré sú menšie ako 5, a žiadna bunka by nemala obsahovať očakávanú hodnotu nižšiu ako jednu. Najnovší stav Zdá sa nám, že medzi týmito extrémmi. Ak chcete uspokojiť túto podmienku, kategórie obsahujúce malé očakávané hodnoty by sa mali kombinovať do jedného. Potom sa kritérium stáva presnejšími. Ak z akéhokoľvek dôvodu zjednotia viac kategórií, ktoré nie sú nemožné, mali by sa uplatňovať alternatívne postupy.

Aby bolo možné ilustrovať χ 2 -kritia na kontrolu hypotézy o rovnosti podielu v niekoľkých skupinách, späť do skriptu opísaného na začiatku kapitoly. Zvážte podobný prieskum, v ktorom sa nachádzajú hostia troch hotelov patriace do spoločnosti T. S. Resort Resources (obr. 7A).

Obr. 7. Factory Tabuľka 2 × 3 Pre porovnanie, počet hostí spokojných a nie je spokojný so službou: (a) pozorovaný počet úspechov alebo zlyhaní - f 0.; \\ T b) očakávaný počet úspechov alebo zlyhaní - f. E.; \\ T c) výpočet χ 2-štatistiky pri porovnaní podielu hostí spokojných so službou

Nulová hypotéza tvrdí, že podiel zákazníkov, ktorí plánujú v budúcom roku, vo všetkých hoteloch takmer rovnaké. Vyhodnotiť parameter ročníkzastupovanie podielu hostí, ktorí sa majú vrátiť do hotela, používa hodnotu Ročník = X /n. \u003d 513/700 \u003d 0,733. Podiel hostí zostávajúcich nesprávnych služieb je 1 - 0,733 \u003d 0,267. Vynásobenie troch akcií o počte skúmaných hostí v každom z hotelov, dostaneme očakávaný počet hostí, ktorí plánujú vrátiť sa v budúcej sezóne, ako aj počet zákazníkov, ktorí sa už nenastanú v tomto hoteli (obr. 7b).

Kontrola nulových a alternatívnych hypotéz Použite test χ 2-štatistiky vypočítané pomocou očakávaných a pozorovaných hodnôt podľa vzorca (1) (obr. 7b).

Kritická hodnota testu χ 2 je určená vzorcom \u003d hi2.OB (). Keďže hostia sa zúčastňujú na prieskume, sú zahrnuté hostia troch hotelov, χ 2 -station má (2 - 1) (3 - 1) \u003d 2 stupne slobody. Na úrovni významnosti α \u003d 0,05 je kritická hodnota χ 2 -statistiky 5,991 (obr. 7G). Vzhľadom k tomu, vypočítané χ 2 -Storát, rovné 40,236, presahuje kritickú hodnotu, nulová hypotéza sa líši (obr. 8). Na druhej strane, pravdepodobnosť ročník Skutočnosť, že nulová hypotéza je platná pre χ2 -zaturálne približne 40,236 (a dva stupne slobody) sa vypočíta v Excel s použitím funkcie \u003d 1-HI2.mp () \u003d 0,000 (obr. 7G). ročník-Notion je 0 000 a menej významná úroveň α \u003d 0,05. V dôsledku toho sa znižuje nulová hypotéza.

Obr. 8. Oblasti prijímania a odchýlky hypotézy o rovnosti troch frakcií na úrovni významnosti, rovnajúcu sa 0,05 a dva stupne slobody

Dejekcia nulovej hypotézy pri porovnávaní akcií uvedených v tabuľke faktora 2 * zMôžeme len tvrdiť, že podiel hostí spokojných so službou v troch hoteloch sa nezhoduje. S cieľom zistiť, ktoré akcie sa líšia od iných, musia sa použiť aj iné metódy, napríklad postup Maraskail.

Postup Maracouquilo Umožňuje porovnať všetky skupiny v pároch. V prvej fáze konania sa vypočíta rozdiel p s j - p s j '(kde j. ≠ j.’ ) medzi c (C - 1) / 2 výpary. Zodpovedajúci kritický rozsah sa vypočíta podľa vzorca:

So všeobecnou úrovňou významnosti α, hodnota je odmocnina od hornej kritickej hodnoty distribučnej hodnoty "Chi-Square" c - 1. stupne slobody. Pre každý pár selektívnych frakcií je potrebné vypočítať samostatný kritický rozsah. V poslednej fáze každá z nich c (C - 1) / 2 Pár frakcií v porovnaní so zodpovedajúcim kritickým rozsahom. Akcie, ktoré tvoria špecifický pár, sa považujú za štatisticky významne odlišné, ak absolútny rozdiel vzorových frakcií | p j - p s j | prekračuje kritický rozsah.

Ukazujem postup Marasko o príklade prieskumu troch hotelov (obrázok 9A). Uplatňovanie kritéria "Hee-Square", boli sme presvedčení, že existuje štatisticky významný rozdiel medzi akciami hostí hostí hostí rôznych hotelov v nasledujúcom roku. Vzhľadom k tomu, hostia troch hotelov sú zapojené do prieskumu, je potrebné vykonať 3 (3 - 1) / 2 \u003d 3 párové porovnania a vypočítať tri kritický rozsah. Ak chcete začať, počítame tri selektívne laloky (obr. 9B). S všeobecnou úrovňou významnosti, rovný 0,05, hornú kritickú hodnotu testu χ 2-štatistiky pre distribúciu "CHI-Square", ktoré majú (C - 1) \u003d 2 stupne slobody, je určená vzorcom \u003d Hay2.OB (0,95; 2) \u003d 5,991. Tak \u003d 2,448 (obr. 9b). Ďalej vypočítavame tri páry absolútnych rozdielov a zodpovedajúcich kritických švih. Ak je absolútny rozdiel viac z jeho kritického rozsahu, potom sa zodpovedajúce akcie považujú za významne odlišné (obr. 9g).

Obr. 9. Výsledky implementácie postupu Marasko na otestovanie hypotézy o rovnosti podielu spokojných hostí troch hotelov: (a) volebné údaje; b) selektívne akcie; c) hornú kritickú hodnotu testu χ 2 -statistika na distribúciu "Chi-Square"; d) tri páry absolútnych rozdielov a zodpovedajúcich kritických švih

Ako vidíme, na úrovni významu, rovný 0,05, stupeň spokojnosti hostí hotelového palmového kráľovského (P s2 \u003d 0,858) je vyšší ako hostia hotely Golden Palm (P S1 \u003d 0,593) a Palm Princezná (p s3 \u003d 0,738). Okrem toho je spokojnosť hostí hotela Palm Princess vyššia ako hostia z Golden Palm Hotel. Tieto výsledky musia prinútiť vedenie, aby analyzovali príčiny takýchto rozdielov a snažili sa určiť, prečo je stupeň spokojnosti hostí Golden Palm Hotel výrazne nižší ako hostia iných hotelov.

Materiály knihy Levin et al. Štatistiky pre manažérov. - M.: Williams, 2004. - S. 708-730

Kniha diskutuje o hlavných technikách práce na počítači Macintosh. Zobrazujú sa funkcie práce v operačnej miestnosti systém Mac OS X: užívateľské rozhranie, Inštalácia / odstránenie programov, vypálenie CD / DVD, tlač dokumentov, pripojenie k internetu atď. Opisuje hlavné aplikácie zahrnuté v OS: poštový klient Poštou; Webový prehliadač Safari; Kalendárny denník; Aplikácia Controlling Widgets, Dashboard; Foto Booth Program pracovať so zabudovaným digitálny fotoaparát; \\ T Hudobný editor garáže; Aplikácia časového stroja rezervná kópia et al. Práca s integrovanými mediálnymi aplikáciami: textový editor Stránky, tabuľky čísel, program na vytvorenie kľúčových prezentácií. Zobrazia sa funkcie klávesnice Macintosh a vykonávajú sa analógie s počítačovou klávesnicou IBM PC. CD obsahuje úlohy nezávislá práca S aplikáciami Mac OS X a Iwork, materiály na vykonávanie úloh, príklady prezentácie.

Pre začínajúcich používateľov.

Kniha:

Oddiely na tejto stránke:

Diagram - grafické znázornenie Údajov z vybratého rozsahu.

Ak chcete vytvoriť diagramy, sledujte nasledujúci algoritmus

1. Vytvorte tabuľku hodnôt osídlenia.

2. Zvýraznite požadovaný rozsah (Môže sa skladať z neseľahlých obdĺžnikových rozsahov).

3. Vyberte požadovaný typ diagramu zo zoznamu organizovaného pomocou tlačidla Grafov.(Grafy):

Alebo zo zoznamu ponuky Vložte.(Vložiť)? Chartón(Diagram).

4. Vytvorte nastavenia pre vytvorený diagram v okne Inšpektor na karte Chartón(Diagram).

Podrobne zvážte nastavenia parametrov tabuľky v tejto časti, pretože táto otázka predtým chápala v žiadosti Stránka (pozri časť 5.1.1.14), \\ t A prax práce s grafmi sa bude demontovať časť. 6.2.8.

Typy diagramov a príklady ich používania

žiadosť Čísla.ponúka rovnaký zoznam grafov ako Stránky.Práca s diagramami v Stránkabol zvážený časť. 5.1.14, V ktorom pozornosť bola venovaná len rôznym nastaveniam diagramov, ale nebola daná porovnávacie charakteristiky Rôzne druhy. V tejto časti budeme analyzovať niekoľko príkladov použitia určitých typov diagramov, ktoré jasne preukazujú ich rozsah.

Kruhový diagram

Kruhový diagram (Koláč)a jeho volumetrická verzia (3d koláč)používa na porovnanie viacerých hodnôt v jednom bode alebo niekoľko častí jedného celku. Ako nasleduje názov, diagram je kruh, ktorý je rozdelený na sektory. Kruh zodpovedá celkovej sume všetkých údajov a je 100%, každý sektor zodpovedá jednej danej, ktorý je súčasťou ( percento) Z celkového počtu.

Príklad 1.Jedného dňa, strýko Fedor išiel do lesa na huby a zhromaždil: 24 chanterelles, 9 mokhovikov, 15 vĺn, 5 bielych. Zostavte kruhovú hubársku zbierku schému ukazuje, ktoré percento celkových množstiev tvoria biele huby.

Malo by byť predbežné pripraviť tabuľku hodnôt, pre ktoré bude diagram postavený. Stôl musí byť pridaný do názvov húb a číselných údajov, potom zvýraznite rozsah A1: D2 (Obr. 5.86) a vyberte typ tabuľky Koláč (Kruhový). Bunky prvého riadku zvoleného rozsahu sú názvy sektorov kruhu, bunky druhého reťazca obsahujú číselné údaje o diagrame. Celý kruh je celkový počet zozbieraných húb - 45, každý sektor odráža percentuálny podiel každého mena huby z celkových množstiev, obr. 5.86).

Použitie kruhového grafu nie je vždy vhodné a jasne, napríklad zvýšenie počtu zozbieraných húb povedie k zvýšeniu sektorov, ktoré budú pravdepodobne ovplyvniť informativity grafu. V tomto prípade by sa mali použiť iné typy.

Stĺpové tabuľky

Čísla. Ponúka niekoľko variantov grafu stĺpca: Stĺpca. (Stĺpec) - vertikálne stĺpce, \\ t Baránka (Histogram) - horizontálne stĺpce, \\ t 3D stĺpik. (Trojrozmerný stĺpec), 3D bar. (Trojrozmerný histogram).

Stĺpec Diagram a rôzne možnosti sa používajú na porovnanie niekoľkých množstiev v niekoľkých bodoch, ale môžu sa použiť aj na porovnanie niekoľkých hodnôt v jednom bode, ako v predchádzajúcom príklade (pozri obr. 5.86).

Ako nasleduje názov, stĺpec graf sa skladá zo stĺpcov, ktorých výška zodpovedá hodnotam porovnávaných hodnôt, v príklade 1, výška stĺpcov je určená množstvom zozbieraných húb. Každý stĺpec je viazaný na určitý referenčný bod. V príklade 1 referenčný bod zodpovedá názvu huby, koľko položiek (4), toľko stĺpcov (pozri obr. 5.86).

Zvážte úlohu, pre ktorú kruhový diagram nie je vhodný na riešenie. V príklade 2 je potrebné niekoľkokrát porovnať niekoľkokrát.

Príklad 2. Predpokladajme, že jeho priatelia sa pripojili Strýk Fedor na zbierku húb: matroskinova mačka a psa, údaje sú uvedené v stole (Obr. 5.87). Zostavte diagram, v ktorom sa prejavia výsledky všetkých zberateľov.

Výška stĺpca odráža, ako v príklade 1, počet zozbieraných húb zostáva stále 4 referenčnými bodmi, ale na rozdiel od príkladu 1, v každom referenčnom bode nie je jeden stĺpec, ale tri (jeden kolóna pre každý kolektor). Všetky stĺpce jedného kolektora budú natreté v jednej farbe. Na vytvorenie diagramu sa má izolovať rozsah A1: E4 (pozri obr. 5.87), na obr. 5.87 Typ diagramu Stĺpca. (Stĺpec).

Lineárny diagram

Lineárny diagram ( Riadok) Je určený na sledovanie zmien v niekoľkých množstvách pri prechode z jedného miesta na druhé.

Príklad 3.Zostavte lineárny diagram na základe tabuľky z príkladu 2, čo odráža zmenu počtu húb zozbieraných v závislosti od ich typu.

Referenčné body sú stále štyri v počte druhov húb. Počet zozbieraných húb je označený na grafe značiek pripojených k sebe navzájom segmenty. Výsledkom je, že graf predstavuje rozbitú líniu pozostávajúcu z niekoľkých segmentov, odtiaľto tento druh Grafy sú tzvarené - lineárne. Diagram znázornená na obr. 5.88, obsahuje tri riadky, z ktorých každý zodpovedá jednému kolektoru. Linky od seba sa líšia: farba, hrubá, typ zdvihu, markery.

Diagram štvorca

Diagram námestie Predstavuje hybridnú lineárnu a stĺpcov, jasne odráža porovnanie niekoľkých hodnôt v jednom bode.

Príklad 4.Zostavte graf námestia na základe tabuľky z príkladu 1, čo odráža zbierku strýkov Fedor.

Ak na vrchoch stĺpcov znázornených na obr. 5.86, Označte body, pripojte ich pomocou segmentov a výslednú oblasť, aby ste mali farbiť v akejkoľvek farbe, potom plocha oblasti, prezentovaná na obr. 5.88. Ak chcete zobraziť niekoľko zberateľov, tento typ diagramu nie je informatívny.

Čísla. ponúka dve možnosti oblasti grafu: Oblasť (Square) a jeho objemová verzia 3d Oblasti (trojrozmerná oblasť).

Viacvrstvové diagramy

Multi-trieda Diagram vám umožňuje vizuálne porovnať súmy viacerých hodnôt v niekoľkých bodoch a zároveň ukazujú príspevok každej hodnoty v celkovej sume.

Príklad 5.Zostavte viacstupňové grafy na základe tabuľky z príkladu 2.

Čísla.ponúka šesť variantov viacvrstvového grafu: Stohovaný stĺpec.(Viacstupňové stĺpce) a jeho objemová verzia 3D stohovaný stĺpec(Trojrozmerné viacstupňové stĺpce), Naskladaný bar.(Viacvrstvový histogram) a 3D naskladaný bar.(Trojrozmerný histogram s viacerými nimi), Naskladaná oblasť(Multi-Tier Area) a 3D Skladaná oblasť(Trojrozmerná multi-trietna oblasť).

Kruhový diagram však vždy nezabezpečuje potrebnú viditeľnosť prezentácie informácií. Po prvé, v jednom kruhu môže byť príliš veľa sektorov. Po druhé, všetky sektory môžu byť približne rovnakej veľkosti. Tieto dva dôvody tvoria kruhovú schému bridlice.

2.Star Chart (Histogram) - Slúži na porovnanie niekoľkých množstiev v niekoľkých bodoch.

Hviezdne diagramy (nasledujúce z mena) pozostávajú zo stĺpcov. Stanoví sa výška stĺpcahodnoty porovnaných hodnôt . Každý stĺpec je zviazanýpodpora .

3.Lineárny diagram (graf) -Slúži na sledovanie zmien viacerých hodnôt počas prechodu z jedného miesta na druhé.

Výstavba lineárnej schémy je podobná budovaniu stĺpca. Namiesto stĺpcov je však ich výška jednoducho označená (body, pomlčky, kríže) a získané značky sú spojené priamymi čiarami. Namiesto rôznych vyliatkov (stĺpcov) sa používajú rôzne značky (kosoštvorcové, trojuholníky, kríženia atď.), Rôzne hrúbky a typ čiary (pevné, bodkované, atď.), Rôzne farby.

4. YARUS DIAGRAM (histogram akumulácie) - Umožňuje vizuálne porovnať súmy viacerých hodnôt v niekoľkých bodoch a zároveň ukazujú príspevok každej hodnoty v celkovej sume.

Poradie konštrukcie shromaždenia Longline je veľmi podobné poradiu výstavby grafu stĺpca. Rozdiel je, že stĺpce v diagrame Longline nie sú navzájom umiestnené, ale jeden na druhom. V súlade s tým sa menia pravidlá pre výpočet vertikálnej a horizontálnej veľkosti diagramu.

5. Regionálny diagram (oblasť oblasti) - Jadrový diagram hybrid s lineárnym vám umožňuje súčasne sledovať zmenu v každej z mála hodnôt a zmenu v ich sumách na niekoľkých bodoch.

Samostatné stĺpce zlúčili a vytvárajú kontinuálne oblasti. Preto názov - diagram oblastí alebo diagramu oblasti. Každá oblasť zodpovedá nejakej jednej hodnote, na označenie, ktoré sa používajú rôzne vyliahnuté (sfarbenie). Predtým boli úrovne umiestnené stĺpy, teraz - riadky (a načrtnuté oblasti).

Formátovanie buniek. Formát čísla B. Microsoft Excel..

Formátovanie v programe Excel sa používa na uľahčenie vnímania údajov, ktoré zohrávajú dôležitú úlohu pri produktivite práce.

Ak chcete priradiť formát, musíte urobiť nasledovné:

2. Vyberte príkaz "Formát" - "Cell" (CTRL + 1).

3. V dialógovom okne, ktoré sa zobrazí, zadajte požadované parametre formátovania.

4. Stlačte tlačidlo "OK".

Formátovaná bunka uloží svoj formát, kým sa na ňu nepoužije nový formát, alebo nebude odstránený starý. Pri zadávaní hodnoty do bunky sa na ňu použije formát.

Ak chcete odstrániť formát, musíte vykonať nasledovné:

1. Vyberte bunku (rozsah buniek).

2. Vyberte príkaz "Upraviť" - "Vymazať" - "formáty".

3. Ak chcete odstrániť hodnoty v bunkách, vyberte príkaz "ALL" "CLEAR".

Treba mať na pamäti, že pri kopírovaní bunky spolu s jeho obsahom sa kopíruje formát buniek. Pred použitím príkazov kopírovania a vložte teda môžete ušetriť čas formátovaním zdrojovej bunky

Formátovanie môže byť tiež vyrobené pomocou panelov nástrojov. Najčastejšie používané príkazy formátovania sa prenášajú do panela s nástrojmi "Formátovanie". Ak chcete použiť formát pomocou tlačidla panela s nástrojmi, vyberte bunku alebo rozsah buniek a potom stlačte tlačidlo myši. Ak chcete odstrániť formát, kliknite na tlačidlo Opakované tlačidlo.

Ak chcete rýchlo kopírovať formáty z vybraných buniek do iných buniek, môžete použiť "formátovanie" panel "formát"

Formátovanie sa môže aplikovať na samostatné textové symboly v bunke rovnakým spôsobom ako celá bunka. Ak to chcete urobiť, vyberte požadované znaky a potom vyberte príkaz "Cell" v ponuke "Formát". Potom nastavte požadované atribúty a kliknite na tlačidlo "OK". Stlačte tlačidlo ENTER, aby ste videli výsledky vašej práce.

Nastavenie formátu čísel v programe Excel

Ako program Excel Navrhnutá pre spracovanie čísel, správna konfigurácia ich formátu hrá dôležitú úlohu. Pre osobu je číslo 10 len jednotka a nula. Z hľadiska programu Excel môžu tieto dve číslice niesť úplne odlišné informácie v závislosti od toho, či uvádzajú počet zamestnancov spoločnosti, peňažnú hodnotu, percento celého alebo fragmentu "10 popredných firiem" hlavičky. Vo všetkých štyroch situáciách by sa toto číslo malo zobraziť a spracovať rôznymi spôsobmi. Excel podporuje nasledujúce formáty údajov:

* Spoločný - text I. numerické hodnoty ľubovoľný typ; * Číselný - väčšina. všeobecný spôsob Reprezentácie čísel; * Menový - peňažné hodnoty; * Finančný - Peňažné hodnoty so zarovnaním na separátore celej a frakčnej časti; * dátum - dátum alebo dátum a čas; * Čas - čas alebo dátum a čas; * Percento - hodnota bunky vynásobená 100 s "%" symbolom na konci; * Frakčný - racionálne frakcie s číslom a menovateľom; * Exponenciálny - desatinné miesto frakčné čísla; * Text - Textové údaje sa zobrazia rovnakým spôsobom, ako sú zadané a spracované riadky bez ohľadu na ich obsah; * Ďalší - formáty na prácu s databázami a zoznamami adries; * Prispôsobený - Formát je prispôsobiteľný užívateľom.

Najčastejšie možnosti formátu údajov možno priradiť pomocou panela formátovania nástrojov.

1. Kliknite na C4 Cell a potom na tlačidlo Percentuálny formát. Hodnota C4 bunky sa vynásobí 100 a pridá sa "%".

Obr. 9.14. Výber dátového formátu

2. Stlačte DOWN a kliknite na tlačidlo. Formát peňazí.

3. Kliknite na SAT bunku a potom na tlačidlo Formát so separátormi. Toto tlačidlo spôsobí, že čísla zosúladiť v stĺpci na oddeľovači celých a frakčných častí.

4. Vyberte C7 bunku a kliknite na tlačidlo. Zvýšiť bit. Toto tlačidlo nezmení hlavný formát, ale pridáva jeden znak do frakčnej časti čísla.

5. Stlačte tlačidlo ENTER a kliknite na tlačidlo. Znížiť bit. Táto operácia odstraňuje jeden kus frakčnej časti a zaokrúhľuje číslo. Teraz bunky s C4 na C9 vyzerajú úplne inak, hoci v nich boli zavedené rovnaké čísla. Iné formáty sú priradené pomocou nasledujúcich činností.

6. Kliknite na C10 Cell a vyberte príkaz. Formát\u003e Bunky.

7. V dialógovom okne, ktoré sa otvorí, rozbaľte kartu. Číslo (Obr. 9.14).

8. V zozname Číselné formáty Kliknite na položku dátum.

9. V zozname, ktorý sa zobrazí Typ Kliknite na riadok 14. marca 01 (14-mar-01). Potom kliknite na tlačidlo V poriadku.

Obr. 9.15. Rôzne formáty čísel

10. Podobne priraďte exponenciálny formát s C11 bunkou a C12 Cell je číselný formát. Teraz bude tabuľka vyzerať takto (obr. 9.15). Všimnite si, že priemerná hodnota tabuľky sa nezmenila, to znamená, že keď sa formát zmení, len metóda zmeny zobrazenia a samotné numerické hodnoty zostávajú nezmenené. Ak chcete skontrolovať túto skutočnosť, postupujte podľa týchto krokov.

11. Dvakrát kliknite na C11 bunku a zmeňte množstvo 03.01.1900 na 03.02.1900.

12. Stlačte tlačidlo ENTER. Priemerná hodnota tabuľky (ktorá sa zobrazuje v menovom formáte) okamžite sa mení o 15.41. Ako sa prihlásiť, môžete zhrnúť dátumy so záujmom a vyplývajú z získania rubľov. Toto je typický príklad nesprávneho formátov dát.

Ochrana plechu. Ochrana buniek v programe Microsoft Excel.

Autoformats a štýly v programe Microsoft Excel.

Použitie podmienených formátovania v programe Microsoft Excel.

Vytvorenie zoznamu a foriem údajov v programe Microsoft Excel. Požiadavky na vytvorenie zoznamu.

Triedenie a filtrovanie údajov v programe Microsoft Excel (AutoFilter, pokročilý filter).

Zoskupovanie a struky údajov v programe Microsoft Excel.

Automatické výsledky: Vytvorenie konečného tabuľky, odráža na obrazovke výsledkov v kontexte jednej alebo viacerých skupín záznamov.

Stvorenie súhrnná tabuľka v programe Microsoft Excel. (v notebooku)

Záväzná a konsolidácia údajov. (v notebooku)

Koncepcie teórie databáz. Zásady organizácie údajov.

Hierarchické a sieťové modely organizácie údajov.

Relačný model organizácie údajov. Normálne formy.

Koncepcie riadiacich systémov BD (DBMS) a ich účel.

Profesionálne systémy správy databáz (DBMS).

Priradenie, objednávka, vytvorenie databáz MS Access.

Tabuľky MS Access Databáza: Účel, štruktúra, možnosti tvorby.

Typy údajov a vlastnosti polí MS Access DBMS.

Koncepcia domény, atribút, kľúč relačného databázy.

Vytvorenie štruktúry pripojení medzi databázovými tabuľkami.

Typy vzťahov a obmedzení prístupu DBMS MS.

Koncepcie, vymenovanie a vlastnosti formulárov.

Možnosti vytvárania formulárov. Pomocou majstra majstra.

Práca s návrhárom formulárov. Formulár.

Použitie výrazov a vypočítaných polí.

Typy ovládacích prvkov tvaru.

Účel, typy a možnosti vytvárania požiadaviek.

Poradie práce s návrhárom žiadosti.

Filtrovanie a triedenie údajov v dotazoch.

Použite operátorov a podmienky do dotazov.

Vytvorenie vypočítaných polí, združení v dotazoch.

Postup práce s viacerými pracovnými požiadavkami.

Konečné dotazy. Skupinové operácie v MS Access.

Zmena informácií pomocou modifikácie požiadaviek.

Priradenie a spôsoby vytvorenia správ MS Access.

Pomocou sprievodcu vytvoriť správu.

Práca s návrhárom prehľadu.

Zoskupovanie údajov a priebežné výsledky v správach.

Makrá v prístupe a ich dizajne.

Ochrana informácií v databázach.

Klasifikácia počítačové siete. Koncepcia servera, pracovné stanice.

Softvér na prácu v lokálnych sieťach a na internete.

Výmena údajov v sieťach, protokoloch. Sieťový hardvér. Komunikácia medzi sieťami. Bezdrôtové siete.

Internet, sieťová štruktúra, základné koncepty. Internetové služby.

Princípy vyhľadávania informácií.

Indexovací a vyhľadávací nástroj.

Schéma systému vyhľadávania informácií. Stratégie vyhľadávania. Rozhranie.

Antivírusové programy a ich klasifikácia.

Základy na ochranu informácií a informácií, ktoré predstavujú štátne tajomstvo.

Spôsoby ochrany programov a údajov.

Zariadenia na ochranu hardvéru.

Parametrické kritériá, ktoré sme doteraz považovali za založené na skutočnosti, že porovnávané vzorky môžu byť charakterizované dvoma parametrami: stredná a štandardná odchýlka (alebo niektoré iné meradlo variability). A čo ak sa distribúcia vo vzorkách (alebo presnejšie, vo všeobecnej súprave, odkiaľ pochádzajú tieto vzorky), je úplne odlišný?

Ak je číslo každej z kompenzačných vzoriek dostatočne veľké (viac ako sto), môžu sa použiť parametrické kritériá. Akýkoľvek distribúciu má tieto vzorky, ich priemerný "správanie" je približne rovnaký ako priemerné vzorky s normálnou distribúciou. Ak je však veľkosť vzoriek nižšia, mali by sa použiť neparametrické kritériá.

Napríklad, neparametrickým analógom T-kritéria študentov je kritérium Mann-Whitney U. Kritérium študenta je založené na distribúcii, ktorá opisuje odchýlky priemernej hodnoty vzorky určitého čísla okolo všeobecného moderátora normálne distribuovanej hodnoty. Čím silnejšia odchýlka, tým nižšia je pravdepodobnosť, že to bolo spôsobené nehodou pri vytváraní vzorky. A ako konať, ak nevieme nič o povahe distribúcie všeobecných agregátov?

Zvážte pomerne jednoduchý príklad, ktorý vysvetľuje, ako veľká skupina neparametrických metód pracuje - kritériá poradia. Máme dve vzorky. Umiestnite ich prvky vo vzostupnom poradí: prvý - A1, A2, A3, A4, A5; Druhý-B1, B2, B3, B4, B5, B6. Urobíme prvky týchto vzoriek, spoločný rozsah postavený v poradí zvyšovania ich hodnôt. Porovnajte tri rôzne prípady:
1: A1, A2, A3, A4, A5, B1, B2, B3, B4, B5, B6;
2: A1, A2, A3, A4, B1, A5, B2, B3, B4, B5, B6;
3: B1, A1, B2, A2, B3, A3, B4, B5, A4, A5, B6.

V prípade čísla 1 sa všetky prvky jednej vzorky nachádzajú na jednej strane celkového počtu a všetkých prvkov iného riadku - na druhej strane. V prípade č. 2 jednej permutácie (prvkov B1 a A5) by to bolo dosť, aby sa poradie prvkov začalo, ako v prípade č. 1. Nakoniec, v prípade č. 3, prvky dvoch Vzorky sú zmätené a vybudovať ich v rade, kde budú najprv stáť samostatne a potom - iní, je potrebné, aby 5 permutácií. Musíme si vybrať medzi alternatívnou hypotézou (podľa ktorého sú vzorky A a B prevzaté z rôznych agregátov) a nulová hypotéza (podľa ktorého sa tieto vzorky odoberajú z tej istej kompatibility). Je pravdepodobnosť alternatívnej a nulovej hypotézy pre tri rôzne prípady, ktoré nám ukázali? Nie; Alternatívna hypotéza je pravdepodobnejšia v prvom prípade a nula - v treťom.

Myšlienkou neparametrického kritéria je, že môžeme použiť počet požadovaných permutácií ako opatrenie na vyhodnotenie nulovej a alternatívnej hypotézy. Špecifické hodnoty, ktoré sa vypočítajú pri aplikácii neparametrických kritérií, sú odlišné, ale logika porovnania približne zodpovedá príkladu, ktorý sa uvažuje.

Takže vďaka používaniu vtipných prístupov sú ich neparametrické analógy vybrané pre parametrické metódy porovnávania vzoriek (tabuľka 4.8.1). Najčastejšie, neparametrické metódy majú menej energie (tj je to častejšie odmietnuť alternatívnu hypotézu v situácii, keď je to vlastne pravda), ale umožňuje vám pracovať s rôznymi distribuovanými údajmi a menej citlivými na malé číslo porovnaných vzoriek.

Tabuľka 4.8.1. Neparametrické analógy parametrických metód

Druh porovnania	Parametrické metódy	Neparametrické metódy
Porovnanie hodnôt veľkosti v dvoch nezávislých vzorkách	t-kritérium študenta; Disperzia Analýza (ANOVA)	U-kritérium Mann-Whitney; Kritérium série Wald-Wolovitsa; KOLMOGOROV-SMIRNOVA Dvojplatne kritérium
Porovnanie hodnôt veľkosti v dvoch závislých vzorkách	t-kritérium Študent pre párové porovnania	Kritérium označení Kritérium Vilkoxon
Porovnanie hodnôt veľkosti v niekoľkých nezávislých vzorkách	Disperzia Analýza (ANOVA)	Rozsah disperznej analýzy Kraklala-Wallis; Stredný test

4.9. U-kritérium Mann-Whitney

Ak chcete zvážiť použitie kritéria Mann-Whitney na našom súbore Pelophelax_example.sta Budeme musieť použiť viac umelého príkladu. Ako príkladová hodnota je distribúcia, ktorá je veľmi odlišná od normálu, môžeme použiť znamenia nazývanú DNA - obsah DNA na bunku (v pikogramoch, pg), merané s použitím tečúcej DNA cytometrie.

Obr. 4.9.1. Značka "DNA" má distribúciu, prudko sa líši od normálu

Zistite, či sa význam tohto znamenania žien a mužov líši Pelofylax esculentus.. Ak chcete využiť kritérium Mann-Whitney, poďme do menu Štatistiky / Nonparametrics. Venujte pozornosť piktogramom v menu: Zodpovedajú tým, ktoré používajú na podobné porovnania s použitím testu T.

Obr. 4.9.2. U-kritérium Mann-Whitney sa tu vypočíta

V dialógovom okne musíte špecifikovať závislé (závislé) a zoskupené premenné; Ak má premenná zoskupenia viac ako dve hodnoty, musíte vybrať tieto dve hodnoty, ktoré porovnávajú porovnávané vzorky. Vybrať len zástupcov Pelofylax esculentus., Používame okno Vybrať prípady a používame textové označenia zadané v bode 3.1, pri opise vzorového súboru.

Obr. 4.9.3. Zariadenia vybrané pre opísané porovnanie

Môžete vidieť, že štatistika vypočíta všetky tri uvedené v tabuľke. 4.9.1. Kritériá, ktoré sa používajú na porovnanie dvoch nezávislých vzoriek, ale "odporúča" (začnú z tlačidla umiestneného vľavo horný roh) Kritérium Mann-Whitney. Vypočítam ho a uistite sa, že rozdiely medzi samicami a mužmi v počte DNA, ktoré sa vyskytujú na bunke, štatisticky nevýznamné.

Obr. 4.9.4. Výsledkom porovnania na Manna-Whitney

Ak nemáme záujem o jednosmerný kritérium, odporúča sa použiť hodnotu P vypočítanú s pozmeňujúcim a doplňujúcim návrhom (ktorý je po stĺpci "Z upravený, tj 0,906780). Tento pozmeňujúci a doplňujúci návrh zvyšuje kritérium sily v prípade vzoriek, \\ t Počet, ktorý presahuje 20. Tak inak nebol nájdený žiadny významný rozdiel medzi mužmi a ženami.

Dialóg, ktorý sme používali na porovnanie na Manno-Whitney, poskytuje možnosť budovania boxov. Vzhľadom k tomu, že používame neparametrickú metódu, vzorové parametre nie sú uväznené na grafe (napríklad jeho priemerná hodnota) a použité neparametrické opatrenia - medián a kvartil (hodnoty, "krájanie" vo štvrtej časti Distribúcia).

Obr. 4.9.5. Grafické porovnanie distribúcií DNA Značky pre ženy a mužov Pelofylax esculentus.

Môže sa zdať zvláštne prečo prvý (z min až 25%) a posledný (od 75% do max) je tak už druhý a tretí? Aby sme to pochopili, vytvoríme kategorizovaný histogram.

Obr. 4.9.6. Histogram, zobrazujúci distribučné hodnoty znamenia DNA, registrované pre ženy a mužov Pelofylax esculentus.

Je jasné, že majetok distribúcií uvedených v predchádzajúcom výkresom distribúcií je dôsledkom bimodality z hľadiska zváženia.

4.10. Kritérium značiek pre párové porovnania

V našom súbore - príklad pelofylax_example.sta nie sú žiadne údaje, ktoré vyžadujú porovnanie hodnôt dvoch pripojených vzoriek, takže ich vytvárame umelo. Predstavte si, že vzorka 25 žabov merala dvaja ľudia. Ich výsledky merania sú v prvom a druhom stĺpcoch. Rozmerová distribúcia v tejto vzorke bola pôvodne ďaleko od normálu.

Obr. 4.10.1. Distribúcia žabov (0,1 mm) podľa meraní vykonaných dvoma ľuďmi na rovnakom materiáli

Avšak, pre mnohé žaby, výsledky meraní vykonaných prvým a druhým výskumným pracovníkom sa líšia. Našou úlohou je zistiť, či dĺžka žaby sú rovnako merané dvoma výskumníkmi. Ak chcete hľadať odpoveď na túto otázku, používame kritérium označení.

Obr. 4.10.2. Použitie kritérií pre znaky na porovnanie výsledkov merania vykonaných dvoma rôznymi výskumníkmi

Kritérium príznakov jednoducho určuje podiel prípadov, v ktorých je hodnota z jednej vzorky väčšia ako hodnota z inej vzorky.

Obr. 4.10.3. Rozdiely sú štatisticky významné!

Môžeme preukázať, že druhý výskumník štatisticky výrazne častejšie nadhodnocuje výsledky merania v porovnaní s prvým výskumným pracovníkom.

Porovnajte výsledok získaný s výsledkom používania parametrickej metódy - T-kritérium pre spárované vzorky.

Obr. 4.10.4. Parametrická metóda poskytla rovnaký výsledok, ale s mierne vyššou spoľahlivosťou

Nižšia hodnota P, určená parametrickým kritériom, je plne v súlade s vyššie uvedenou skutočnosťou, že parametrické metódy majú väčší výkon ako neparametrické. Ale my sme vládli parametrické kritérium? V skutočnosti, kompetentne. Párované porovnania zvážili nie je úplnosť hodnôt v prvej a druhej vzorke a rozdiel pre každý prvok medzi prvou a druhou vzorkou. Vytvárame distribúciu rozdielu medzi vzorkami prvého a druhého.

Obr. 4.10.5. Distribúcia rozdielu medzi meraním dvoch výskumných pracovníkov

Je možné vidieť, že odchýlka distribúcie rozdielu medzi oboma rozmermi z normálu je štatisticky nevýznamná. Použitie parametrického testu bolo úplne oprávnené.

A mohol by sme použiť metódy na porovnanie nezávislých vzoriek? V prípade porovnania nezávislých vzoriek je rozdelenie záujmov záujmu pre nás veľmi odlišné od normálu, ukázalo sa, že je dôležité. Musíme teda použiť ne-kritérium, ale kritérium U. Aby ste mohli používať kritérium Mann-Whitney U-kritérium, dátový súbor bude musieť obnoviť: Všetky merania musia byť v rovnakom stĺpci a druhý stĺpec sa stane zoskupením.

Obr. 4.10.6. Podľa Mannu-Whitney, výsledky meraní vykonaných dvoma rôznymi ľuďmi sa nelíšia

Ako vysvetliť takýto rozdiel? Rovnako ako v mnohých iných prípadoch, prvá vec, ktorá sa má vykonať v prípade nejakého druhu nedorozumenia - Je potrebné sa pozrieť na distribúciu veľkosti záujmu.

Obr. 4.10.7. Distribúcia výsledkov merania, ktoré vykonávajú dvaja ľudia, sú takmer rovnaké. Ale koncov, podľa obr. 4.10.3 Pre 75% žaby sú výsledky merania druhého výskumníka veľké ako výsledky merania prvého výskumníka!

Samozrejme, získaný výsledok je pomerne prirodzený. Použitie kritéria Mann-Whitney namiesto kritérií pre označenia (alebo Wilcoxon kritérium), stratili sme kľúčové informáciektorý charakterizuje vzory zmien v posudzovanej hodnote.

Mimochodom, údaje, ktoré sme použili, boli vytvorené umelo. Prvý stĺpec bol fragment z súboru pelofylax_example.sta, kde boli väčšinou najmenšie a najväčšie osoby a druhý stĺpec sa získal pomocou vzorca \u003d TRUNC (First-2,4 + RND (8)). Rozumiete tomu, čo a ako "robí" tento vzorec?

4.11. Rozsah disperznej analýzy Kraklala-Wallis

Až do priechodného času sme použili len pár porovnania vzoriek. Teraz sa pozrieme na metódu, ktorá vám umožní v rovnakom čase porovnávať niekoľko vzoriek. Test Kraklala Wallis je neparametrický analóg disperznej analýzy (ANOVA), ktorá sa podrobne diskutuje v ďalšej časti nášho prínosu. Z výpočtového hľadiska je to multidimenzionálna zovšeobecnenie mesta Mann-Whitney Cesto. Hoci test Asset-Wallis je v niektorých ohľadoch a je nižšia ako analýza disperzie (napríklad v tom, že neumožňuje súčasne vyhodnotiť činnosti dvoch alebo viac Faktory), je to silný nástroj, ktorý je vhodný na riešenie mnohých úloh.

Ukážeme činnosť The Kraklala Wallis Test na príklad nášho súboru Pelophylax_example.sta (pozri článok 3.1). Musíme zistiť, či sa rozlišujú zástupcovia rôznych genotypov pozdĺž dĺžky vnútorného hojenia módy štatisticky významné. Toto je úplne zmysluplná úloha, pretože veľkosť a tvar vnútorného hojenia boja je dôležitou diagnostickou charakteristikou užitočnou na určenie rôzne tvary Zelené žaby.

Obr. 4.11.1. Venujte pozornosť vybranej ikonu, ktorá zodpovedá porovnávaniu viacerých nezávislých skupín

Samozrejme, závislá premenná je dĺžka päty lúča (CI) a zoskupenie je genotyp.

Obr. 4.11.2. Zariadenia sú vybraté. Ak potrebujete porovnať nie všetky hodnoty premennej zoskupenia, mali by ste použiť dialógové okno, ktoré volá kódové tlačidlo

Kliknutím na tlačidlo Súhrn dostanete výsledky dvoch testov naraz: Neparametrická disperzná analýza náterového a stredného testu, ktorá je založená na metód Pearsona. Použitie čítať viac je diskutované v jednej z nasledujúcich kapitol tohto návodu, a tu je dostatočné povedať, že táto metóda sa používa na neparametrické porovnanie distribúcií. Ak je distribúcia závislej hodnoty pre rôzne skupiny izolovaných hodnotou funkcie zoskupenia iná, toto naznačuje, že je pripojená zoskupenie a závislá premenná. Metóda rozširujúcej Wallis, ako si pamätáte, označuje hodnotenie neparametrických metód. Tieto dve metódy pracujú rôzne princípy A často dávajú vysoko rôzne výsledky.

Obr. 4.11.3. Obe metódy sa štatisticky demonštrujú zmysluplný vplyv Premenná zoskupenia na závislej premennej. Metóda masky-wallis poskytuje p \u003d 0,0047 a stredný test - p \u003d 0,0112

POZNÁMKA: Na základe niektorých nezrozumiteľných snobbers v niektorých programoch štatistiky 0 pred desatinným oddeľovačom (s použité nastavenia operačný systém - Sein) nie je.

Kliknutím na viacnásobné porovnania priemerných radov pre všetky skupiny, môžete získať výsledky párových porovnaní všetkých skupín. V skutočnosti je to ekvivalentné vykonať porovnanie Mann-White pre všetky možné páry skupín. Program zobrazuje dva okná: hodnoty hodnoty Z použitej vo výpočtoch na mannu-white a vypočítané pre každý pár úrovne štatistického významu rozdielov.

Obr. 4.11.4. Rodičovské porovnanie skupín v dialógovom dialógovom dialógovom dialógovom dialógovom dialógovom dialógovom dialógi Kraklala je ekvivalentné viacerým porovnaniam pomocou kritéria Mann-Whitney

Všimnite si, že pri vykonávaní viacerých porovnaní, nebezpečenstvo štatistickej chyby prišlo k vytvoreniu štatistickej chyby (prijať alternatívnu hypotézu v čase, keď je nula pravdivá). Aby ste sa vyhli tomuto nebezpečenstvu, mali by ste použiť vyššie opísaný pozmeňujúci a doplňujúci návrh na viacnásobné porovnania.

Nakoniec, tlačidlo Box & Whisher umožňuje porovnať distribúcie rôznych skupín.

Obr. 4.11.5. Porovnanie distribúcií dĺžky pätového lúča od zástupcov rôznych genotypov

Ďalším z "grafických" tlačidiel diskusie dialógu umožňuje konštruovať kategorizované histogramy pre porovnávacie skupiny; Z hľadiska autora je táto metóda výstupných výsledkov menej vizuálna.

Počúvala som prednášku o meraní výkonu počítača a profesor poskytol analógiu s meraním výkonu lietadla. Ukázal tabuľku, ktorá obsahovala rôzne parametre rôznych lietadiel, ako napríklad:

Lietadlá: Speed \u200b\u200bCAPCITY CAPCITY CONCORD 132 1350 MPH DC9 146 544 MPH

potom požiadal o otázky študentov, ktorí " Ako rýchlejší Concord v porovnaní s DC9? ". Potom to vysvetlil viac ako 2 krát. Moja otázka: Prečo použil divíziu na porovnanie dvoch hodnôt, a nie odpočítať? Poznám svoju veľmi základnú otázku, ale prosím, prepáč moju nekompetentnosť.

Niekedy musíte použiť pomer na opis javov, napríklad pravdepodobnosť výhry hry. Niekedy je to voliteľné, ako vo vašom prípade. Nájdete ho zaujímavé: https: //en.wikipedia.org/wiki/relifference_change_and_difference - Žiadna šanca. 06 Mar. 16 2016-03-06 17:40:56.

Triedenie:

Činnosť

Poslal som tú istú otázku na Dr.Mats a dostal nasledujúcu odpoveď, ktorá je podľa môjho názoru presnejšia a podrobná.

Opýtajte sa sami seba, ktorý by vám bol zmysluplný: Concord je 806 mph rýchlejší ako DC9. Concord je 2,5-krát taký rýchly ako DC9. Ak nemáte potuchy, ako rýchlo byť takmer bezvýznamné - môžete "t povedať, či je to len malé zlepšenie (od, povedzme 100 000 mph na 100,806 mph!) Alebo obrovské zlepšenie (od 10 mph do 816 mph). I "M Preháňaním, aby som urobil bod: tlmočenie zápisu čísla závisí od významu čísla závislé od príslušných čísel. Pomer na druhej strane nevyžaduje takýto zaviazanie. Tiež a možno ešte dôležitejšie, pomer bude Byť rovnaký bez ohľadu na použité jednotky. Nemusíme vedieť, či sa rýchlosti merali v MPH alebo KPH alebo palcov za sekundu. V skutočnosti, že pomer predstavuje použitie samotného DC9 ako jednotky merania - Concord letí na 2,5 DC9 "S. To isté je pravdepodobne pravdivé pri porovnávaní počítačových rýchlostí. Kto vie, v týchto dňoch, čo je dobrá rýchlosť? Ale ktokoľvek Môže to povedať, že dvakrát tak rýchlo je oveľa lepšie. To je niečo, čo môžeme vizualizovať oveľa lepšie ako nanoseconds alebo gigabajty!

Zvážte situáciu - som jedli $ 1000 $ jablká. Môj priateľ Ate Apples $ 1050.

Dve vyhlásenia Môj priateľ jedol $ 50 $ jablká viac ako ja z rozdielu Môj priateľ jedol $ 1,05 $ pm jablká ako ja Z pomeru.

Zvážte ďalšiu situáciu, keď jesť $ 100 $ jablká a môj priateľ $ 105 $

Dve vyhlásenia budú Môj priateľ jedol $ 5 $ jablká viac ako ja a
Môj priateľ jedol $ 1,05 krát viac jabĺk ako ja

Tretia i jedla so situáciami $ 1 $ Apple, môj priateľ jesť $ 51 $

dve vyhlásenia - Môj priateľ jedol $ 50 $ jablká viac - a
Môj priateľ jedol $ 51 dnes množstvo jabĺk ako ja

Záver - Potrebujeme ako rozdiel a postoj jasne poznať situáciu. Používame však rôzne veci v rôznych scenároch, ktoré, ako dúfam, sú z vyššie uvedeného príkladu jasné.