Contacts

Utilisé pour comparer plusieurs quantités. Le diagramme est un moyen d'une image graphique visuelle d'informations destinée à comparer plusieurs quantités ou plusieurs valeurs d'une. Formatage des cellules. NUMÉROS FORMAT dans Microsoft Excel

Dans les notes précédentes, les procédures de contrôle des hypothèses des données numériques et de catégorie ont été décrites :, plusieurs, et aussi d'en apprendre une ou. Dans cet article, nous examinerons les méthodes de test des hypothèses sur les différences entre les actions du trait dans les agrégats généraux sur la base de plusieurs échantillons indépendants.

Pour illustrer les méthodes utilisées, le script est utilisé dans lequel le degré de satisfaction des invités d'hôtels appartenant à T. S. Resort Properties est estimé. Imaginez que vous êtes un directeur d'entreprise qui possède cinq hôtels situés sur les deux îles de la station balnéaire. Si les invités sont satisfaits du service, la probabilité est qu'elles reviendront la prochaine année et recommanderont leurs amis à rester dans votre hôtel. Pour évaluer la qualité de service, les clients sont invités à remplir le questionnaire et à indiquer s'ils sont satisfaits de l'hospitalité. Vous devez analyser les données d'enquête, déterminer le degré de satisfaction commune des demandes invitées, évaluer la probabilité que les invités reviennent l'année prochaine, ainsi que pour établir les causes du désactivation possible de certains clients. Par exemple, sur l'une des îles de la société, les hôtels Beachcomber et Windsurfer sont appartenant. Le service dans ces hôtels est-il égal à ces hôtels? Sinon, comment cette information peut-elle être utilisée pour améliorer la qualité de la société? De plus, si certains invités ont déclaré qu'ils ne viendraient pas à vous plus, quelles raisons-t-elles indiquent-ils plus souvent que d'autres? Est-il possible que ces raisons ne concernent qu'un hôtel particulier et ne s'appliquent pas à toute la société dans son ensemble?

La notation suivante est utilisée ici: X. 1 - le nombre de succès dans le premier groupe, X. 2 - le nombre de succès dans le deuxième groupe, n. 1 X. 1 - le nombre d'échecs dans le premier groupe, n. 2 X. 2 - le nombre d'échecs dans le deuxième groupe, X \u003d.X. 1 + X. 2 - le nombre total de succès, n.X. = (n. 1 X. 1 ) + (n. 2 X. 2 ) - le nombre total d'échecs, n. 1 - le volume du premier échantillon, n. 2 - le volume du deuxième échantillon, n. = n. 1 + n. 2 - Échantillons de synthèse. La table présentée a deux lignes et deux colonnes. Elle s'appelle donc une table facteur 2 × 2. Les cellules formées par l'intersection de chaque ligne et de chaque colonne contiennent le nombre de succès ou de défaillances.

Nous illustrons l'application du tableau de confrontation sur l'exemple du script décrit ci-dessus. Supposons que la question "reviendrai l'année prochaine?" 163 sur 227 invités de l'hôtel Beachcomber et 154 de l'hôtel Hotel Windsurfer, répondent à l'affirmative. Existe-t-il une différence statistiquement significative entre le degré de satisfaction des clients de l'hôtel (qui est la probabilité que les invités reviennent l'année prochaine), si le niveau de signification est de 0,05?

Figure. 2. Tableau factable 2x2 pour évaluer la qualité du service des invités

La première ligne indique le nombre d'invités de chaque hôtel, qui a déclaré leur désir de retourner l'année prochaine (succès); Dans la deuxième ligne - le nombre d'invités a exprimé le mécontentement (échec). Les cellules situées dans la colonne «Total» contiennent le nombre total d'invités prévoyant de retourner à l'hôtel l'année prochaine, ainsi que le nombre total d'invités insatisfaits du service. Les cellules situées dans la ligne "totale" contiennent le nombre total d'invités interrogés sur chaque hôtel. La part des clients envisageant de retourner est calculée en divisant le nombre d'invités qui l'ont déclaré sur le nombre total d'invités interrogés. Ensuite, χ 2 -Criteria est utilisé pour comparer les fractions calculées.

Pour vérifier les hypothèses zéro et alternative H 0: P 1 \u003d P 2; H 1: P 1 ≠ P 2 Utilisez test χ 2-statistiques.

Le critère "Chi-Square" pour comparer deux pièces.Test χ 2 -Station est égal à la somme des carrés des différences entre le nombre observé et attendu de succès divisé par le nombre de succès attendu dans chaque cellule de la table:

f 0. - le nombre observé de succès ou d'échecs dans la cellule spécifique de la table de confrontation, f e.

Test χ 2 -Station est approximativement par 2-Distribution avec un degré de liberté.

Ou des échecs dans chaque cellule de la table de conjugités des signes, il est nécessaire de comprendre leur signification. Si l'hypothèse zéro est vraie, c'est-à-dire La part du succès de deux collaborateurs généraux est égale, les actions sélectives calculées pour chacun des deux groupes peuvent différer les unes des autres par des raisons aléatoires, et les deux actions sont une évaluation paramètre commun Agrégat général r. Dans cette situation, les statistiques réunissant les deux actions d'une estimation commune (moyenne) paramètre r Représente une part commune du succès dans les groupes combinés (c'est-à-dire qu'il est égal au nombre total de succès divisé par la taille totale des échantillons). Son ajout 1 – est une part commune des échecs dans les groupes combinés. En utilisant la notation, la signification est décrite dans le tableau de la Fig. 1. Vous pouvez émettre une formule (2) pour calculer le paramètre :

- Part moyen du panneau.

Calculer le nombre de succès attendu f. E. (c'est-à-dire le contenu de la première ligne de la table de conjugaison), vous devez multiplier la taille de l'échantillon sur le paramètre . Calculer le nombre attendu d'échecs f e. (c'est-à-dire le contenu de la deuxième ligne de la table de confrontation), vous devez multiplier la taille de l'échantillon sur le paramètre 1 – .

Les statistiques de test calculées par formule (1) sont approchées par la répartition 2-2 avec un degré de liberté. À un niveau d'importance donné, une hypothèse α zéro s'écarte si la χ 2 -Station calculée est supérieure à la valeur de 2, la valeur critique supérieure de la Distribution de la χ 2 avec un degré de liberté. De cette façon, règle décisive Ressemble à ceci: hypothèse H. 0 dévie si 2\u003e χ u 2, sinon l'hypothèse H 0 Ne dévie pas (Fig. 3).

Figure. 3. Région critique χ 2 -Criteria pour comparaison des actions au niveau de signification α

Si l'hypothèse zéro est vraie, le χ 2 -Stamintisme est proche de zéro, car le carré de la différence entre l'observé f. 0 et attendu f. E. Les valeurs de chaque cellule sont très petites. D'autre part, si l'hypothèse zéro H 0 Il est faux et entre des proportions de succès dans les agrégats généraux, il y a une différence significative, calculée χ 2 -Stattisme devrait être grande. Ceci s'explique par la différence entre le nombre observé et attendu de succès ou de défaillance de chaque cellule, qui augmente lorsqu'il est érigé sur le carré. Cependant, les contributions des différences entre les valeurs attendues et observées dans le total des statistiques 2-Statistiques peuvent être inégales. La même différence réelle entre f 0. et f e. Il peut avoir une plus grande influence sur les statistiques de 2 statistiques, si la cellule contient les résultats d'une petite quantité d'observations que la différence correspondant à un plus grand nombre d'observations.

Afin d'illustrer χ 2 -Criterid pour vérifier l'hypothèse de l'égalité des deux fractions, retour au scénario décrit dans la précédente, dont les résultats sont illustrés à la Fig. 2. Hypothèse zéro (H 0: P 1 \u003d P 2) soutient que, lors de la comparaison de la qualité de service dans deux hôtels, la part des clients envisageant de retourner l'année prochaine est presque la même. Pour évaluer le paramètre rReprésentant la part des invités prévoyant de retourner à l'hôtel si l'hypothèse zéro est vraie, la valeur est utilisée. qui est calculé par la formule

La part des invités restant un service mécontent \u003d 1 - 0,6483 \u003d 0,3517. Multipliez ces deux enjeux sur le nombre d'invités interrogés par Hotel Beachcomber, nous obtenons le nombre d'invités prévoyant de retourner la saison prochaine, ainsi que du nombre de vacanciers qui ne s'arrêteront plus dans cet hôtel. De même, la part attendue des invités de l'hôtel Windsurfer est calculée:

Oui - Beachcomber: = 0,6483, n. 1 \u003d 227, donc, f e. = 147,16.
Oui - Windsurfer: = 0,6483, n. 2 \u003d 262, donc, f e. = 169,84.
Non - Beachcomber: 1 - = 0,3517, n. 1 \u003d 227, donc, f e. = 79,84.
Non - Windsurfer: 1 - = 0,3517, n. 2 \u003d 262, donc, f e. = 92,16.

Les calculs sont présentés à la Fig. quatre.

Figure. 4. χ 2 -Statisme pour les hôtels: a) données sources; b) Tableau factable 2x2 pour comparer l'observé ( f. 0 ) et prévu ( f. E.) le nombre d'invités satisfaits et non satisfaits du service; c) Calcul des 2-statistiques lors de la comparaison de la part des invités satisfaits du service; (d) Calcul de la valeur critique du test χ 2 -Startterie

Calculer la valeur critique du test 2 appliqué fonctionnalité Excel \u003d Hay2.ob (). Si le niveau de signification α \u003d 0,05 (la probabilité substituée dans la fonction HA2 est de 1 -α), et la répartition 2-2 pour un format de facteur 2 × 2 a un degré de liberté, la valeur critique de χ 2 -Statistique est de 3,841 . Étant donné que la valeur calculée de χ 2 -Startery, égale à 9.053 (figure 4b), dépasse le nombre 3 841, l'hypothèse zéro dévie (Fig. 5).

Figure. 5. Détermination de la valeur critique du test χ 2 -Statistique avec un degré de liberté au niveau de signification α \u003d 0,05

Probabilité r Le fait que l'hypothèse zéro soit valide pour χ 2 -Statstural égale à 9,053 (et un degré de liberté) est calculée dans Excel à l'aide de la fonction \u003d 1 - hea2.SP (9.053; 1; vérité) \u003d 0,0026. r-Notion, égale à 0,0026, est la probabilité que la différence entre des actions sélectives des clients satisfaits du service dans les hôtels de Beachcomber et Windsurfer soit égal ou supérieur à 0,718 à 0,588 \u003d 0,13, s'ils partagent réellement leurs actions dans les deux collections générales sont la même chose. Ainsi, il existe de bons motifs de faire valoir qu'il existe une différence de service statistiquement significative entre deux hôtels. Des études montrent que le nombre d'invités satisfaits du service à l'hôtel Beachcomber, plus que le nombre d'invités qui envisagent de séjourner à l'hôtel Windsurfer.

Vérification des hypothèses relatives à un facteur Tableau 2 × 2.Pour obtenir des résultats précis basés sur les données données dans le tableau 2 × 2, il est nécessaire que le nombre de succès ou de défaillances dépasse le nombre 5. Si cette condition n'est pas exécutée, une précision doit être appliquée. critère pêcheur.

Lors de la comparaison du pourcentage de clients, satisfait de la qualité de service dans deux hôtels, les critères Z et 2 mènent aux mêmes résultats. Cela peut être expliqué par l'existence d'une connexion étroite entre la normalisation distribution normale et χ 2-distribution avec un degré de liberté. Dans ce cas, 2 est toujours un carré de statistiques Z. Par exemple, lors de l'évaluation du degré de satisfaction des invités, nous avons constaté que Z.-Station est +3.01, et 2 statique - 9.05. Négliger les erreurs d'arrondi, il est facile de s'assurer que la deuxième valeur est le premier carré (c'est-à-dire 3.01 2 \u003d 9,05). De plus, en comparant les valeurs critiques des deux statistiques au niveau de signification α \u003d 0,05, on peut constater que la valeur de χ 1 2 est de 3 841, est le carré de la valeur critique supérieure des statistiques Z, égale à +1.96 (IE χ 1 2 \u003d Z 2). En outre, r-Notions des deux critères sont les mêmes.

Ainsi, on peut soutenir que lors de la vérification des hypothèses zéro et alternative H 0: P 1 \u003d P 2; H 1: P 1 ≠ P 2 Les critères Z et 2 sont équivalents. Cependant, s'il est nécessaire de ne pas facilement détecter les différences, mais également déterminer la proportion plus (P 1\u003e P 2), poursuivre Appliquez un critère Z avec une zone critique délimitée par la queue de la distribution normale normalisée. Ensuite, l'application du critère χ 2 sera décrite pour comparer le partage d'une signature dans plusieurs groupes. Il convient de noter que le critère Z ne peut pas être appliqué dans cette situation.

L'utilisation de χ 2 -Criteria pour tester l'hypothèse sur l'égalité de plusieurs fractions

Le critère chi-carré peut être étendu à un cas plus général et s'appliquer pour tester l'hypothèse sur l'égalité de plusieurs actions. Dénote le nombre de lettres agrégat générales indépendantes analysées de. Maintenant, la table de confrontation se compose de deux lignes et de Colonnes. Pour vérifier les hypothèses zéro et alternative H 0: P 1 \u003d P 2 = … = p 2., H 1:pas tout R J. égal à l'autre (j. = 1, 2, …, c.), Test d'occasion χ 2 -Statme:

f 0. - Nombre observé de succès ou d'échecs dans une cellule spécifique d'un format de facteur 2 * de, f. E. - Théorique, ou attendu, Nombre de succès ou d'échecs dans une cellule spécifique de la table de conjugités, à condition que l'hypothèse zéro soit vraie.

Pour calculer le nombre de succès ou de défaillances attendus dans chaque cellule de la table de confrontation, il est nécessaire de garder à l'esprit les éléments suivants. Si l'hypothèse zéro est la vraie et la part du succès de tous les agrégats généraux égaux, les actions sélectives correspondantes ne peuvent différer les unes des autres uniquement par des raisons aléatoires, car toutes les actions sont des estimations de la part du signe r Dans la population générale générale. Dans cette situation, des statistiques combinant toutes les actions d'une estimation commune (ou modérée) du paramètre r, contient plus d'informations que chacune d'elles individuellement. Ces statistiques désignées par le symbole Représente une part commune (ou moyenne) du succès dans l'échantillon United.

Calcul du lobe moyen:

Calculer le nombre de succès attendu f e. Dans la première ligne de la table de confrontation, vous devez multiplier le volume de chaque échantillon sur le paramètre. Calculer le nombre attendu d'échecs f e. Dans la deuxième ligne de la table de configuration des symptômes, vous devez multiplier le volume de chaque échantillon au paramètre 1 – . Les statistiques de test calculées par formule (1) sont approximativement par 2-Distribution. Le nombre de degrés de liberté de cette distribution est fixé par la magnitude (R - 1) (c. – 1) r- le nombre de lignes dans une table facteur, de - le nombre de colonnes dans la table. Pour la table des facteurs 2 * S. Le nombre de degrés de liberté est égal (2 - 1) (C - 1) \u003d C - 1. À un niveau d'importance donné α, l'hypothèse zéro s'écarte si la χ -Station calculée est supérieure à la valeur critique supérieure χ u 2 inhérente à χ 2-Distribution avec c - 1. degrés de liberté. Ainsi, la règle décisive est la suivante: hypothèse H 0 Désactivé si 2\u003e χ u 2 (fig. 6), sinon l'hypothèse s'écoule.

Figure. 6. Région critique 2 -Criteria pour une comparaison avec une fraction au niveau de signification α

Vérification des hypothèses relatives à un format de facteur 2 * p. Pour des résultats précis basés sur les données présentées dans un tableau 2 * deIl est nécessaire que le nombre de succès ou d'échecs soit assez volumineux. Certaines statistiques estiment que le critère donne des résultats précis si les fréquences attendues dépassent 0,5. Des chercheurs plus conservateurs ne nécessitent plus de 20% des signes de la table de conjugités des signes contenaient des valeurs attendues inférieures à 5 et aucune cellule ne doit contenir la valeur attendue moins d'une. État dernier Il nous semble un compromis raisonnable entre ces extrêmes. Pour satisfaire cette condition, les catégories contenant de petites valeurs attendues devraient être combinées en une. Après cela, le critère devient plus précis. Si, pour une raison quelconque, une autre catégorie est impossible, des procédures alternatives doivent être appliquées.

Afin d'illustrer χ 2 -Criteria pour vérifier l'hypothèse sur l'égalité de la part de la part de plusieurs groupes, rendez-vous au script décrit au début du chapitre. Considérez une enquête similaire dans laquelle les invités de trois hôtels appartenant à la société T. S. Resources Resources (Fig. 7a) participe.

Figure. 7. Tableau d'usine 2 × 3 Pour la comparaison, le nombre d'invités satisfaits et non satisfaits du service: (a) le nombre observé de succès ou de défaillance - f 0.; (b) le nombre attendu de succès ou de défaillance - f. E.; c) Calcul des 2-statistiques lors de la comparaison de la part des invités satisfaits du service

L'hypothèse zéro affirme que la part des clients envisage de retourner l'année prochaine, dans tous les hôtels presque la même. Pour évaluer le paramètre rreprésentant la part des invités prévoyant retour à l'hôtel, utilise la valeur R = X /n. \u003d 513/700 \u003d 0,733. La part des invités restant le service mécontent est de 1 à 0,733 \u003d 0,267. Multiplier trois actions sur le nombre d'invités interrogés dans chacun des hôtels, nous obtenons le nombre d'invités prévoyant de retourner la saison prochaine, ainsi que le nombre de clients qui ne s'arrêteront plus dans cet hôtel (Fig. 7b).

Pour vérifier les hypothèses de zéro et alternatives, utilisez Test χ-statistics calculé à l'aide des valeurs attendues et observées par formule (1) (Fig. 7b).

La valeur critique du test χ 2 est déterminée par la formule \u003d hi2.ob (). Étant donné que les invités participent à l'enquête, les clients de trois hôtels sont impliqués, χ 2 -Station a (2 - 1) (3 - 1) \u003d 2 degrés de liberté. Au niveau de signification α \u003d 0,05, la valeur critique de χ 2 -Statistique est de 5,991 (Fig. 7G). Étant donné que la carte χ 2 calculée, égale à 40,236, dépasse la valeur critique, l'hypothèse zéro dévie (Fig. 8). D'autre part, la probabilité r Le fait que l'hypothèse zéro soit valide pour χ 2 -Statural égale à 40,236 (et deux degrés de liberté) est calculée dans Excel à l'aide de la fonction \u003d 1-HI2.mp () \u003d 0,000 (figure 7G). r-Notion est 0.000 et moins de signification niveau α \u003d 0,05. Par conséquent, l'hypothèse zéro dévie.

Figure. 8. Domaines d'adoption et de déviation de l'hypothèse sur l'égalité des trois fractions à un niveau d'importance, égal à 0,05 et deux degrés de liberté

Décertation de l'hypothèse zéro lors de la comparaison des actions indiquées dans un tableau 2 * deNous ne pouvons que dire que la part des clients satisfaits du service dans trois hôtels ne coïncide pas. Afin de déterminer quelles actions sont différentes des autres, d'autres méthodes doivent être appliquées, par exemple, la procédure Maraskuil.

Procédure Maracouquilo Vous permet de comparer tous les groupes par paires. Au premier stade de la procédure, la différence P s j - p s j 'est calculée (où j.j.) entre c (C - 1) / 2 vapeurs. La portée critique correspondante est calculée par la formule:


Avec le niveau général de signification α, la valeur est une racine carrée de la valeur critique supérieure de la valeur de distribution "Chi-Square" ayant c - 1. degrés de liberté. Pour chaque paire de fractions sélectives, il est nécessaire de calculer une portée critique distincte. Dans la dernière étape, chacun des c (C - 1) / 2 Paire de fractions par rapport à la portée critique correspondante. Les actions formant une paire spécifique sont considérées comme statistiquement significativement différentes si la différence absolue des fractions d'échantillon | p s j - p s j | dépasse la portée critique.

Je vais illustrer la procédure Marasko sur l'exemple d'une enquête de trois hôtels (Figure 9a). Application du critère "Hee-Square", nous avons été convaincus qu'il existe une différence statistiquement significative entre les actions des invités des invités de divers hôtels l'année suivante. Étant donné que les clients de trois hôtels sont impliqués dans l'enquête, il est nécessaire de réaliser 3 (3 - 1) / 2 \u003d 3 comparaisons de paires et calculer trois périmètres critiques. Pour commencer, nous calculons trois lobes sélectifs (Fig. 9B). Avec un niveau général d'importance, égal à 0,05, la valeur critique supérieure des tests χ 2-statistiques pour la distribution du "chi-carré" ayant (C-1) \u003d 2 degrés de liberté est déterminée par la formule \u003d HAY2.OB (0,95; 2) \u003d 5.991. Donc, \u003d 2,448 (Fig. 9B). Ensuite, nous calculons trois paires de différences absolues et des swors critiques correspondants. Si la différence absolue est plus de sa portée critique, les actions correspondantes sont considérées considérablement différentes (Fig. 9g).

Figure. 9. Résultats de la mise en œuvre de la procédure Marasko pour tester l'hypothèse sur l'égalité de la part des invités satisfaits de trois hôtels: (a) des données de vote; b) actions sélectives; c) la valeur critique supérieure du test χ 2 -Statistique pour la distribution de "Chi-Square"; (d) trois paires de différences absolues et les swors critiques correspondants

Comme nous pouvons le constater, à un niveau d'importance, égal à 0,05, le degré de satisfaction des invités de l'hôtel Palm Royal (P S2 \u003d 0,858) est plus élevé que les invités de Golden Palm Hotels (P S1 \u003d 0,593) et Palm Princesse (p s3 \u003d 0,738). En outre, la satisfaction des invités de l'hôtel Palm Princess est plus élevée que les clients de l'hôtel Golden Palm. Ces résultats doivent forcer les dirigeants à analyser les causes de telles différences et tenter de déterminer pourquoi le degré de satisfaction des invités de l'hôtel Golden Palm est nettement inférieur à celui des autres hôtels.

Les matériaux du livre Levin et al. Statistiques des gestionnaires. - M.: Williams, 2004. - avec. 708-730

Le livre décrit les principales techniques de travail sur l'ordinateur Macintosh. Les caractéristiques du travail dans la salle d'opération sont indiquées système Mac OS X: interface utilisateur, Installation / suppression de programmes, gravure CD / DVD, documents d'impression, connexion à Internet, etc. Décrit les applications principales incluses dans le système d'exploitation: client de messagerie Poster; Navigateur web safari; Agenda-journal ical; L'application contrôle les widgets, le tableau de bord; Programme de stand photo pour travailler avec l'intégré appareil photo numérique; Editeur de musique Garageband; Application Time Machine pour copie de la réserve et al. Travailler avec des applications de média intégrées Iwork: Éditeur de texte Pages, chiffres de tableurs, programme pour créer des présentations principales. Les caractéristiques du clavier Macintosh sont affichées et des analogies avec un clavier d'ordinateur IBM PC sont effectués. CD contient des tâches pour travail indépendant Avec les applications Mac OS X et IWork, matériels pour effectuer des tâches, exemples de présentation.

Pour les utilisateurs novices.

Livre:

Sections sur cette page:

Diagramme - représentation graphique Données de la plage sélectionnée.

Pour construire des diagrammes, suivez l'algorithme suivant

1. Créez une table de valeurs de règlement.

2. Sélectionner la gamme souhaitée (Il peut être composé de gammes rectangulaires non adjacentes).

3. Sélectionnez le type de diagramme souhaité dans la liste organisée par le bouton Graphiques.(Graphiques):


Ou de la liste du menu Insérer.(Insérer)? Graphique(Diagramme).

4. Créez des paramètres pour le diagramme créé dans la fenêtre de l'inspecteur de l'onglet Graphique(Diagramme).

En détail, examinez les paramètres des paramètres du graphique dans cette section que nous ne le ferons pas, car cette question a déjà compris dans la demande. Pages (voir la section. 5.1.14), Et la pratique de travailler avec des graphiques sera démantelée dans section. 6.2.8.

Types de diagrammes et exemples d'utilisation

application Nombres.offre la même liste de graphiques que Pages.Travailler avec des diagrammes dans Pagesa été considéré dans section. 5.1.14, dans lequel l'attention n'a été payée qu'à divers paramètres de diagrammes, mais n'a pas été donné caractéristiques comparatives Différentes espèces. Dans cette section, nous analyserons plusieurs exemples d'utilisation de certains types de diagrammes qui démontrent clairement leur portée.

Diagramme circulaire

Circulaire diagramme (TARTE)et sa version volumétrique (Tarte 3D)utilisé pour comparer plusieurs valeurs à un point ou plusieurs parties d'un tout. Comme le nom suit, le diagramme est un cercle divisé en secteurs. Le cercle correspond au montant total de toutes les données et est de 100%, chaque secteur correspond à celui donné, qui fait partie de ( pourcentage) Du total.

Exemple 1.Un jour, l'oncle Fedor est allé dans la forêt sur les champignons et se rassembla: 24 Chanterelles, 9 Mokhovikov, 15 vagues, 5 White. Construisez un diagramme de collecte de champignons circulaire montrant quel pourcentage de quantités totales constituent des champignons blancs.

Il devrait être pré-préparer une table de valeurs pour laquelle le diagramme sera construit. La table doit être ajoutée aux noms des champignons et des données numériques, puis mettez en surbrillance la plage A1: D2 (Fig. 5.86) et sélectionnez le type de graphique. Tarte (Circulaire). Les cellules de la première ligne de la plage sélectionnée sont les noms des secteurs du cercle, les cellules de la deuxième chaîne contiennent des données de diagramme numérique. Tout le cercle est le nombre total de champignons collectés - 45, chaque secteur reflète le pourcentage de chaque nom de champignon à partir des quantités totales, figue. 5.86).


L'utilisation d'un graphique circulaire n'est pas toujours pratique et clairement, par exemple, une augmentation du nombre de champignons collectées entraînera une augmentation des secteurs, ce qui affectera délicablement l'informativement du graphique. Dans ce cas, d'autres types doivent être utilisés.

Tableaux de colonne

Nombres. offre plusieurs variantes de la carte de colonne: Colonne. (Colonne) - colonnes verticales, Bar (Histogramme) - colonnes horizontales, 3D colonne. (Colonne tridimensionnelle), Barre 3D. (Histogramme tridimensionnel).

Colonne Le diagramme et diverses options sont utilisés pour comparer plusieurs quantités à plusieurs points, mais peuvent également être utilisées pour comparer plusieurs valeurs à un moment donné, comme dans l'exemple précédent (voir Fig. 5.86).

Comme le nom suit, la carte de colonne est composée de colonnes, dont la hauteur correspond aux valeurs des valeurs comparées, dans l'exemple 1, la hauteur des colonnes est déterminée par la quantité de champignons collectés. Chaque colonne est liée à un certain point de référence. Dans l'exemple 1, le point de référence correspond au nom du champignon, combien d'articles (4), tant de colonnes (voir Fig. 5.86).

Considérez la tâche pour laquelle le diagramme circulaire ne convient pas à la résolution. Dans l'exemple 2, plusieurs fois doivent comparer plusieurs fois.

Exemple 2. Supposons que ses amis rejoignent l'oncle Fedor sur la collection de champignons: le chat de matroskin et le chien, les données sont présentées dans le tableau (Fig. 5.87). Construire un diagramme dans lequel les résultats de tous les collecteurs sont reflétés.


La hauteur de la colonne se reflète, comme dans l'exemple 1, le nombre de champignons collectés reste toujours 4 points de référence, mais contrairement à l'exemple 1, dans chaque point de référence n'est pas une colonne, mais trois (une colonne pour chaque collecteur). Toutes les colonnes d'un collecteur seront peintes d'une couleur. Pour construire un diagramme, une plage A1: E4 doit être isolée (voir Fig. 5.87), à la Fig. 5.87 Type de diagramme Colonne. (Colonne).

Diagramme linéaire

Linéaire diagramme ( Ligne) Il est destiné à retracer les changements de plusieurs quantités lors de la déplacement d'un point à un autre.

Exemple 3.Construisez un schéma linéaire basé sur une table de l'exemple 2, reflétant le changement de nombre de champignons collectés en fonction de leur type.

Les points de référence restent toujours quatre dans le nombre d'espèces de champignons. Le nombre de champignons collectés est marqué sur le graphique des balises connectées aux autres segments. En conséquence, le graphique représente une ligne brisée composée de plusieurs segments, d'ici cette espèce Les graphiques sont appelés - linéaires. Le diagramme illustré à la Fig. 5.88, contient trois lignes, chacune correspondant à un collecteur. Les lignes diffèrent les unes des autres: couleur, type de course épais, marqueurs.

Diagramme de carré

Diagramme carré Représente une hybride de graphiques linéaires et colonnes, reflète clairement la comparaison de plusieurs valeurs à un moment donné.

Exemple 4.Construisez un tableau d'un carré sur la base d'une table de l'exemple 1, reflétant la collecte de l'oncle Fedor.

Si sur le dessus des colonnes illustrées à la Fig. 5.86, points de marque, connectez-les avec des segments et la zone qui en résulte pour peindre n'importe quelle couleur, puis la zone de la zone, présentée à la Fig. 5.88. Pour afficher plusieurs collectionneurs, ce type de diagramme n'est pas informatif.

Nombres. offre deux options de la zone de graphique: Surface (Carré) et sa version en vrac 3D Zone (zone tridimensionnelle).


Diagrammes multi-niveaux

Multi-niveau Le diagramme vous permet de comparer visuellement les sommes de plusieurs valeurs à plusieurs points, tout en montrant la contribution de chaque valeur dans le montant total.

Exemple 5.Construisez des diagrammes multi-niveaux basés sur une table de l'exemple 2.

Nombres.offre six variantes d'un tableau multi-niveaux: Colonne empilée.(Colonnes multi-niveaux) et sa version en vrac Colonne 3D empilée(Colonnes multi-niveaux en trois dimensions), Barre empilée.(Histogramme multi-niveaux) et Barre 3D empilée.(Histogramme multi-niveaux en trois dimensions), Zone empilée(Zone multi-niveaux) et Zone 3D empilée(Zone multi-niveaux en trois dimensions).

Cependant, le diagramme circulaire n'assure pas toujours la visibilité nécessaire de la présentation d'informations. Tout d'abord, dans un cercle, il peut y avoir trop de secteurs. Deuxièmement, tous les secteurs peuvent être approximativement de la même taille. Ensemble, ces deux raisons font un diagramme circulaire d'une ardoise.

2.Tableau d'étoile (histogramme) - Il sert à comparer plusieurs quantités à plusieurs points.

Les diagrammes d'étoiles (comme suit du nom) se composent de colonnes. La hauteur de la colonne est déterminéevaleurs des valeurs comparées . Chaque colonne est liée àpoint de support .

3.Diagramme linéaire (graphique) -Il sert à tracer les modifications de plusieurs valeurs pendant la transition d'un point à un autre.

La construction d'un diagramme linéaire est similaire à la construction d'une colonne. Mais au lieu des colonnes, leur hauteur est simplement marquée (points, tirets, croix) et les marques obtenues sont reliées par des lignes droites. Au lieu de différentes éclosions (colonnes), différentes marques (rhombiques, triangles, croix, etc.) sont utilisées, différentes épaisseurs et types de lignes (solides, pointillées, etc.), couleur différente.

4. Diagramme Yarus (Histogramme d'accumulation) - Vous permet de comparer visuellement les sommes de plusieurs valeurs à plusieurs points, tout en montrant la contribution de chaque valeur dans le montant total.

L'ordre de construire un diagramme à palangre est très similaire à l'ordre de construire un graphique de la colonne. La différence est que les colonnes du diagramme à la palier ne sont pas placées à côté de l'autre, mais une sur une autre. En conséquence, les règles de calcul de la taille verticale et horizontale du diagramme sont modifiées.

5. Diagramme régional (diagramme) - Le diagramme nucléaire hybride avec un linéaire vous permet de retracer simultanément le changement de chacune des rares valeurs et de la modification de leur somme à plusieurs points.

Les colonnes séparées fusionnent, formant des zones continues. D'où le nom - diagramme de zones ou de diagramme de zone. Chaque zone correspond à une sorte de valeur unique, d'indiquer quels diverses couvertures sont utilisées (coloration). Auparavant, les niveaux étaient situés des colonnes, désormais - lignes (et zone décrite).

    Formatage des cellules. Le format des nombres B. Microsoft Excel..

Le formatage dans Excel est utilisé pour faciliter la perception des données, qui joue un rôle important dans la productivité du travail.

Afin d'attribuer le format, vous devez procéder comme suit:

2. Sélectionnez la commande "Format" - "Cell" (Ctrl + 1).

3. Dans la boîte de dialogue qui apparaît, entrez les paramètres de formatage souhaités.

4. Appuyez sur le bouton "OK".

La cellule formatée enregistre son format jusqu'à ce qu'un nouveau format soit appliqué à celui-ci ou que l'ancien ne sera pas supprimé. Lorsque vous entrez la valeur dans la cellule, le format est utilisé.

Pour supprimer le format, vous devez procéder comme suit:

1. Sélectionnez la cellule (plage de cellules).

2. Sélectionnez la commande "Modifier" - "Effacer" - "Formats".

3. Pour éliminer les valeurs dans les cellules, sélectionnez la commande "TOUT" "CLEAR".

Il convient de garder à l'esprit que lors de la copie de la cellule, ainsi que de son contenu, le format de cellule est copié. Ainsi, vous pouvez gagner du temps en formatant la cellule source avant d'utiliser la copie et insérer des commandes.

Le formatage peut également être produit à l'aide de barres d'outils. Les commandes de formatage les plus fréquemment utilisées sont transférées dans la barre d'outils "Formatage". Pour appliquer le format à l'aide du bouton Barre d'outils, sélectionnez la cellule ou la plage de cellules, puis appuyez sur le bouton de la souris. Pour supprimer le format, cliquez sur le bouton répété.

Pour copier rapidement des formats de cellules sélectionnées sur d'autres cellules, vous pouvez utiliser le "formatage" "format" "format".

Le formatage peut être appliqué pour séparer les symboles textuels de la cellule de la même manière que la cellule entière. Pour ce faire, sélectionnez les caractères souhaités, puis sélectionnez la commande "Cell" dans le menu "Format". Ensuite, définissez les attributs souhaités et cliquez sur le bouton "OK". Appuyez sur la touche Entrée pour voir les résultats de votre travail.

Définition du format des nombres dans Excel

Comme programme Excel Conçu pour le traitement des nombres, la configuration correcte de leur format joue un rôle important. Pour une personne, le numéro 10 est juste une unité et zéro. Du point de vue de l'Excel, ces deux chiffres peuvent transporter une information totalement différente selon qu'elle indique le nombre d'employés de la société, la valeur monétaire, le pourcentage de l'ensemble ou du fragment des "10 principales entreprises". Dans les quatre situations, ce nombre doit être affiché et traité de différentes manières. Excel prend en charge les formats de données suivants:

* Commun - Texte I. valeurs numériques type arbitraire; * Numérique - Les plus. voie générale représentations de nombres; * Monétaire - valeurs de l'argent; * Financier - valeurs de l'argent avec l'alignement sur le séparateur de l'ensemble et de la fraction; * Date - date ou date et heure; * Temps - heure ou date et heure; * Pourcentage - la valeur de la cellule multipliée par 100 avec le symbole "%" à \u200b\u200bla fin; * Fractionnaire - fractions rationnelles avec un numérateur et un dénominateur; * Exponentiel - décimal nombres fractionnaires; * Texte - Les données de texte sont affichées de la même manière que les lignes sont entrées et traitées, quel que soit leur contenu; * Supplémentaire - formats pour travailler avec des bases de données et des listes d'adresses; * Personnalisé - Le format est personnalisable par l'utilisateur.

Les options de format de données les plus courantes peuvent être attribuées à l'aide de la barre d'outils de formatage.

1. Cliquez sur la cellule C4, puis sur le bouton. Format de pourcentage. La valeur de la cellule C4 sera multipliée par 100 et le signe "%" sera ajouté à celui-ci.

Figure. 9.14. Onglet de sélection du format de données

2. Appuyez sur Down et cliquez sur le bouton. Format de l'argent.

3. Cliquez sur la cellule SAT, puis sur le bouton Format avec séparateurs. Ce bouton provoque l'alignement des numéros dans la colonne du séparateur des parties entières et fractionnaires.

4. Sélectionnez la cellule C7 et cliquez sur le bouton. Augmenter. Ce bouton ne change pas le format principal, mais ajoute un signe dans la partie fractionnée du nombre.

5. Appuyez sur la touche Entrée et cliquez sur le bouton. Réduire. Cette opération supprime un morceau de partie fractionnée et arrondit le nombre. Maintenant, les cellules avec C4 sur C9 ont l'air complètement différente, bien que, à une fois, les mêmes numéros y avaient été introduits. Les autres formats sont attribués à l'aide des actions suivantes.

6. Cliquez sur la cellule C10 et sélectionnez la commande. Format\u003e cellules.

7. Dans la boîte de dialogue qui s'ouvre, développez l'onglet. Nombre (Fig. 9.14).

8. Dans la liste Formats numériques Cliquez sur l'élément Date.

9. Dans la liste qui apparaît Un type Cliquez sur la ligne 14 mars 01 (14-Mar-01). Puis cliquez sur le bouton d'accord.

Figure. 9.15. Divers formats de nombres

10. De même, attribuez un format exponentiel avec une cellule C11 et la cellule C12 est un format numérique. Maintenant, la table ressemblera à ceci (Fig. 9.15). Notez que la valeur moyenne du tableau n'a pas changé, c'est-à-dire lorsque le format est modifié, seule la méthode d'affichage change et que les valeurs numériques elles-mêmes restent inchangées. Pour vérifier ce fait, procédez comme suit.

11. Double-cliquez sur la cellule C11 et modifiez le montant 03.01.1900 à 03.02.1900.

12. Appuyez sur la touche Entrée. La valeur moyenne du tableau (qui est affichée dans le format monétaire) change instantanément de 15,41. Comment se connecter, vous pouvez résumer les dates avec intérêt et résultant d'obtenir des roubles. Ceci est un exemple typique de formats de données incorrects.

    Protection de la feuille. Protection des cellules dans Microsoft Excel.

    Autoformats et styles dans Microsoft Excel.

    En utilisant le formatage conditionnel dans Microsoft Excel.

    Création d'une liste et de formes de données dans Microsoft Excel. Conditions requises pour faire une liste.

    Tri et filtrage des données dans Microsoft Excel (autofiltre, filtre avancé).

    Groupement et données de franchissement de Microsoft Excel.

    Résultats automatiques: Création d'une table finale, reflétée sur l'écran de résultat dans le contexte d'un ou plusieurs groupes d'enregistrements.

    Créature sommaire dans Microsoft Excel. (Dans ordinateurs portables)

    Liaison et consolidation des données. (dans cahier)

    Les concepts de la théorie des bases de données. Principes de l'organisation de données.

    Modèles hiérarchiques et réseau d'organisation de données.

    Modèle relationnel de l'organisation de données. Formes normales.

    Les concepts des systèmes de contrôle de la BD (SGMS) et de leur objectif.

    Systèmes de gestion de base de données professionnels (SGBD).

    Affectation, ordre de travail, création de bases de données MS Access.

    Tables MS Access Base de données: Objet, Structure, Options de création.

    Types de données et propriétés des champs DBMS d'accès MS Access.

    Le concept d'un domaine, d'un attribut, d'une clé de base de données relationnelle.

    Création d'une structure de connexions entre les tables de base de données.

    Types de relations et de restrictions dans le DBMS MS Access.

    Concepts, rendez-vous et propriétés des formulaires.

    Options pour créer des formulaires. En utilisant le maître maître.

    Travailler avec designeurs de formulaires. Sections de forme.

    Utilisation d'expressions et de champs calculés.

    Types de contrôles de forme.

    Objet, types et options pour la création de demandes.

    L'ordre de travailler avec le concepteur de demande.

    Filtrage et tri des données dans les requêtes.

    Utilisez des opérateurs et des conditions dans les requêtes.

    Création de champs calculés, associations dans les requêtes.

    Procédure de travail avec des demandes multi-emplois.

    Requêtes finales. Opérations de groupe dans l'accès MS.

    Changer d'informations à l'aide de demandes de modification.

    Affectation et façons de créer des rapports d'accès MS.

    En utilisant un magicien pour créer un rapport.

    Travailler avec le concepteur de rapports.

    Regroupement des données et des résultats intermédiaires dans les rapports.

    Macros dans l'accès et leur conception.

    Protection des informations dans des bases de données.

    Classification réseaux informatiques. Concept de serveur, postes de travail.

    Logiciel pour travailler dans les réseaux locaux et sur Internet.

    Exchange de données dans les réseaux, Protocoles. Matériel réseau. Communication entre les réseaux. Réseaux sans fil.

    Internet, structure de réseau, concepts de base. Services Internet.

    Principes de recherche d'informations.

    Indexation et moteur de recherche.

    Schéma de système de récupération de l'information. Stratégies de recherche. Interface.

    Programmes antivirus et leur classification.

    Principes fondamentaux de la protection des informations et des informations constituant un secret d'État.

    Façons de protéger les programmes et les données.

    Équipement de protection du matériel.

Les critères paramétriques que nous avons envisagés jusqu'à présent sont basés sur le fait que les échantillons comparés peuvent être caractérisés par deux paramètres: écart moyen et type (ou une autre mesure de la variabilité). Et que se passe-t-il si la distribution dans des échantillons (ou, plus précisément, dans l'ensemble général, où ces échantillons sont venus de) est complètement différent?

Si le nombre de chacun des échantillons compatibles est suffisamment grand (plus de cent), des critères paramétriques peuvent être utilisés quand même. Quelle que soit la répartition ces échantillons, leur moyenne «comportement» est approximativement identique à celle des échantillons moyens ayant une distribution normale. Cependant, si la taille des échantillons est inférieure, des critères non paramétriques doivent être utilisés.

Par exemple, un analogue non paramétrique du critère T Étudiant est le critère U Mann-Whitney. Le critère de l'étudiant est basé sur la distribution, qui décrit les écarts de la valeur d'échantillonnage moyenne d'un certain nombre autour du modérateur général de la valeur normalement distribuée. Plus la déviation est forte, plus la probabilité qu'elle soit dû à l'accident lors de la formation d'un échantillon. Et comment agir, si nous ne savons rien de la nature de la distribution d'agrégats généraux?

Considérez un exemple assez simple expliquant la manière dont un grand groupe de méthodes non paramétriques fonctionne des critères de classement. Nous avons deux échantillons. Placez leurs éléments en ordre croissant: d'abord - A1, A2, A3, A4, A5; Deuxièmement - B1, B2, B3, B4, B5, B6. Nous allons constituer les éléments de ces échantillons, une plage commune construite dans l'ordre d'accroître leurs valeurs. Comparez trois cas différents:
N ° 1: A1, A2, A3, A4, A5, B1, B2, B3, B4, B5, B6;
N ° 2: A1, A2, A3, A4, B1, A5, B2, B3, B4, B5, B6;
N ° 3: B1, A1, B2, A2, B3, A3, B4, B5, A4, A5, B6.

Dans le cas numéro 1, tous les éléments d'un échantillon sont situés sur un côté du total et tous les éléments d'une autre rangée - d'autre part. Dans le cas du n ° 2 d'une permutation (éléments B1 et A5), il suffirait que l'ordre des éléments ait commencé, comme dans le cas du numéro 1. Enfin, dans le cas no 3, les éléments de deux Les échantillons sont confus et pour les construire d'une rangée, où ils seront d'abord rester seuls et ensuite - d'autres, il est nécessaire de faire 5 permutations. Nous devons choisir entre une hypothèse alternative (selon laquelle les échantillons A et B sont prélevés à partir de différents agrégats) et zéro hypothèse (selon laquelle ces échantillons sont extraits de la même compatibilité). La probabilité d'alternative et zéro hypothèse pour trois cas différents montrés par nous? Pas; Une hypothèse alternative est plus probable dans le premier cas et zéro - dans la troisième.

L'idée d'un critère de rang non paramétrique est que nous pouvons utiliser le nombre de permutations requises comme mesure pour évaluer l'hypothèse zéro et alternative. Des valeurs spécifiques calculées lors de l'application de critères non paramétriques sont différentes, mais la logique de comparaison correspond approximativement à l'exemple considéré par nous.

Donc, grâce à l'utilisation d'approches spirituelles, leurs analogues non paramétriques sont sélectionnés pour les méthodes de comparaison des échantillons paramétriques (tableau 4.8.1). Le plus souvent, les méthodes non paramétriques ont moins de puissance (c'est-à-dire que c'est plus souvent rejeter une hypothèse alternative dans la situation lorsqu'elle est réellement vraie), mais il vous permet de travailler avec une variété de données distribuées et moins sensible au petit nombre. des échantillons comparés.

Tableau 4.8.1. Analogues non paramétriques de méthodes paramétriques

Type de comparaison

Méthodes paramétriques

Méthodes non paramétriques

Comparaison des valeurs de grandeur dans deux échantillons indépendants

t-critère de l'étudiant;
Analyse de dispersion (ANOVA)

U-critère mann-whitney;
Critère de la série Wald-Wolfovitsa;
Critère à deux décharges de Kolmogorov-Smirnova

Comparaison des valeurs de grandeur dans deux échantillons dépendants

Étudiant en T-critère pour comparaisons de paires

Critère des signes
Critère de Vilkoxon

Comparaison des valeurs de grandeur dans plusieurs échantillons indépendants

Analyse de dispersion (ANOVA)

Analyse de la dispersion de la plage de Kraklala-Wallis;

Test médian

4.9 U-critère mann-whitney

Pour envisager l'application du critère de Mann-Whitney sur notre exemple de fichier Pophylax_example.sta, nous devrons utiliser un exemple artificiel multiple. À titre d'exemple de valeur, la distribution est très différente de la normale, nous pouvons utiliser un signe appelé ADN - la teneur en ADN par cellule (dans les picogrammes, PG), mesurée à l'aide de la cytométrie d'ADN fluide.

Figure. 4.9.1. Le signe "ADN" a une distribution, fortement différente de la normale

Découvrez si la signification de ce signe de femmes et de mâles diffère Pélophylax Esculentus.. Pour tirer parti du critère de Mann-Whitney, allons au menu Statistiques / NonParameRics. Faites attention aux pictogrammes dans le menu: ils correspondent à ceux utilisés pour des comparaisons similaires à l'aide du test T.

Figure. 4.9.2. U-critère Mann-Whitney est calculé ici

Dans la boîte de dialogue, vous devez spécifier les variables dépendantes (à charge) et regroupant; Si la variable de regroupement comporte plus de deux valeurs, vous devez sélectionner ces deux valeurs qui comparent les échantillons comparés. Choisir seulement des représentants Pélophylax Esculentus.Nous utilisons la fenêtre Sélectionner des cas et utilisons des désignations textuelles numériques saisies au paragraphe 3.1, lors de la description du fichier exemple.

Figure. 4.9.3. Installations sélectionnées pour la comparaison décrite

Vous pouvez voir que la statistica calcule les trois mentionnés dans le tableau. 4.9.1. Critères utilisés pour comparer deux échantillons indépendants, mais "recommande" (commence à partir du bouton situé à gauche coin supérieur) Critère de Mann-Whitney. Je le calculez et assurez-vous que les différences entre les femelles et les hommes dans le nombre d'ADN survenant sur la cellule sont statistiquement insignifiantes.

Figure. 4.9.4. Le résultat de la comparaison sur Manna-Whitney

Si nous ne sommes pas intéressés par un critère à sens unique, il est conseillé d'utiliser la valeur P calculée avec l'amendement (qui est après la colonne "Z ajustée, c'est-à-dire 0,906780). Cet amendement augmente le pouvoir de critère en cas d'échantillons, Le nombre dont dépasse 20. Donc, autrement, aucune différence significative entre les hommes et les femmes n'a été trouvée.

Le dialogue que nous avons utilisé à la comparaison sur Manno-Whitney offre la possibilité de construire des boîtes. Puisque nous utilisons une méthode non paramétrique, les paramètres d'échantillon ne sont pas piégés sur le graphique (par exemple, sa valeur moyenne) et des mesures non paramétriques sont utilisées - Médian et Quartile (valeurs, "Tranchement" dans la quatrième partie de la Distribution).

Figure. 4.9.5. Comparaison graphique des signes ADN de distributions pour les femelles et les hommes Pélophylax Esculentus.

Il peut sembler étrange pourquoi le premier (de min à 25%) et le dernier (de 75% à max) est donc déjà le deuxième et troisième? Pour comprendre cela, nous construisons un histogramme catégorisé.

Figure. 4.9.6. Histogramme, montrant les valeurs de distribution de la signification de l'ADN, enregistrée pour les femmes et les hommes Pélophylax Esculentus.

Il devient clair que la propriété des distributions présentées dans le dessin précédent des distributions est une conséquence de la bimodalité de la fonctionnalité à l'étude.

4.10. Critère des signes de comparaison de paires

Dans notre exemple de fichier Pelophylax_example.sta, aucune donnée nécessite une comparaison des valeurs de deux échantillons connectés, de sorte que nous les créons artificiellement. Imaginez que l'échantillon de 25 grenouilles mesuré deux personnes. Leurs résultats de mesure sont dans les première et deuxième colonnes. La distribution dimensionnelle de cet échantillon était à l'origine loin de la normale.

Figure. 4.10.1. Distribution de grenouilles (0,1 mm) selon les mesures faites par deux personnes sur le même matériau

Cependant, pour de nombreux grenouilles, les résultats des mesures effectuées par le premier et le deuxième chercheur diffèrent. Notre tâche consiste à déterminer si la durée des grenouilles est mesurée de deux chercheurs. Pour rechercher une réponse à cette question, nous utilisons le critère des signes.

Figure. 4.10.2. Utilisation de critères de signalisation pour comparer les résultats de mesure effectués par deux chercheurs différents

Le critère des signes détermine simplement la proportion de cas dans lesquels la valeur d'un échantillon est supérieure à la valeur d'un autre échantillon.

Figure. 4.10.3. Les différences sont statistiquement significatives!

Nous pouvons établir que le deuxième chercheur statistiquement significativement plus souvent les résultats de mesure par rapport au premier chercheur.

Comparez le résultat obtenu avec le résultat de l'utilisation de la méthode paramétrique - le critère T pour les échantillons appariés.

Figure. 4.10.4. La méthode paramétrique donnait le même résultat, mais avec une fiabilité légèrement supérieure

La valeur inférieure P, déterminée par critère paramétrique, est parfaitement compatible avec le fait ci-dessus que les méthodes paramétriques ont une plus grande puissance que non paramétrique. Mais avons-nous gouverné le critère paramétrique? En fait, avec compétence. Les comparaisons appariées considèrent pas une totalité de valeurs dans le premier et deuxième échantillon et la différence pour chaque élément entre le premier et le second échantillon. Nous construisons la distribution de la différence entre les échantillons de première et seconde.

Figure. 4.10.5. Distribution de la différence entre les mesures de deux chercheurs

On peut constater que la déviation de la distribution de la différence entre les deux dimensions de la normale est statistiquement insignifiante. L'utilisation du test paramétrique était complètement éligible.

Et pourrions-nous utiliser des méthodes pour comparer des échantillons indépendants? Dans le cas de la comparaison d'échantillons indépendants, la répartition des intérêts des intérêts pour nous est très différente de la normale, elle s'avère importante. Ainsi, nous devons utiliser un critère non T, mais un critère U. Afin d'utiliser le critère U Mann-Whitney U, le fichier de données devra reconstruire: toutes les mesures doivent être dans la même colonne et la deuxième colonne deviendra grouper.

Figure. 4.10.6. Selon Mannu-Whitney, les résultats des mesures fabriqués par deux personnes différentes ne diffèrent pas

Comment expliquer une telle différence? Comme dans de nombreux autres cas, la première chose à faire en cas de malentendus - Il est nécessaire de regarder la distribution de l'ampleur de l'intérêt pour nous.

Figure. 4.10.7. La distribution des résultats de mesure effectuée par deux personnes est presque la même. Mais, après tout, selon la Fig. 4.10.3, pour des grenouilles de 75%, les résultats de la mesure de la deuxième chercheuse sont importants que les résultats de la mesure du premier chercheur!

Bien sûr, le résultat obtenu est assez naturel. Utilisation du critère de Mann-Whitney au lieu de critères de signes (ou critère de Wilcoxon), nous avons perdu informations crucialesCe qui caractérise les modèles d'évolution de la valeur considérée.

Au fait, les données que nous avons utilisées ont été générées artificiellement. La première colonne était un fragment du fichier Pelophylax_Example.sta, où ils étaient surtout les individus les plus petits et les plus grands, et la deuxième colonne a été obtenue à l'aide de la formule \u003d trunc (premier 2,4 + RND (8)). Comprenez-vous quoi et comment "fait" cette formule?

4.11. Analyse de la dispersion de la plage de Kraklala-Wallis

Jusqu'au temps de passage, nous utilisions uniquement des comparaisons de paires d'échantillons. Maintenant, nous examinerons la méthode qui vous permettra de comparer les uns avec les autres en même temps plusieurs échantillons. Le test Kraklala Wallis est un analogue non paramétrique de l'analyse de dispersion (ANOVA), qui est discuté en détail dans la section suivante de notre avantage. D'un point de vue informatique, il s'agit d'une généralisation multidimensionnelle de la pâte mann-whitney. Bien que le test d'actif-wallis soit à certains égards et est inférieur à l'analyse de la dispersion (par exemple, il ne permet pas simultanément d'évaluer les actions de deux ou suite Facteurs), c'est un outil puissant qui convient à la résolution de nombreuses tâches.

Nous montrons l'action du test Kraklala Wallis sur l'exemple de notre fichier PelophyLax_Example.sta (voir clause 3.1). Nous devons savoir si des représentants de différents génotypes sont distingués sur la longueur de la booke de guérison interne statistiquement significative. Il s'agit d'une tâche complètement significative, car la taille et la forme de la bookogue de guérison interne constituent une caractéristique de diagnostic importante utile pour déterminer formes différentes Grenouilles vertes.

Figure. 4.11.1. Faites attention à l'icône sélectionnée correspondant à la comparaison de plusieurs groupes indépendants

Naturellement, la variable dépendante est la longueur du faisceau de talon (CI) et le groupement est le génotype.

Figure. 4.11.2. Les installations sont sélectionnées. Si vous devez comparer toutes les valeurs de la variable de regroupement, vous devez utiliser la boîte de dialogue qui appelle le bouton Code.

En cliquant sur le bouton Résumé, vous recevrez les résultats de deux tests à la fois: analyse de dispersion non paramétrique du test de peinture et de test médian, basé sur la méthode Pearson. L'utilisation de Lire plus est discutée dans l'un des chapitres suivants de ce manuel, et il suffit ici de dire que cette méthode est utilisée pour une comparaison non paramétrique des distributions. Si la distribution de la valeur dépendante pour différents groupes isolés par la valeur de la fonction de regroupement est différente, cela suggère que le groupement et la variable dépendante sont connectés. Méthode de Spravel Wallis, comme vous vous en souvenez, fait référence à des méthodes non paramétriques classiques. Ces deux méthodes fonctionnent sur principes différents Et souvent donner des résultats très différents.

Figure. 4.11.3. Les deux méthodes démontrent statistiquement influence significative Regroupement la variable sur la variable dépendante. La méthode Mask-Wallis donne p \u003d 0,0047 et le test médian - p \u003d 0,0112

Remarque: en vertu de certains snobbers incompréhensibles dans certaines fenêtres du programme Statistica 0 avant le séparateur décimal (avec les paramètres utilisés système opérateur - Sein) n'est pas mis.

En cliquant sur les multiples comparaisons des rangs moyens pour tous les groupes, vous pouvez obtenir les résultats d'une comparaison par paire de tous les groupes. En fait, cela équivaut à une comparaison de Mann-White pour toutes les paires de groupes possibles. Le programme affiche deux fenêtres: les valeurs de la valeur Z utilisée dans les calculs de Mannu-White et calculées pour chaque paire du niveau de signification statistique des différences.

Figure. 4.11.4. Les comparaisons parentales des groupes de la boîte de dialogue Kraklala Wallis sont équivalentes à plusieurs comparaisons utilisant le critère Mann-Whitney

Notez que lors de la réalisation de plusieurs comparaisons, le danger de l'erreur statistique est venu de faire une erreur statistique (adopter une hypothèse alternative à la fois lorsque le zéro est vrai). Pour éviter ce danger, vous devez utiliser l'amendement décrit ci-dessus sur plusieurs comparaisons.

Enfin, le bouton Box & Whisker permet de comparer les distributions de différents groupes.

Figure. 4.11.5. Comparaison des distributions de la longueur du faisceau de talon de représentants de différents génotypes

Un autre des boutons "graphique" du dialogue en cours de discussion permet de construire des histogrammes catégorisés pour les groupes comparés; Du point de vue de l'auteur, cette méthode de résultats de sortie est moins visuelle.

2

J'ai écouté une conférence sur la mesure de la performance de l'ordinateur et le professeur a donné une analogie avec des performances de mesure des aéronefs. Il a montré une table contenant divers paramètres d'aéronefs différents, tels que:

Aircrafts: Vitesse de capcité de passagers Concord 132 1350 mph DC9 146 544 mph

puis il a posé des questions d'étudiants qui " Comment plus rapide du concor par rapport à DC9? ". Il l'a ensuite expliqué plus de 2 fois. Ma question: Pourquoi a-t-il utilisé la division pour comparer deux valeurs et non soustrait? Je connais sa question très fondamentale, mais s'il vous plaît, désolé mon incompétence pour cela.

0

Parfois, vous devez utiliser le ratio pour décrire les phénomènes, par exemple la probabilité de gagner le jeu. Parfois, il est facultatif, comme dans votre cas. Vous pouvez le trouver intéressant: https: //fr.wikipedia.org/wiki/relative_change_and_diffence - Aucune chance. 06 mars 16 2016-03-06 17:40:56.

  • 2 Réponse
  • Tri:

    Activité

0

J'ai posté la même question sur Dr.Maths et j'ai reçu la réponse suivante, qui, à mon avis, est plus précise et plus détaillée.

Demandez-vous ce qui serait plus significatif pour vous: le Concord est 806 mph plus rapide que le DC9. Le Concord est 2,5 fois plus rapide que le DC9. Si vous n'avez aucune idée de la rapidité avec laquelle il ne reste plus de sens - vous ne pouvez pas savoir si c'est juste une petite amélioration (de, disons 100 000 mph à 100 806 mph!) Ou une amélioration énorme (de 10 mph à 816 mi / h). J'exagère pour faire un point: interpréter la signalisation du nombre dépend de la signification du nombre de dépendances du nombre de nombres connexes. Le ratio, d'autre part, ne nécessite aucune bonne connaissance. Aussi, et peut-être encore plus important, le ratio sera Soyez la même quelle que soit les unités utilisées. Nous n'avons pas besoin de savoir si les vitesses ont été mesurées en mph ou kPH ou en pouces par seconde. En effet, le ratio revient à utiliser le DC9 lui-même comme une unité de mesure - la Concord vole à 2,5 DC9 "La même chose est probablement vraie dans la comparaison des vitesses de l'ordinateur. Qui sait, ces jours-ci, quelle est une bonne vitesse? Mais quiconque Peut dire que deux fois plus vite est beaucoup mieux. C'est quelque chose que nous pouvons visualiser beaucoup mieux que les nanosecondes ou les gigaoctets!

1

Considérez la situation - j'ai mangé des pommes de 1 000 $. Mon ami a mangé des pommes de 1050 $.

Deux déclarations Mon ami a mangé 50 $ pommes plus que moi de la différence Mon ami a mangé 1 05 $ Pommes comme moi Du ratio.

Considérez une autre situation lorsque je mange des pommes de 100 $ et mon ami 105 $

Deux déclarations seront Mon ami a mangé 5 $ pommes plus que moi et
Mon ami a mangé 1,05 $ fois plus de pommes comme moi

Le troisième que j'ai mangé avec des situations $ 1 $ Apple, mon ami mange 51 $

deux déclarations - Mon ami a mangé 50 $ pommes plus - et
Mon ami a mangé 51 $ aujourd'hui un certain nombre de pommes comme moi

Conclusion - Nous avons clairement besoin de différence et d'une attitude de connaître la situation. Cependant, nous utilisons différentes choses dans différents scénarios qui, comme j'espère, sont claires de l'exemple ci-dessus.



Avez-vous aimé l'article? Partagez-le