Menu

Indicateurs de variation : concept, types, formules de calcul. Exemples de résolution de problèmes

Appareil de voiture

La dispersion est une mesure de dispersion qui décrit l'écart comparatif entre les valeurs des données et la moyenne. Il s'agit de la mesure de dispersion la plus utilisée en statistique, calculée en additionnant et en mettant au carré l'écart de chaque valeur de données par rapport à la moyenne. La formule de calcul de la variance est donnée ci-dessous :

s 2 – variance de l'échantillon ;

x av : moyenne de l'échantillon ;

n taille de l'échantillon (nombre de valeurs de données),

(x i – x moy) est l’écart par rapport à la valeur moyenne pour chaque valeur de l’ensemble de données.

Pour mieux comprendre la formule, regardons un exemple. Je n’aime pas vraiment cuisiner, donc je le fais rarement. Cependant, pour ne pas mourir de faim, je dois de temps en temps aller aux fourneaux pour mettre en œuvre le plan de saturer mon corps en protéines, graisses et glucides. L'ensemble de données ci-dessous montre combien de fois Renat cuisine chaque mois :

La première étape du calcul de la variance consiste à déterminer la moyenne de l'échantillon, qui dans notre exemple est de 7,8 fois par mois. Le reste des calculs peut être facilité à l’aide du tableau suivant.

La phase finale du calcul de la variance ressemble à ceci :

Pour ceux qui aiment faire tous les calculs en une seule fois, l’équation ressemblerait à ceci :

Utilisation de la méthode de comptage cru (exemple de cuisson)

Il y a plus moyen efficace calcul de la variance, dit méthode du « comptage brut ». Même si l’équation peut paraître assez lourde à première vue, elle n’est en réalité pas si effrayante. Vous pouvez vous en assurer, puis décider quelle méthode vous préférez.

est la somme de chaque valeur de données après mise au carré,

est le carré de la somme de toutes les valeurs des données.

Ne perdez pas la tête pour le moment. Mettons tout cela dans un tableau et vous verrez qu'il y a moins de calculs impliqués que dans l'exemple précédent.

Comme vous pouvez le constater, le résultat était le même qu’avec la méthode précédente. Les avantages de cette méthode deviennent évidents à mesure que la taille de l’échantillon (n) augmente.

Calcul d'écart dans Excel

Comme vous l'avez probablement déjà deviné, Excel dispose d'une formule qui vous permet de calculer la variance. De plus, à partir d'Excel 2010, vous pouvez trouver 4 types de formules d'écart :

1) VARIANCE.V – Renvoie la variance de l'échantillon. Les valeurs booléennes et le texte sont ignorés.

2) DISP.G - Renvoie la variance de la population. Les valeurs booléennes et le texte sont ignorés.

3) VARIANCE - Renvoie la variance de l'échantillon, en tenant compte des valeurs booléennes et textuelles.

4) VARIANCE - Renvoie la variance de la population, en tenant compte des valeurs logiques et textuelles.

Tout d’abord, comprenons la différence entre un échantillon et une population. Le but des statistiques descriptives est de résumer ou d’afficher les données de manière à fournir des informations rapides. grande image, pour ainsi dire, une critique. L'inférence statistique vous permet de faire des déductions sur une population sur la base d'un échantillon de données de cette population. La population représente tous les résultats ou mesures possibles qui nous intéressent. Un échantillon est un sous-ensemble d’une population.

Par exemple, nous nous intéressons à un groupe d’étudiants d’une des universités russes et nous devons déterminer la note moyenne du groupe. Nous pouvons calculer la performance moyenne des étudiants, et le chiffre obtenu sera alors un paramètre, puisque toute la population sera impliquée dans nos calculs. Cependant, si nous voulons calculer la moyenne cumulative de tous les étudiants de notre pays, alors ce groupe constituera notre échantillon.

La différence dans la formule de calcul de la variance entre un échantillon et une population est le dénominateur. Où pour l'échantillon il sera égal à (n-1), et pour la population générale seulement n.

Voyons maintenant les fonctions de calcul de la variance avec les terminaisons UN, dont la description indique que le texte et les valeurs logiques sont pris en compte dans le calcul. Dans ce cas, lors du calcul de la variance d'un ensemble de données particulier où apparaissent des valeurs non numériques, Excel interprétera le texte et les fausses valeurs booléennes comme égales à 0, et les vraies valeurs booléennes comme égales à 1.

Ainsi, si vous disposez d'un tableau de données, calculer sa variance ne sera pas difficile en utilisant l'une des fonctions Excel répertoriées ci-dessus.

Espérance mathématique (valeur moyenne) variable aléatoire X donné sur un espace de probabilité discret est appelé le nombre m =M[X]=∑x i p i si la série converge absolument.

Objet de la prestation. Utiliser le service en ligne l'espérance mathématique, la variance et la moyenne sont calculées écart type (voir exemple). De plus, un graphique de la fonction de distribution F(X) est tracé.

Propriétés de l'espérance mathématique d'une variable aléatoire

  1. L'espérance mathématique d'une valeur constante est égale à elle-même : M[C]=C, C – constante ;
  2. M=CM[X]
  3. L'espérance mathématique de la somme des variables aléatoires est égale à la somme de leurs espérances mathématiques : M=M[X]+M[Y]
  4. L'espérance mathématique du produit de variables aléatoires indépendantes est égale au produit de leurs espérances mathématiques : M=M[X] M[Y] , si X et Y sont indépendants.

Propriétés de dispersion

  1. La variance d'une valeur constante est nulle : D(c)=0.
  2. Le facteur constant peut être retiré sous le signe de dispersion en le mettant au carré : D(k*X)= k 2 D(X).
  3. Si les variables aléatoires X et Y sont indépendantes, alors la variance de la somme est égale à la somme des variances : D(X+Y)=D(X)+D(Y).
  4. Si les variables aléatoires X et Y sont dépendantes : D(X+Y)=DX+DY+2(X-M[X])(Y-M[Y])
  5. La formule de calcul suivante est valable pour la dispersion :
    D(X)=M(X2)-(M(X))2

Exemple. Les attentes mathématiques et les variances de deux variables aléatoires indépendantes X et Y sont connues : M(x)=8, M(Y)=7, D(X)=9, D(Y)=6. Trouvez l'espérance mathématique et la variance de la variable aléatoire Z=9X-8Y+7.
Solution. Basé sur les propriétés de l'espérance mathématique : M(Z) = M(9X-8Y+7) = 9*M(X) - 8*M(Y) + M(7) = 9*8 - 8*7 + 7 = 23 .
Basé sur les propriétés de dispersion : D(Z) = D(9X-8Y+7) = D(9X) - D(8Y) + D(7) = 9^2D(X) - 8^2D(Y) + 0 = 81*9 - 64*6 = 345

Algorithme de calcul de l'espérance mathématique

Propriétés des variables aléatoires discrètes : toutes leurs valeurs peuvent être renumérotées nombres naturels; Attribuez à chaque valeur une probabilité non nulle.
  1. On multiplie les paires une à une : x i par p i .
  2. Ajoutez le produit de chaque paire x i p i .
    Par exemple, pour n = 4 : m = ∑x i p i = x 1 p 1 + x 2 p 2 + x 3 p 3 + x 4 p 4
Fonction de distribution d'une variable aléatoire discrète par étapes, il augmente brusquement aux points dont les probabilités sont positives.

Exemple n°1.

x je 1 3 4 7 9
p je 0.1 0.2 0.1 0.3 0.3

Nous trouvons l'espérance mathématique en utilisant la formule m = ∑x i p i .
Attente M[X].
M[x] = 1*0,1 + 3*0,2 + 4*0,1 + 7*0,3 + 9*0,3 = 5,9
Nous trouvons la variance en utilisant la formule d = ∑x 2 i p i - M[x] 2 .
Écart D[X].
D[X] = 1 2 *0,1 + 3 2 *0,2 + 4 2 *0,1 + 7 2 *0,3 + 9 2 *0,3 - 5,9 2 = 7,69
Écart type σ(x).
σ = carré(D[X]) = carré(7,69) = 2,78

Exemple n°2. Une variable aléatoire discrète a la série de distribution suivante :

X -10 -5 0 5 10
r UN 0,32 2un 0,41 0,03
Trouvez la valeur de a, l'espérance mathématique et l'écart type de cette variable aléatoire.

Solution. La valeur de a se trouve à partir de la relation : Σp i = 1
Σp je = une + 0,32 + 2 une + 0,41 + 0,03 = 0,76 + 3 une = 1
0,76 + 3 a = 1 ou 0,24=3 a , d'où a = 0,08

Exemple n°3. Déterminer la loi de distribution d'une variable aléatoire discrète si sa variance est connue, et x 1 x1 =6 ; x2 =9 ; x3 =x ; x4 =15
p1 = 0,3 ; p2 = 0,3 ; p3 = 0,1 ; p4 =0,3
d(x)=12,96

Solution.
Ici, vous devez créer une formule pour trouver la variance d(x) :
d(x) = x 1 2 p 1 +x 2 2 p 2 +x 3 2 p 3 +x 4 2 p 4 -m(x) 2
où l'espérance m(x)=x 1 p 1 +x 2 p 2 +x 3 p 3 +x 4 p 4
Pour nos données
m(x)=6*0,3+9*0,3+x 3 *0,1+15*0,3=9+0,1x 3
12,96 = 6 2 0,3+9 2 0,3+x 3 2 0,1+15 2 0,3-(9+0,1x 3) 2
ou -9/100 (x 2 -20x+96)=0
En conséquence, nous devons trouver les racines de l’équation, et il y en aura deux.
x3 =8, x3 =12
Choisissez celui qui satisfait à la condition x 1 x3 =12

Loi de distribution d'une variable aléatoire discrète
x1 =6 ; x2 =9 ; x3 =12 ; x4 =15
p1 = 0,3 ; p2 = 0,3 ; p3 = 0,1 ; p4 =0,3

Les principaux indicateurs généralisants de variation des statistiques sont les dispersions et les écarts types.

Dispersion ceci moyenne arithmétique écarts carrés de chaque valeur caractéristique par rapport à la moyenne globale. La variance est généralement appelée carré moyen des écarts et est notée  2. Selon les données sources, la variance peut être calculée à l'aide de la moyenne arithmétique simple ou pondérée :

 variance non pondérée (simple) ;

 variance pondérée.

Écart type c'est une caractéristique généralisatrice des tailles absolues variantes signes dans l’ensemble. Il est exprimé dans les mêmes unités de mesure que l'attribut (en mètres, tonnes, pourcentage, hectares, etc.).

L'écart type est la racine carrée de la variance et est noté  :

 écart type non pondéré ;

 écart type pondéré.

L'écart type est une mesure de la fiabilité de la moyenne. Plus l’écart type est petit, plus la moyenne arithmétique reflète l’ensemble de la population représentée.

Le calcul de l'écart type est précédé du calcul de la variance.

La procédure de calcul de la variance pondérée est la suivante :

1) déterminer la moyenne arithmétique pondérée :

2) calculer les écarts des options par rapport à la moyenne :

3) mettre au carré l'écart de chaque option par rapport à la moyenne :

4) multiplier les carrés des écarts par des poids (fréquences) :

5) résumer les produits obtenus :

6) le montant obtenu est divisé par la somme des poids :

Exemple 2.1

Calculons la moyenne arithmétique pondérée :

Les valeurs des écarts par rapport à la moyenne et leurs carrés sont présentés dans le tableau. Définissons la variance :

L'écart type sera égal à :

Si les données sources sont présentées sous forme d'intervalle série de distribution , vous devez d'abord déterminer la valeur discrète de l'attribut, puis appliquer la méthode décrite.

Exemple 2.2

Montrons le calcul de la variance pour une série d'intervalles à l'aide de données sur la répartition de la superficie ensemencée d'une ferme collective en fonction du rendement du blé.

La moyenne arithmétique est :

Calculons la variance :

6.3. Calcul de la variance à l'aide d'une formule basée sur des données individuelles

Technique de calcul écarts complexe, et avec de grandes valeurs d'options et de fréquences, cela peut être fastidieux. Les calculs peuvent être simplifiés en utilisant les propriétés de dispersion.

La dispersion a les propriétés suivantes.

1. Réduire ou augmenter les poids (fréquences) d’une caractéristique variable d’un certain nombre de fois ne modifie pas la dispersion.

2. Diminuer ou augmenter chaque valeur d'une caractéristique du même montant constant UN ne change pas la dispersion.

3. Diminuer ou augmenter chaque valeur d'une caractéristique d'un certain nombre de fois k respectivement réduit ou augmente la variance de k 2 fois et écart type  dans k une fois.

4. La dispersion d'une caractéristique par rapport à une valeur arbitraire est toujours supérieure à la dispersion par rapport à la moyenne arithmétique par carré de la différence entre la moyenne et les valeurs arbitraires :

Si UN 0, alors on arrive à l’égalité suivante :

c'est-à-dire que la variance de la caractéristique est égale à la différence entre le carré moyen des valeurs caractéristiques et le carré de la moyenne.

Chaque propriété peut être utilisée indépendamment ou en combinaison avec d'autres lors du calcul de la variance.

La procédure de calcul de la variance est simple :

1) déterminer moyenne arithmétique :

2) mettre au carré la moyenne arithmétique :

3) au carré l'écart de chaque variante de la série :

X je 2 .

4) trouver la somme des carrés des options :

5) diviser la somme des carrés des options par leur nombre, c'est-à-dire déterminer le carré moyen :

6) déterminer la différence entre le carré moyen de la caractéristique et le carré de la moyenne :

Exemple 3.1 Les données suivantes sont disponibles sur la productivité des travailleurs :

Faisons les calculs suivants :

Souvent en statistique, lors de l'analyse d'un phénomène ou d'un processus, il est nécessaire de prendre en compte non seulement les informations sur les niveaux moyens des indicateurs étudiés, mais aussi dispersion ou variation des valeurs des unités individuelles , ce qui constitue une caractéristique importante de la population étudiée.

Les plus sujets à variation sont les cours des actions, l’offre et la demande, ainsi que les taux d’intérêt sur différentes périodes et à différents endroits.

Les principaux indicateurs caractérisant la variation , sont la plage, la dispersion, l'écart type et le coefficient de variation.

Plage de variation représente la différence entre les valeurs maximales et minimales de la caractéristique : R = Xmax – Xmin. L'inconvénient de cet indicateur est qu'il évalue uniquement les limites de variation d'un trait et ne reflète pas sa variabilité à l'intérieur de ces limites.

Dispersion n'a pas ce défaut. Il est calculé comme le carré moyen des écarts des valeurs d'attribut par rapport à leur valeur moyenne :

Une manière simplifiée de calculer la variance réalisée à l'aide des formules suivantes (simples et pondérées) :

Des exemples d'application de ces formules sont présentés dans les tâches 1 et 2.

Un indicateur largement utilisé dans la pratique est écart type :

L'écart type est défini comme la racine carrée de la variance et a la même dimension que la caractéristique étudiée.

Les indicateurs considérés permettent d'obtenir la valeur absolue de la variation, c'est-à-dire l'évaluer en unités de mesure de la caractéristique étudiée. Contrairement à eux, coefficient de variation mesure la variabilité en termes relatifs – par rapport au niveau moyen, ce qui est préférable dans de nombreux cas.

Formule de calcul du coefficient de variation.

Exemples de résolution de problèmes sur le thème « Indicateurs de variation des statistiques »

Problème 1 . Lors de l'étude de l'influence de la publicité sur le montant du dépôt mensuel moyen dans les banques de la région, 2 banques ont été examinées. Les résultats suivants ont été obtenus :

Définir:
1) pour chaque banque : a) dépôt moyen par mois ; b) dispersion des contributions ;
2) le dépôt mensuel moyen de deux banques ensemble ;
3) Variation de dépôt pour 2 banques, en fonction de la publicité ;
4) Écart de dépôt pour 2 banques, en fonction de tous les facteurs sauf la publicité ;
5) Variance totale en utilisant la règle d'addition ;
6) Coefficient de détermination ;
7) Relation de corrélation.

Solution

1) Créons une table de calcul pour une banque avec de la publicité . Pour déterminer le dépôt mensuel moyen, nous trouverons les milieux des intervalles. Dans ce cas, la valeur de l'intervalle ouvert (le premier) est conditionnellement égale à la valeur de l'intervalle qui lui est adjacent (le second).

Nous trouverons la taille moyenne du dépôt à l'aide de la formule de moyenne arithmétique pondérée :

29 000/50 = 580 roubles.

On retrouve la variance de la contribution à l'aide de la formule :

23 400/50 = 468

Nous effectuerons des actions similaires pour une banque sans publicité :

2) Trouvons ensemble la taille moyenne des dépôts pour les deux banques. Хср =(580×50+542,8×50)/100 = 561,4 frotter.

3) On trouvera la variance du dépôt pour deux banques, en fonction de la publicité, à l'aide de la formule : σ 2 =pq (formule de variance d'un attribut alternatif). Ici, p=0,5 est la proportion de facteurs dépendant de la publicité ; q=1-0,5, alors σ 2 =0,5*0,5=0,25.

4) Puisque la part des autres facteurs est de 0,5, alors la variance du dépôt pour deux banques, en fonction de tous les facteurs à l'exception de la publicité, est également de 0,25.

5) Déterminez la variance totale à l’aide de la règle d’addition.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 fait + σ 2 reste = 552,08+345,96 = 898,04

6) Coefficient de détermination η 2 = σ 2 fait / σ 2 = 345,96/898,04 = 0,39 = 39 % - le montant de la contribution dépend de la publicité à hauteur de 39 %.

7) Rapport de corrélation empirique η = √η 2 = √0,39 = 0,62 – la relation est assez étroite.

Problème 2 . Il existe un regroupement d'entreprises selon la taille des produits commercialisables :

Déterminer : 1) la dispersion de la valeur des produits commercialisables ; 2) écart type ; 3) coefficient de variation.

Solution

1) Par condition, une série de distributions d'intervalles est présentée. Il doit être exprimé discrètement, c'est-à-dire trouver le milieu de l'intervalle (x"). Dans les groupes d'intervalles fermés, on trouve le milieu à l'aide d'une simple moyenne arithmétique. Dans les groupes avec une limite supérieure - comme la différence entre cette limite supérieure et la moitié de la taille de l'intervalle suivant (200-(400 -200):2=100).

Dans les groupes avec une limite inférieure - la somme de cette limite inférieure et la moitié de la taille de l'intervalle précédent (800+(800-600) :2=900).

Nous calculons la valeur moyenne des produits commercialisables à l'aide de la formule :

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Ici a=500 est la taille de l'option à la fréquence la plus élevée, k=600-400=200 est la taille de l'intervalle à la fréquence la plus élevée Mettons le résultat dans le tableau :

Ainsi, la valeur moyenne de la production commerciale pour la période étudiée est généralement égale à Хср = (-5:37)×200+500=472,97 mille roubles.

2) On trouve la variance à l'aide de la formule suivante :

σ 2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05

3) écart type : σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 mille roubles.

4) coefficient de variation : V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52 %

Dans de nombreux cas, il devient nécessaire d’introduire une autre caractéristique numérique pour mesurer le degré diffusion, propagation des valeurs, pris comme variable aléatoire ξ , autour de son espérance mathématique.

Définition. Variance d'une variable aléatoire ξ appelé un numéro.

ré ξ= M(ξ-Mξ) 2 . (1)

En d'autres termes, la dispersion est l'espérance mathématique de l'écart carré des valeurs d'une variable aléatoire par rapport à sa valeur moyenne.

appelé carré moyen déviation

quantités ξ .

Si la dispersion caractérise la taille moyenne de l'écart carré ξ depuis , alors le nombre peut être considéré comme une caractéristique moyenne de l'écart lui-même, plus précisément la valeur | ξ-Mξ |.

Les deux propriétés de dispersion suivantes découlent de la définition (1).

1. La variance d'une valeur constante est nulle. Ceci est tout à fait cohérent avec la signification visuelle de la dispersion en tant que « mesure de dispersion ».

En effet, si

ξ = C, Que Mξ = C et ça veut dire Dξ = M(C-C) 2 = M 0 = 0.

2. Lors de la multiplication d'une variable aléatoire ξ par un nombre constant C sa variance est multipliée par C 2

D(Cξ) = C 2 . (3)

Vraiment

D(Cξ) = M(C

= M(C .

3. La formule suivante pour calculer l'écart s'applique :

. (4)

La preuve de cette formule découle des propriétés de l'espérance mathématique.

Nous avons:

4. Si les valeurs ξ 1 et ξ 2 sont indépendants, alors la variance de leur somme est égale à la somme de leurs variances :

Preuve . Pour le prouver, nous utilisons les propriétés de l’espérance mathématique. Laisser 1 = m 1 , 2 = m 2 alors.

La formule (5) a été prouvée.

Puisque la variance d'une variable aléatoire est, par définition, l'espérance mathématique de la valeur ( ξ -m) 2 , où m = Mξ, puis pour calculer la variance vous pouvez utiliser les formules obtenues au §7 du chapitre II.

Alors, si ξ il existe un DSV avec une loi de distribution

x 1 x 2 ...
p 1 p 2 ...

alors nous aurons :

. (7)

Si ξ variable aléatoire continue avec densité de distribution p(x), alors on obtient :

= . (8)

Si vous utilisez la formule (4) pour calculer la variance, vous pouvez obtenir d'autres formules, à savoir :

, (9)

si la valeur ξ discret, et

= , (10)

Si ξ distribué avec densité p(x).

Exemple 1. Laissez la valeur ξ uniformément réparti sur le segment [ un,b]. En utilisant la formule (10) on obtient :

On peut montrer que la variance d'une variable aléatoire distribuée selon la loi normale avec densité

p(x)= , (11)

égal à σ 2.

Cela clarifie la signification du paramètre σ inclus dans l'expression de densité (11) pour la loi normale ; σ est l'écart type de la valeur ξ.

Exemple 2. Trouver la variance d'une variable aléatoire ξ , distribué selon la loi binomiale.


Solution . En utilisant la représentation de ξ sous la forme

ξ = ξ 1 + ξ 2 + ξn(voir exemple 2 §7 chapitre II) et en appliquant la formule d'addition des écarts pour grandeurs indépendantes, on obtient

Dξ = Dξ 1 + Dξ 2 +Dξn .

Dispersion de l'une des quantités ξ je (je= 1,2, n) est calculé directement :

réξ je = ​​M(ξ je) 2 - (Mξ je) 2 = 0 2 · q+ 1 2 p- p 2 = p(1-p) = pq.

Finalement on obtient

= npq, Où q = 1 -p.