Menu

Construction d'une série de distributions d'intervalles. Règles de construction de séries de distribution discrètes et d'intervalles

Assistants électroniques à la conduite

Disposant de données statistiques d'observation caractérisant un phénomène particulier, il faut tout d'abord les organiser, c'est-à-dire donner un caractère systématique

Statisticien anglais. UJReichman a dit au sens figuré à propos des collections désordonnées que rencontrer une masse de données non généralisées équivaut à une situation dans laquelle une personne est jetée dans un fourré sans boussole. Qu'est-ce que la systématisation des données statistiques sous forme de séries de répartition ?

Les séries statistiques de distributions sont des agrégats statistiques ordonnés (tableau 17). Le type le plus simple de série de distribution statistique est une série classée, c'est-à-dire une série de nombres par ordre croissant ou décroissant, faisant varier les caractéristiques. Une telle série ne permet pas de juger des modèles inhérents aux données distribuées : quelle valeur a la majorité des indicateurs regroupés, quels écarts il y a par rapport à cette valeur ; comme un grande image distributions. À cette fin, les données sont regroupées, montrant la fréquence à laquelle les observations individuelles se produisent dans leur nombre total (schéma 1a 1).

. Tableau 17

. Vue générale série de distribution statistique

. Schéma 1. Schéma statistique série de distribution

La répartition des unités de population selon des caractéristiques qui n'ont pas d'expression quantitative est appelée série attributive(par exemple, répartition des entreprises selon leur zone de production)

Les séries de répartition des unités de population selon les caractéristiques, ont une expression quantitative, sont appelées série de variations. Dans de telles séries, les valeurs des caractéristiques (options) sont classées par ordre croissant ou décroissant.

Dans la série de distribution variationnelle, on distingue deux éléments : la variante et la fréquence . Option- il s'agit d'une signification distincte des caractéristiques de regroupement fréquence- un nombre qui montre combien de fois chaque option apparaît

En statistiques mathématiques, un élément supplémentaire de la série de variations est calculé - en partie. Cette dernière est définie comme le rapport entre la fréquence des cas d'un intervalle donné et montant total la partie fréquence est déterminée en fractions d'unité, en pourcentage (%) en ppm (% o)

Ainsi, une série de distribution de variations est une série dans laquelle les options sont classées par ordre croissant ou décroissant, et leurs fréquences ou fréquences sont indiquées. Les séries de variations sont discrètes (intervalles) et autres intervalles (continus).

. Série à variation discrète- il s'agit de séries de distribution dans lesquelles la variante comme valeur d'une caractéristique quantitative ne peut prendre qu'une certaine valeur. Les options diffèrent les unes des autres par une ou plusieurs unités

Ainsi, le nombre de pièces produites par équipe par un travailleur spécifique peut être exprimé par un seul un certain nombre(6, 10, 12, etc.). Un exemple de série de variations discrètes pourrait être la répartition des travailleurs selon le nombre de pièces produites (tableau 18-18).

. Tableau 18

. Distribution en série discrète _

. Série de variations d'intervalle (continue)- les séries de distribution dans lesquelles la valeur des options est donnée sous forme d'intervalles, c'est-à-dire les valeurs des caractéristiques peuvent différer les unes des autres d'un montant arbitrairement faible. Lors de la construction d'une série de variations de caractéristiques péri-variantes NEP, il est impossible d'indiquer chaque valeur de la variante, la population est donc répartie sur des intervalles. Cette dernière peut être égale ou inégale. Pour chacun d'eux, des fréquences ou fréquences sont indiquées (Tableau 1 9 19).

Dans les séries de distribution d'intervalles avec des intervalles inégaux, des caractéristiques mathématiques telles que la densité de distribution et la densité de distribution relative sur un intervalle donné sont calculées. La première caractéristique est déterminée par le rapport de la fréquence à la valeur du même intervalle, la seconde - par le rapport de la fréquence à la valeur du même intervalle. Pour l'exemple ci-dessus, la densité de distribution dans le premier intervalle sera de 3 : 5 = 0,6, et la densité relative dans cet intervalle est de 7,5 : 5 = 1,55 %.

. Tableau 19

. Série de distribution d'intervalles _

La manière la plus simple de résumer le matériel statistique est de construire des séries. Le résultat sommaire d’une étude statistique peut être une série de distribution.

Après avoir déterminé la caractéristique de regroupement, le nombre de groupes et les intervalles de regroupement, les données de synthèse et de regroupement sont présentées sous forme de séries de distribution et présentées sous forme de tableaux statistiques.

Une série de distribution est l'un des types de regroupements.

Proche de la distribution En statistiques, une répartition ordonnée des unités de population en groupes selon une caractéristique quelconque est appelée : qualitative ou quantitative.

  1. Types de séries de distribution

Selon la caractéristique qui sous-tend la formation des séries de distribution, on distingue les séries de distribution attributives et variationnelles :

    les séries de distribution construites selon des caractéristiques qualitatives sont dites attributives ;

    Les séries variationnelles sont des séries de distribution construites par ordre croissant ou décroissant des valeurs d'une caractéristique quantitative.

La série de variations de la distribution se compose de deux colonnes. La première colonne contient des valeurs quantitatives de caractéristiques variables, appelées variantes et désignées. Option discrète - exprimée sous forme d'entier. L'option d'intervalle va de et à. Selon le type d'options, vous pouvez construire une série de variations discrètes ou à intervalles. La deuxième colonne contient le nombre d'options spécifiques, exprimé en termes de fréquences ou de fréquences :

    les fréquences sont des nombres absolus indiquant combien de fois une valeur donnée d'une caractéristique apparaît dans l'agrégat ; la somme de toutes les fréquences doit être égale au nombre d'unités dans l'ensemble de la population ;

    les fréquences sont les fréquences exprimées en pourcentage du total ;

la somme de toutes les fréquences exprimée en pourcentage doit être égale à 100 % en fractions de un. Série de variantes caractérisé par deux éléments : variante (X) et fréquence (f). Une variante est une valeur distincte d'une caractéristique d'une unité individuelle ou d'un groupe d'une population. Un nombre indiquant combien de fois une valeur particulière d'une caractéristique apparaît est appelé fréquence.

Si la fréquence est exprimée sous forme de nombre relatif, alors elle est appelée fréquence.

    La série de variations peut être :

    intervalle, lorsque les limites « de » et « à » sont définies, les séries de distribution d'intervalles peuvent être représentées graphiquement sous la forme d'un histogramme ;

  1. discret lorsque la caractéristique étudiée est caractérisée par un certain nombre.

Représentation graphique des séries de distribution

Les séries de distribution sont présentées visuellement à l'aide d'images graphiques.

    Les séries de distribution sont représentées comme suit :

    décharge;

    histogrammes ;

cumule; Lors de la construction terrain d'essai

sur l'axe horizontal (axe des x) sont tracées les valeurs de la caractéristique variable, et sur l'axe vertical (axe des y) les fréquences ou fréquences. Pour construire histogrammes

Les valeurs des limites des intervalles sont indiquées le long de l'axe des abscisses et sur leur base sont construits des rectangles dont la hauteur est proportionnelle aux fréquences (ou fréquences).

La distribution d'une caractéristique dans une série de variations sur des fréquences accumulées (fréquences) est représentée à l'aide d'un cumulat. ou une courbe cumulative, contrairement à un polygone, est construite à partir de fréquences ou de fréquences accumulées. Dans ce cas, les valeurs de la caractéristique sont placées sur l'axe des abscisses, et les fréquences ou fréquences cumulées sont placées sur l'axe des ordonnées.

Ogive est construit de la même manière qu'un cumulat à la seule différence que les fréquences accumulées sont placées sur l'axe des abscisses, et les valeurs caractéristiques sont placées sur l'axe des ordonnées.

Un type de cumulat est une courbe de concentration ou un tracé de Lorentz. Pour construire une courbe de concentration, une échelle en pourcentages de 0 à 100 est appliquée aux deux axes du système de coordonnées rectangulaires. Dans ce cas, les fréquences cumulées sont indiquées sur l'axe des abscisses, et les valeurs cumulées de la part (. en pourcentage) en volume de la caractéristique sont indiqués sur l'axe des ordonnées.

Disposant de données statistiques d'observation caractérisant un phénomène particulier, il faut tout d'abord les organiser, c'est-à-dire donner un caractère systématique

Statisticien anglais. UJReichman a dit au sens figuré à propos des collections désordonnées que rencontrer une masse de données non généralisées équivaut à une situation dans laquelle une personne est jetée dans un fourré sans boussole. Qu'est-ce que la systématisation des données statistiques sous forme de séries de répartition ?

Les séries statistiques de distributions sont des agrégats statistiques ordonnés (tableau 17). Le type le plus simple de série de distribution statistique est une série classée, c'est-à-dire une série de nombres par ordre croissant ou décroissant, faisant varier les caractéristiques. Une telle série ne permet pas de juger des modèles inhérents aux données distribuées : quelle valeur a la majorité des indicateurs regroupés, quels écarts il y a par rapport à cette valeur ; ainsi que le tableau général de la distribution. À cette fin, les données sont regroupées, montrant la fréquence à laquelle les observations individuelles se produisent dans leur nombre total (schéma 1a 1).

. Tableau 17

. Vue générale des séries de distribution statistique

. Schéma 1. Schéma statistique série de distribution

La répartition des unités de population selon des caractéristiques qui n'ont pas d'expression quantitative est appelée série attributive(par exemple, répartition des entreprises selon leur zone de production)

Les séries de répartition des unités de population selon les caractéristiques, ont une expression quantitative, sont appelées série de variations. Dans de telles séries, les valeurs des caractéristiques (options) sont classées par ordre croissant ou décroissant.

Dans la série de distribution variationnelle, on distingue deux éléments : la variante et la fréquence . Option- il s'agit d'une signification distincte des caractéristiques de regroupement fréquence- un nombre qui montre combien de fois chaque option apparaît

En statistiques mathématiques, un élément supplémentaire de la série de variations est calculé - en partie. Cette dernière est définie comme le rapport de la fréquence des cas d'un intervalle donné à la somme totale des fréquences ; la partie est déterminée en fractions d'unité, en pourcentage (%) en ppm (% o)

Ainsi, une série de distribution de variations est une série dans laquelle les options sont classées par ordre croissant ou décroissant, et leurs fréquences ou fréquences sont indiquées. Les séries de variations sont discrètes (intervalles) et autres intervalles (continus).

. Série à variation discrète- il s'agit de séries de distribution dans lesquelles la variante comme valeur d'une caractéristique quantitative ne peut prendre qu'une certaine valeur. Les options diffèrent les unes des autres par une ou plusieurs unités

Ainsi, le nombre de pièces produites par équipe par un ouvrier spécifique ne peut être exprimé que par un nombre spécifique (6, 10, 12, etc.). Un exemple de série de variations discrètes pourrait être la répartition des travailleurs selon le nombre de pièces produites (tableau 18-18).

. Tableau 18

. Distribution en série discrète _

. Série de variations d'intervalle (continue)- les séries de distribution dans lesquelles la valeur des options est donnée sous forme d'intervalles, c'est-à-dire les valeurs des caractéristiques peuvent différer les unes des autres d'un montant arbitrairement faible. Lors de la construction d'une série de variations de caractéristiques péri-variantes NEP, il est impossible d'indiquer chaque valeur de la variante, la population est donc répartie sur des intervalles. Cette dernière peut être égale ou inégale. Pour chacun d'eux, des fréquences ou fréquences sont indiquées (Tableau 1 9 19).

Dans les séries de distribution d'intervalles avec des intervalles inégaux, des caractéristiques mathématiques telles que la densité de distribution et la densité de distribution relative sur un intervalle donné sont calculées. La première caractéristique est déterminée par le rapport de la fréquence à la valeur du même intervalle, la seconde - par le rapport de la fréquence à la valeur du même intervalle. Pour l'exemple ci-dessus, la densité de distribution dans le premier intervalle sera de 3 : 5 = 0,6, et la densité relative dans cet intervalle est de 7,5 : 5 = 1,55 %.

. Tableau 19

. Série de distribution d'intervalles _

Qu'est-ce qu'un regroupement de données statistiques et comment est-il lié aux séries de distribution a été abordé dans cette conférence, où vous pourrez également en apprendre davantage sur ce qu'est une série de distribution discrète et variationnelle.

Les séries de distribution sont l'une des variétés de séries statistiques (en plus d'elles, les séries dynamiques sont utilisées en statistique), elles sont utilisées pour analyser des données sur des phénomènes vie publique. Construire des séries de variations est une tâche tout à fait réalisable pour tout le monde. Il y a cependant des règles à retenir.

Comment construire une série de distribution variationnelle discrète

Exemple 1. Il existe des données sur le nombre d'enfants dans 20 familles interrogées. Construire une série de variations discrètes répartition familiale par nombre d'enfants.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Solution:

  1. Commençons par une présentation en tableau, dans laquelle nous saisirons ensuite les données. Étant donné que les lignes de distribution comportent deux éléments, le tableau sera composé de deux colonnes. La première colonne est toujours une option - ce que l'on étudie - on tire son nom de la tâche (la fin de la phrase avec la tâche dans les conditions) - par nombre d'enfants– cela signifie que notre option est le nombre d’enfants.

La deuxième colonne est la fréquence - la fréquence à laquelle notre variante se produit dans le phénomène étudié - nous prenons également le nom de la colonne de la tâche - répartition familiale – cela signifie que notre fréquence est le nombre de familles avec le nombre d'enfants correspondant.

  1. Désormais, à partir des données sources, nous sélectionnons les valeurs qui apparaissent au moins une fois. Dans notre cas c'est

Et classons ces données dans la première colonne de notre tableau dans un ordre logique, dans ce cas croissant de 0 à 4. Nous obtenons

Et enfin, comptons combien de fois chaque valeur de la variante apparaît.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

En conséquence, nous obtenons un tableau complété ou la ligne requise de répartition des familles par nombre d'enfants.

Exercice . Il existe des données sur les catégories tarifaires de 30 travailleurs de l'entreprise. Construire une série à variations discrètes de répartition des travailleurs selon catégorie tarifaire. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Comment construire une série de distribution variationnelle d'intervalle

Construisons une série de distributions d'intervalles et voyons en quoi sa construction diffère d'une série discrète.

Exemple 2. Il existe des données sur le montant des bénéfices perçus par 16 entreprises, en millions de roubles. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Construire une série de variations d'intervalles de la répartition des entreprises par volume de bénéfices, en identifiant 3 groupes avec des intervalles égaux.

Le principe général de construction de la série restera bien entendu les mêmes deux colonnes, les mêmes options et fréquence, mais dans ce cas les options seront situées dans l'intervalle et les fréquences seront comptées différemment.

Solution:

  1. Commençons de la même manière que la tâche précédente en créant une disposition de tableau, dans laquelle nous saisirons ensuite des données. Étant donné que les lignes de distribution comportent deux éléments, le tableau sera composé de deux colonnes. La première colonne est toujours une option - ce que nous étudions - nous prenons son nom de la tâche (la fin de la phrase avec la tâche dans les conditions) - par le montant du profit - ce qui signifie que notre option est le montant du profit reçu .

La deuxième colonne est la fréquence - la fréquence à laquelle notre variante apparaît dans le phénomène étudié - nous prenons également le nom de la colonne de la tâche - la répartition des entreprises - ce qui signifie que notre fréquence est le nombre d'entreprises avec le bénéfice correspondant, dans ce cas tombant dans l’intervalle.

En conséquence, la disposition de notre table ressemblera à ceci :

où je est la valeur ou la longueur de l'intervalle,

Xmax et Xmin – valeur maximale et minimale de l'attribut,

n est le nombre de groupes requis selon les conditions du problème.

Calculons la taille de l'intervalle pour notre exemple. Pour ce faire, parmi les données initiales, nous trouverons le plus grand et le plus petit

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 – la valeur maximale est de 118 millions de roubles et la valeur minimale est de 9 millions de roubles. Effectuons le calcul en utilisant la formule.

Dans le calcul, nous avons obtenu le nombre 36, (3) trois dans la période, dans de telles situations, la valeur de l'intervalle doit être arrondie afin qu'après les calculs le maximum de données ne soit pas perdu, c'est pourquoi dans le calcul la valeur de l'intervalle est de 36,4 millions de roubles.

  1. Construisons maintenant des intervalles - nos options dans ce problème. Le premier intervalle commence à être construit à partir de la valeur minimale, la valeur de l'intervalle y est ajoutée et la limite supérieure du premier intervalle est obtenue. Ensuite, la limite supérieure du premier intervalle devient la limite inférieure du deuxième intervalle, la valeur de l'intervalle y est ajoutée et le deuxième intervalle est obtenu. Et ainsi de suite autant de fois que nécessaire pour construire des intervalles selon la condition.

Notons que si nous n'avions pas arrondi la valeur de l'intervalle à 36,4, mais l'avions laissé à 36,3, alors la dernière valeur aurait été 117,9. C'est afin d'éviter la perte de données qu'il est nécessaire d'arrondir la valeur de l'intervalle à une valeur plus grande.

  1. Comptons le nombre d'entreprises entrant dans chaque intervalle spécifique. Lors du traitement des données, vous devez vous rappeler que la valeur supérieure de l'intervalle dans un intervalle donné n'est pas prise en compte (n'est pas incluse dans cet intervalle), mais est prise en compte dans l'intervalle suivant (la limite inférieure de l'intervalle est incluse dans cet intervalle, et celui du haut n'est pas inclus), à l'exception du dernier intervalle.

Lors du traitement des données, il est préférable d'indiquer les données sélectionnées avec des symboles ou des couleurs pour simplifier le traitement.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Nous notons le premier intervalle jaune- et déterminer combien de données tombent dans l'intervalle de 9 à 45,4, tandis que ce 45,4 sera pris en compte dans le deuxième intervalle (à condition qu'il soit dans les données) - au final on obtient 7 entreprises dans le premier intervalle. Et ainsi de suite à tous les intervalles.

  1. (action supplémentaire) Calculons le montant total des bénéfices perçus par les entreprises pour chaque intervalle et en général. Pour ce faire, additionnez les données marquées différentes couleurs et obtenez la valeur totale du profit.

Pour le premier intervalle - 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 millions de roubles.

Pour le deuxième intervalle - 48 + 57 + 48 + 56 + 63 = 272 millions de roubles.

Pour le troisième intervalle - 118 + 87 + 98 + 88 = 391 millions de roubles.

Exercice . Il existe des données sur le montant des dépôts à la banque de 30 déposants, en milliers de roubles. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Construire série de variations d'intervalle répartition des déposants, selon la taille du dépôt, en identifiant 4 groupes à intervalles égaux. Pour chaque groupe, calculez le montant total des dépôts.

Dans de nombreux cas, lorsqu'une population statistique comprend un nombre important, voire infini, de variantes, ce qui se produit le plus souvent avec une variation continue, il est pratiquement impossible et peu pratique de former un groupe d'unités pour chaque variante. Dans de tels cas, la combinaison d'unités statistiques en groupes n'est possible que sur la base d'un intervalle, c'est-à-dire un tel groupe qui a certaines limites pour les valeurs d'une caractéristique variable. Ces limites sont indiquées par deux chiffres indiquant les limites supérieure et inférieure de chaque groupe. L'utilisation d'intervalles conduit à la formation d'une série de distribution d'intervalles.

Rad d'intervalle est une série de variations dont les variantes sont présentées sous forme d'intervalles.

Une série d'intervalles peut être constituée d'intervalles égaux et inégaux, tandis que le choix du principe de construction de cette série dépend principalement du degré de représentativité et de commodité de la population statistique. Si la population est suffisamment grande (représentative) en termes de nombre d'unités et est totalement homogène dans sa composition, alors il convient de baser la formation d'une série d'intervalles sur l'égalité des intervalles. Habituellement, en utilisant ce principe, une série d'intervalles est formée pour les populations où la plage de variation est relativement petite, c'est-à-dire les options maximales et minimales diffèrent généralement plusieurs fois les unes des autres. Dans ce cas, la valeur des intervalles égaux est calculée par le rapport de la plage de variation d'une caractéristique à un nombre donné d'intervalles formés. Pour déterminer l'égalité Et intervalle, la formule de Sturgess peut être utilisée (généralement avec une petite variation des caractéristiques de l'intervalle et grand nombre unités dans l’agrégat statistique) :

où x je - valeur d'intervalle égale ; X max, X min - options maximales et minimales dans un agrégat statistique ; n . - le nombre d'unités au total.

Exemple. Il est conseillé de calculer la taille d'un intervalle égal en fonction de la densité de contamination radioactive au césium - 137 dans 100 agglomérations du district de Krasnopolsky de la région de Mogilev, si l'on sait que l'option initiale (minimum) est égale à I km /km 2, la finale ( maximum) - 65 ki/km 2. En utilisant la formule 5.1. on obtient :

Par conséquent, afin de former une série d'intervalles avec des intervalles égaux en termes de densité de contamination par le césium - 137 agglomérations dans la région de Krasnopolsky, la taille de l'intervalle égaux peut être de 8 ki/km 2 .

Dans des conditions de répartition inégale, c'est-à-dire lorsque les options maximales et minimales sont des centaines de fois, lors de la formation d'une série d'intervalles, vous pouvez appliquer le principe inégal intervalles. Les intervalles inégaux augmentent généralement à mesure que nous avançons vers grandes valeurs signe.

La forme des intervalles peut être fermée ou ouverte. Fermé Il est d'usage d'appeler des intervalles qui ont à la fois des limites inférieures et supérieures. Ouvrir les intervalles n'ont qu'une seule limite : dans le premier intervalle il y a une limite supérieure, dans le dernier il y a une limite inférieure.

Il est conseillé d'évaluer les séries d'intervalles, notamment à intervalles inégaux, en tenant compte densité de distribution, la façon la plus simple de calculer quel est le rapport entre la fréquence locale (ou la fréquence) et la taille de l'intervalle.

Pour former pratiquement une série d'intervalles, vous pouvez utiliser la disposition du tableau. 5.3.

Tableau 5.3. La procédure pour former une série d'intervalles colonies District de Krasnopolsky selon la densité de contamination radioactive au césium -137

Le principal avantage de la série d'intervalles est son maximum compacité. en même temps, dans la série de distribution d'intervalles, des variantes individuelles de la caractéristique sont cachées dans les intervalles correspondants

Lors de la représentation graphique d'une série d'intervalles dans un système de coordonnées rectangulaires, les limites supérieures des intervalles sont tracées sur l'axe des abscisses et les fréquences locales de la série sont tracées sur l'axe des ordonnées. La construction graphique d'une série d'intervalles diffère de la construction d'un polygone de distribution en ce sens que chaque intervalle a des limites inférieures et supérieures et que deux abscisses correspondent à une valeur d'ordonnée. Par conséquent, sur le graphique d'une série d'intervalles, ce n'est pas un point qui est marqué, comme dans un polygone, mais une ligne reliant deux points. Ces lignes horizontales sont reliés les uns aux autres par des lignes verticales et on obtient la figure d'un polygone en escalier, généralement appelé histogramme distribution (Fig. 5.3).

Lors de la construction graphique d'une série d'intervalles pour une population statistique suffisamment grande, l'histogramme se rapproche symétrique forme de distribution. Dans les cas où la population statistique est petite, en règle générale, asymétrique histogramme.

Dans certains cas, il est conseillé de former un certain nombre de fréquences accumulées, c'est-à-dire cumulatif rangée. Une série cumulative peut être formée sur la base d'une série de distribution discrète ou par intervalles. Lors de la représentation graphique d'une série cumulative dans un système de coordonnées rectangulaires, les variantes sont tracées sur l'axe des abscisses et les fréquences accumulées (fréquences) sont tracées sur l'axe des ordonnées. La ligne courbe résultante est généralement appelée cumulatif distribution (Fig. 5.4).

Formation et représentation graphique différents types les séries de variations contribuent à un calcul simplifié des principaux caractéristiques statistiques, qui sont abordés en détail dans le thème 6, permet de mieux comprendre l'essence des lois de distribution d'une population statistique. L'analyse d'une série de variations acquiert une importance particulière dans les cas où il est nécessaire d'identifier et de retracer la relation entre les options et les fréquences (fréquences). Cette dépendance se manifeste par le fait que le nombre de cas par option est d'une certaine manière lié à la taille de cette option, c'est-à-dire avec des valeurs croissantes de la caractéristique variable, les fréquences (fréquences) de ces valeurs subissent certains changements systématiques. Cela signifie que les nombres dans la colonne fréquence (fréquence) ne fluctuent pas de manière chaotique, mais changent dans une certaine direction, dans un certain ordre et séquence.

Si les fréquences montrent une certaine systématicité dans leurs changements, cela signifie que nous sommes sur la bonne voie pour identifier un modèle. Le système, l'ordre, la séquence des changements de fréquences sont le reflet des causes générales, conditions générales, caractéristique de l’ensemble de la population.

Il ne faut pas supposer que le modèle de distribution est toujours donné sous une forme toute faite. Il existe de nombreuses séries de variations dans lesquelles les fréquences sautent bizarrement, parfois en augmentant, parfois en diminuant. Dans de tels cas, il convient de rechercher à quel type de distribution le chercheur a affaire : soit cette distribution ne présente aucun modèle inhérent, soit sa nature n'a pas encore été révélée : le premier cas est rare, mais le second Ce cas est un phénomène assez courant et très répandu.

Ainsi, lors de la formation d'une série d'intervalles, le nombre total d'unités statistiques peut être faible et chaque intervalle contient un petit nombre de variantes (par exemple, 1 à 3 unités). Dans de tels cas, on ne peut compter sur la manifestation d’aucun schéma. Pour qu'un résultat naturel soit obtenu à partir d'observations aléatoires, il est nécessaire que la loi entre en vigueur grands nombres, c'est-à-dire de sorte que pour chaque intervalle il y aurait non pas plusieurs, mais des dizaines et des centaines d'unités statistiques. Pour cela, il faut essayer d'augmenter le plus possible le nombre d'observations. C’est le moyen le plus sûr de détecter des modèles dans les processus de masse. S'il n'y a pas de réelle opportunité d'augmenter le nombre d'observations, l'identification d'une tendance peut être obtenue en réduisant le nombre d'intervalles dans la série de distribution. En réduisant le nombre d'intervalles dans une série de variations, le nombre de fréquences dans chaque intervalle augmente ainsi. Cela signifie que les fluctuations aléatoires de chaque unité statistique se superposent, « lissées », se transformant en un motif.

La formation et la construction de séries de variations permettent d'obtenir uniquement une image générale et approximative de la répartition de la population statistique. Par exemple, un histogramme n'exprime que sous forme approximative la relation entre les valeurs d'une caractéristique et ses fréquences (fréquences). Par conséquent, les séries de variations ne sont essentiellement que la base d'une étude plus approfondie de la régularité interne de la statique. distribution.

QUESTIONS DE TEST POUR LE SUJET 5

1. Qu’est-ce que la variation ? Qu’est-ce qui cause la variation d’un trait dans une population statistique ?

2. Quels types de caractéristiques variables peuvent apparaître dans les statistiques ?

3. Qu'est-ce qu'une série de variations ? Quels types de séries de variations peut-il y avoir ?

4. Qu'est-ce qu'une série classée ? Quels sont ses avantages et ses inconvénients ?

5. Qu'est-ce que série discrète et quels sont ses avantages et ses inconvénients ?

6. Quelle est la procédure pour former une série d'intervalles, quels sont ses avantages et ses inconvénients ?

7. Qu'est-ce qu'une représentation graphique de séries de distribution d'intervalles classées et discrètes ?

8. Qu'est-ce que le cumul de distribution et que caractérise-t-il ?