Meniul

Analiza statistică multivariată. Analiza statistică multivariată: esență și tipuri Estimarea unei funcții predictive liniare

Drepturile și obligațiile șoferului


tabel de mostre. conjugație max, estimări plauzibile:

G2= -2 ^ p sch Sht t ■ p w)

are o distribuţie χ 2 asimptotică. Aceasta se bazează pe stat. testarea ipotezei relaţiei.

Experienta in prelucrarea datelor folosind A.l. și-a arătat eficacitatea ca metodă de analiză țintită a tabelului multidimensional. conjugarea, care conține (în cazul unei alegeri rezonabile de variabile) o cantitate imensă, în comparație cu tabelele bidimensionale, de informații de interes pentru sociolog. Metoda vă permite să descrieți succint acest tabel. (sub forma unei ipoteze despre conexiuni) și în același timp să analizeze în detaliu conc. relaţie. Al. se aplică de obicei în mai multe etape, sub forma unui dialog sociolog-calculator. Astfel, A.l. are o flexibilitate considerabilă, oferă o oportunitate de a formula diverse tipuri de ipoteze despre relații, de a include experiența unui sociolog în procedura de analiză formală a datelor.

Lit.: Uptop G. Analiza tabelului. conjugație. M., 1982; Tipologie şi clasificare în sociol. cercetare. M., 1982; Episcopul Y.M.M. et ai. Analiză multivariată discretă. N.Y., 1975; Agresti A. O introducere în analiza categorică a datelor. N.Y., 1966.

A.A. Mirzoev

ANALIZA STATISTICĂ MULTIVARIATĂ- sec. statistici matematice, dedicat matematicii. metode care vizează identificarea naturii și structurii relațiilor dintre componentele studiului semn de multidimensionalși destinate să primească științifice. și implicații practice. Matricea inițială de date multidimensionale pentru efectuarea A.m.s. servesc de obicei ca rezultate ale măsurării componentelor unui atribut multidimensional pentru fiecare dintre obiectele populației studiate, i.e. o succesiune de observații multivariate (vezi observaţie în statistică). O caracteristică multidimensională este cel mai adesea interpretată ca o caracteristică multidimensională LED-


rang aleatoriu,și succesiunea observațiilor multivariate – ca eșantion din populația generală. În acest caz, alegerea metodei de procesare a statisticii originale. datele sunt produse pe baza unor ipoteze privind natura legea distributiei caracteristică multidimensională studiată (vezi. Distribuția probabilității).

1. A.m.s. distribuțiile multivariate și principalele lor. caracteristicile acoperă situațiile în care observațiile prelucrate sunt de natură probabilistică, adică sunt interpretate ca o mostră din acc. populatia generala. La principal Obiectivele acestei subsecțiuni includ: estimare statistică a investigat distribuțiile multivariate și principalele lor. parametrii; proprietățile de cercetare ale statisticilor utilizate. evaluări; studiul distribuțiilor de probabilitate pentru o serie de statistici, cu ajutorul cărora sunt construite statistici. criterii de testare dif. ipotezele despre natura probabilistică a datelor multivariate analizate (vezi Testarea ipotezelor statistice).

2. A.m.s. natura și structura interrelațiilor dintre componentele caracteristicii multidimensionale studiate combină conceptele și rezultatele inerente unor metode și modele precum analiza regresiei, analiza dispersiei, analiza covarianței, analiza factorilor, analiză latent-structurală, analiză loggery, căutarea interacțiunilor. Metodele aparținând acestui grup includ ambii algoritmi, principal. pe baza ipotezei naturii probabilistice a datelor, precum și a metodelor care nu se încadrează în cadrul lui k.-l. model probabilistic (acestea din urmă sunt adesea denumite metode analiza datelor).

3. A.m.s. structura geometrică a setului studiat de observații multidimensionale combină conceptele și rezultatele inerente unor astfel de modele și metode precum analiza discriminanta, analiza clusterului (vezi. Metode de clasificare, Scala). Nodal pentru aceste modele yavl. conceptul de distanță sau de măsură a proximității dintre elementele analizate ca puncte ale unui fel de

ANALIZA CAUZALA


rătăcirile. În acest caz, pot fi analizate atât obiectele (ca puncte specificate în spațiul de caracteristici) cât și caracteristicile (ca puncte specificate în spațiul „obiect”).

Valoarea aplicată A.m.s. constă în principal în serviciu în continuare. trei probleme: stat. studiul dependențelor dintre indicatorii luați în considerare; clasificarea elementelor (obiectelor) sau a caracteristicilor; reducerea dimensiunii spațiului de caracteristici luate în considerare și selectarea celor mai informative caracteristici.

Lit.: Stat. metode de analiză sociologică. informație. M., 1979; Tipologie şi clasificare în sociol. cercetare. M., 1982; Interpretarea si analiza datelor in sociol, cercetare. M., 1987; Ayvazyan S.A., Mkhitaryan V.S. Statistica aplicata si fundamentele econometriei: Proc. M., 1998; Soshnikova L.A. etc. Stat multidimensional. analiză în economie. M., 1999; Dubrov A.M., Mkhitaryan V.S., Troshin L.I. Stat multidimensional. metode pentru economiști și manageri. M., 2000; Rostovtsev B.C., Kovaleva T.D. Analiza sociologică. date folosind stat. Pachetul SPSS. Novosibirsk, 2001; Tyurin Yu.N., Makarov A.A. Analiza datelor pe computer. Y., 2003; Krysh-tanovsky A. O. Analiza sociologică. date folosind pachetul SPSS. M., 2006.

YUN. Tolstova

ANALIZA CAUZALA- metode de modelare a relaţiilor cauzale dintre caracteristici folosind sisteme statistice. ecuații, cel mai adesea regresie (vezi. analiza de regresie). Există și alte nume pentru acest domeniu destul de extins și în continuă schimbare de metode: analiza drumului, așa cum a numit-o prima dată fondatorul său S. Wright; metode de ecuații econometrice structurale, așa cum este obișnuit în econometrie, etc. Osn. concepte de A.p. yavl.: diagramă de cale (structurală, cauzală), coeficient cauzal (de cale), componente directe, indirecte și imaginare ale conexiunii dintre semne. Folosit în A.p. conceptul de „relație cauzală* nu afectează fi-


los. probleme asociate conceptului de „cauzalitate”. Coeficientul cauzal determinat. destul de operațional. Mat. Aparatul face posibilă verificarea prezenței relațiilor cauzale directe și indirecte între semne, precum și identificarea acelor componente ale coeficienților de corelație (vezi Fig. Corelație), to-rye asociate cu conexiuni directe, indirecte și imaginare.

Diagrama de traseu reflectă grafic relații cauzale, direcționate, presupuse ipotetic, între caracteristici. Un sistem de caracteristici cu legături unidirecționale se numește recursiv. Sistemele cauzale non-recursive iau în considerare, de asemenea, feedback-uri, de exemplu, două caracteristici ale unui sistem pot fi atât o cauză, cât și un efect în relație unul cu celălalt. Toate semnele sunt împărțite în semne-consecințe (dependente, endogene) și semne-cauze (independente, exogene). Cu toate acestea, într-un sistem de ecuații, caracteristicile endogene ale uneia dintre ecuații pot fi caracteristici exogene ale altor ecuații. În cazul a patru caracteristici, diagrama recursivă a tuturor relațiilor posibile dintre caracteristici are forma:

x 2
/ N
*1 La
G
la S

Construirea unei diagrame de conexiuni yavl. o premisă necesară a matematicii. formularea sistemului stat. ecuații care reflectă influențele prezentate în diagramă. Principal Vom ilustra principiile construirii unui sistem de ecuații de regresie folosind aceleași patru caracteristici ca exemplu. Mergând în direcția săgeților, pornind de la Hee găsiți primul endogen

ANALIZĂ CAUZALĂ


un semn și notează acele semne care îl afectează atât direct (direct) cât și indirect (indirect) și prin alte semne. Prima ecuație de regresie standardizată corespunde primei trăsături endogene Xjși exprimă dependență Χι din acele semne care îl afectează, adică. din Χγ. Astfel, prima ecuație are forma: Χι = bi\X\.

Apoi dezvăluim al doilea semn endogen, to-ry are comunicații direcționate către el. Acesta este un semn al lui Aj, corespunde variabilelor exogene X\și Χι, prin urmare, a doua ecuație de regresie într-o formă standardizată se formulează astfel: Aj = bcx\+ bpXg etc. Luând în considerare erorile de măsurare U sistemul de modele de regresie standardizate pentru diagrama noastră cauzală particulară este: X\ \u003d Ui, DAR? =

- b->\X\+ Ui, xt,= 631ΑΊ + byiXi+ Uy, Χα -

- baXi+ binXi+ J43A3 + SCH. Pentru a evalua coeficienții b, s, trebuie rezolvat. Decizia există cu condiția ca datele să satisfacă o anumită natură. stat. cerințe. b$ se numesc factori cauzali si sunt adesea notati ca RU. Acea., R# arată acea proporție a modificării în variația trăsăturii endogene;, care apare atunci când trăsătura exogenă se modifică j pe unitate de abatere standard a acestei caracteristici, cu condiția excluderii influenței celorlalte caracteristici ale ecuației (vezi. analiza de regresie). Cu alte cuvinte, P,y are un efect de caracteristică directă j asupra trăsăturii d. Efectul indirect al trăsăturii j on;) se calculează pe baza luării în considerare a tuturor căilor de influență j pe i cu excepția directă.

În diagramă, influența directă a primei trăsături asupra celei de-a patra este reprezentată schematic printr-o săgeată dreaptă care vine direct din Χι la xt, reprezentat simbolic ca 1->4; este egal cu coeficientul de influență cauzală P, X 2,..., HR. Dependența strict regresivă poate fi definită după cum urmează. cale.

Lasă-l pe U X\, Xr,..., X p - Aleatoriu
cantități cu o îmbinare dată curse
probabilități.
Dacă pentru fiecare
set lung de valori X λ \u003d x \, X 2= hg,...,
X p \u003d x p matematică condiționată. aștepta
Danemarca Υ(χ\, X2,..., Xp) - E(Y/(X])= xj,
Χι = X2, ..., X p \u003d Xp)), apoi functia Υ(Χ],
x2,
..., Xp) numită regresie de magnitudine
ns Y după mărime X\, Xr,..., x r, si ea
grafic - dreapta de regresie Y de X\, Xr,
..., X p,
sau ecuația de regresie. Zavi
dependența lui Y de ΛΊ, hg....... X p se manifestă în

modificarea valorilor medii ale Vpri de la
schimbându-se X\, Xr........ Chr. Deși la fiecare

set fix de valori X]- xj, xg = xg,» , Xp ~ Xp cantitatea Τ rămâne o variabilă aleatoare cu definiție. împrăștiere. Pentru a afla cât de exact regresia estimează modificarea în Y cu o modificare a ΑΊ, hg,..., x r, valoarea medie a varianței Y este utilizată pentru diferite seturi de valori X\, Xr,..., Xp(de fapt, vorbim despre măsura dispersiei variabilei dependente în jurul dreptei de regresie).

În practică, linia de regresie este căutată cel mai adesea sub forma unei funcții liniare Y = bx + biXi + bxxr+ - + bpXp(regresie liniară) care aproximează cel mai bine curba dorită. Acest lucru se face folosind metoda celor mai mici pătrate, atunci când suma abaterilor pătrate ale Y observat efectiv de la estimările lor Y este minimizată (adică estimări folosind o linie dreaptă care pretinde că reprezintă dependența de regresie dorită): w

U (U -U) => min (Ν - dimensiunea eșantionului), s

Această abordare se bazează pe faptul binecunoscut că suma care apare în expresia de mai sus ia un mini-nim. valoare pentru cazul în care Y= Υ(χ\, xr, --, x R). Aplicație

Introducerea unui PC în managementul economiei naționale presupune trecerea de la metodele tradiționale de analiză a activităților întreprinderilor la modele mai avansate de management economic care permit dezvăluirea proceselor sale profunde.

Utilizarea pe scară largă a metodelor de statistică matematică în cercetarea economică face posibilă aprofundarea analizei economice, îmbunătățirea calității informațiilor în planificarea și prognozarea indicatorilor de producție și analiza eficacității acesteia.

Complexitatea și varietatea relațiilor dintre indicatorii economici determină multidimensionalitatea caracteristicilor și, prin urmare, necesită utilizarea celui mai complex aparat matematic - metode de analiză statistică multivariată.

Conceptul de „analiza statistică multivariată” implică combinarea unui număr de metode concepute pentru a explora o combinație de caracteristici interconectate. Vorbim despre dezmembrarea (partiționarea) mulțimii luate în considerare, care este reprezentată de trăsături multidimensionale într-un număr relativ mic de ele.

În același timp, trecerea de la un număr mare de caracteristici la unul mai mic urmărește reducerea dimensiunii acestora și creșterea capacității informative. Acest scop se realizează prin identificarea informațiilor care se repetă, generate de trăsături interconectate, stabilirea posibilității de agregare (combinare, însumare) în funcție de unele trăsături. Acesta din urmă implică transformarea modelului actual într-un model cu mai puține caracteristici factoriale.

Metoda analizei statistice multidimensionale face posibilă identificarea modelelor existente în mod obiectiv, dar neexprimate în mod explicit, care se manifestă în anumite fenomene socio-economice. Trebuie să facem față acestui lucru atunci când rezolvăm o serie de probleme practice din domeniul economiei. În special, cele de mai sus au loc dacă este necesară acumularea (fixarea) simultană a valorilor mai multor caracteristici (trăsături) cantitative pentru obiectul de observație studiat, atunci când fiecare caracteristică este predispusă la variații necontrolate (în contextul obiectelor). ), în ciuda omogenității obiectelor de observație.

De exemplu, atunci când examinăm întreprinderi omogene (în ceea ce privește condițiile naturale și economice și tipul de specializare) în ceea ce privește o serie de indicatori ai eficienței producției, suntem convinși că atunci când trecem de la un obiect la altul, aproape fiecare dintre caracteristicile selectate ( identic) are o valoare numerică diferită, adică găsește, ca să spunem așa, împrăștiere (aleatorie) incontrolabilă. O astfel de variație „aleatorie” a trăsăturilor tinde să urmeze unele tendințe (regulate), atât în ​​ceea ce privește dimensiunile bine definite ale trăsăturilor în jurul cărora se produce variația, cât și în ceea ce privește gradul și interdependența variației în sine.

Cele de mai sus conduc la definirea unei variabile aleatoare multidimensionale ca un set de caracteristici cantitative, valoarea fiecăreia fiind supusă împrăștierii necontrolate în timpul repetărilor acestui proces, observație statistică, experiență, experiment etc.

S-a spus anterior că analiza multivariată combină o serie de metode; să le numim: analiza factorială, analiza componentelor principale, analiza clusterului, recunoașterea modelelor, analiza discriminantă etc. Primele trei dintre aceste metode sunt luate în considerare în paragrafele următoare.

Ca și alte metode matematice și statistice, analiza multivariată poate fi eficientă în aplicarea sa, cu condiția ca informațiile inițiale să fie de înaltă calitate, iar datele observaționale să fie masive și să fie procesate cu ajutorul unui PC.

Concepte de bază ale metodei analizei factoriale, esența sarcinilor pe care le rezolvă

Atunci când se analizează (și în egală măsură studiate) fenomene socio-economice, se întâlnesc adesea cazuri când, printre varietatea (parametricitatea bogată) a obiectelor de observație, este necesară excluderea unei proporții de parametri, sau înlocuirea acestora cu un număr mai mic de anumite funcții. fără a afecta integritatea (completitudinea) informațiilor. Rezolvarea unei astfel de probleme are sens în cadrul unui anumit model și este determinată de structura acestuia. Un exemplu de astfel de model, care este cel mai potrivit pentru multe situații reale, este modelul de analiză factorială, ale cărui metode vă permit să concentrați caracteristici (informații despre acestea) prin „condensarea” unui număr mare într-unul mai mic, mai informațional. . În acest caz, „condensul” de informații obținut ar trebui să fie reprezentat de cele mai semnificative și definitorii caracteristici cantitative.

Conceptul de „analiza factorială” nu trebuie confundat cu conceptul larg de analiză a relațiilor cauză-efect, atunci când se studiază influența diverșilor factori (combinațiile, combinațiile acestora) asupra unui atribut productiv.

Esența metodei de analiză factorială este de a exclude descrierea caracteristicilor multiple ale studiului și de a o înlocui cu un număr mai mic de variabile informațional mai încăpătoare, care se numesc factori și reflectă cele mai semnificative proprietăți ale fenomenelor. Astfel de variabile sunt unele funcții ale caracteristicilor originale.

Analiza, în cuvintele lui Ya. Okun', 9 face posibilă existența primelor caracteristici aproximative ale regularităților care stau la baza fenomenului, pentru a formula primele concluzii generale despre direcțiile în care ar trebui efectuate cercetări ulterioare. În plus, el subliniază ipoteza de bază a analizei factoriale, care este că fenomenul, în ciuda eterogenității și variabilității sale, poate fi descris de un număr mic de unități funcționale, parametri sau factori. Acești termeni sunt numiți diferit: influență, cauze, parametri, unități funcționale, abilități, indicatori principali sau independenți. Utilizarea unui termen sau altuia este supusă

Okun Ya. Analiza factorială: Per. cu. podea. M.: Statistică, 1974.- P.16.

context despre factorul și cunoașterea esenței fenomenului studiat.

Etapele analizei factoriale sunt comparații secvențiale ale diferitelor seturi de factori și opțiuni la grupuri cu includerea, excluderea și evaluarea semnificației diferențelor dintre grupuri.

V.M. Zhukovska și I.B. Muchnik 10, vorbind despre esența problemelor analizei factoriale, susțin că aceasta din urmă nu necesită subdiviziunea a priori a variabilelor în altele dependente și independente, deoarece toate variabilele din ea sunt considerate egale.

Sarcina analizei factorilor se reduce la un anumit concept, numărul și natura celor mai semnificative și relativ independente caracteristici funcționale ale fenomenului, contoarele sale sau parametrii de bază - factori. Potrivit autorilor, o trăsătură distinctivă importantă a analizei factorilor este că vă permite să explorați simultan un număr mare de variabile interdependente fără a presupune „invarianța tuturor celorlalte condiții”, ceea ce este atât de necesar atunci când utilizați o serie de alte metode. de analiză. Acesta este marele avantaj al analizei factoriale ca instrument valoros de studiere a fenomenului datorită diversității complexe și împletire a relațiilor.

Analiza se bazează în principal pe observații ale variației naturale a variabilelor.

1. Atunci când se utilizează analiza factorială, setul de variabile care sunt studiate în ceea ce privește relațiile dintre ele nu este ales în mod arbitrar: această metodă vă permite să identificați principalii factori care au un impact semnificativ în acest domeniu.

2. Analiza nu necesită ipoteze preliminare, dimpotrivă, ea însăși poate servi ca metodă de generare a ipotezelor, precum și ca criteriu pentru ipotezele bazate pe date obținute prin alte metode.

3. Analiza nu necesită presupuneri a priori cu privire la care variabile sunt independente și dependente, nu exagerează relațiile cauzale și rezolvă problema întinderii lor în procesul de cercetare ulterioară.

Lista sarcinilor specifice care trebuie rezolvate folosind metodele de analiză factorială va fi următoarea (conform lui V.M. Zhukovsky). Să le numim pe cele principale din domeniul cercetării socio-economice:

Jukovskaya V.M., Muchnik I.B. Analiza factorială în cercetarea socio-economică. - Statistică, 1976. P.4.

1. Determinarea principalelor aspecte ale diferenţelor dintre obiectele de observaţie (minimizarea descrierii).

2. Formularea de ipoteze despre natura diferențelor dintre obiecte.

3. Identificarea structurii relaţiilor dintre trăsături.

4. Testarea ipotezelor despre relația și interschimbabilitatea caracteristicilor.

5. Compararea structurilor seturi de caracteristici.

6. Dezmembrarea obiectelor de observație pentru trăsături tipice.

Cele de mai sus indică marile posibilități de analiză factorială în

studiul fenomenelor sociale, unde, de regulă, este imposibil de controlat (experimental) influența factorilor individuali.

Este destul de eficient să folosiți rezultatele analizei factoriale în modele de regresie multiple.

Având un model de corelație-regresie preformat al fenomenului studiat sub formă de caracteristici corelate, cu ajutorul analizei factoriale, un astfel de set de caracteristici poate fi transformat într-un număr semnificativ mai mic al acestora prin agregare. În același timp, trebuie menționat că o astfel de transformare nu afectează în niciun caz calitatea și completitudinea informațiilor despre fenomenul studiat. Caracteristicile agregate generate sunt necorelate și reprezintă o combinație liniară a caracteristicilor primare. Din punct de vedere matematic formal, enunțul problemei în acest caz poate avea un set infinit de soluții. Dar trebuie să ne amintim că la studierea fenomenelor socio-economice, semnele agregate obţinute trebuie să aibă o interpretare justificată economic. Cu alte cuvinte, în orice caz de utilizare a aparatului matematic, în primul rând, ele ies din cunoașterea esenței economice a fenomenelor studiate.

Astfel, cele de mai sus ne permit să rezumam că analiza factorială este o metodă de cercetare specifică, care se realizează pe baza unui arsenal de metode de statistică matematică.

Analiza factorială și-a găsit mai întâi aplicarea practică în domeniul psihologiei. Capacitatea de a reduce un număr mare de teste psihologice la un număr mic de factori a făcut posibilă explicarea abilităților inteligenței umane.

În studiul fenomenelor socio-economice, unde există dificultăți în izolarea influenței variabilelor individuale, analiza factorială poate fi utilizată cu succes. Aplicarea tehnicilor sale permite, prin intermediul unor calcule, „filtrarea” trăsăturilor nesemnificative și continuarea cercetărilor în direcția aprofundării acesteia.

Eficacitatea acestei metode este evidentă în studiul unor astfel de probleme (probleme): în economie - specializarea și concentrarea producției, intensitatea menajului, bugetul familiilor de muncitori, construirea diverșilor indicatori generalizatori. etc

Manualul a fost creat pe baza experienței autorului în predarea cursurilor de analiză statistică multivariată și econometrie. Conține materiale despre discriminant, factorial, regresie, analiza corespondenței și teoria seriilor temporale. Sunt prezentate abordări ale problemelor de scalare multidimensională și alte probleme ale statisticii multivariate.

Gruparea și cenzura.
Sarcina de a forma grupuri de date eșantioane în așa fel încât datele grupate să poată oferi aproape aceeași cantitate de informații pentru luarea deciziilor ca eșantionul înainte de grupare este rezolvată de cercetător în primul rând. Scopurile grupării, de regulă, sunt de a reduce cantitatea de informații, de a simplifica calculele și de a face datele mai vizibile. Unele teste statistice se concentrează inițial pe lucrul cu un eșantion grupat. În anumite aspecte, problema grupării este foarte apropiată de problema clasificării, care va fi discutată mai detaliat mai jos. Concomitent cu sarcina grupării, cercetătorul rezolvă și problema cenzurării eșantionului, adică. excluderea din acesta a datelor periferice, care, de regulă, sunt rezultatul unor erori de observație grosolane. Desigur, este de dorit să se asigure absența unor astfel de erori chiar și în cursul observațiilor în sine, dar acest lucru nu este întotdeauna posibil. Cele mai simple metode de rezolvare a acestor două probleme sunt discutate în acest capitol.

Cuprins
1 Informații preliminare
1.1 Analiză și algebră
1.2 Teoria probabilității
1.3 Statistici matematice
2 Distribuții multivariate
2.1 Vectori aleatori
2.2 Independenta
2.3 Caracteristici numerice
2.4 Distribuția normală în cazul multivariat
2.5 Teoria corelației
3 Gruparea și cenzura
3.1 Gruparea unidimensională
3.2 Cenzura unidimensională
3.3 Încrucișarea tabelelor
3.3.1 Ipoteza independenței
3.3.2 Ipoteza omogenității
3.3.3 Câmp de corelare
3.4 Gruparea multidimensională
3.5 Cenzura multidimensională
4 Date nenumerice
4.1 Observații introductive
4.2 Scale de comparare
4.3 Judecata expertului
4.4 Grupuri de experți
5 seturi de încredere
5.1 Intervale de încredere
5.2 Seturi de încredere
5.2.1 Parametru multidimensional
5.2.2 Eșantionarea multivariată
5.3 Seturi tolerante
5.4 Probă mică
6 Analiza de regresie
6.1 Declarația problemei
6.2 Căutarea GMS
6.3 Restricții
6.4 Matricea planului
6.5 Prognoza statistică
7 Analiza varianței
7.1 Observații introductive
7.1.1 Normalitate
7.1.2 Omogenitatea dispersiilor
7.2 Un factor
7.3 Doi factori
7.4 Caz general
8 Reducerea dimensionalității
8.1 De ce este necesară clasificarea
8.2 Model și exemple
8.2.1 Analiza componentelor principale
8.2.2 Grupare extremă de caracteristici
8.2.3 Scalare multidimensională
8.2.4 Selectarea indicatorilor pentru analiza discriminantă
8.2.5 Selectarea caracteristicilor într-un model de regresie
9 Analiză discriminantă
9.1 Aplicabilitatea modelului
9.2 Regula predictivă liniară
9.3 Recomandări practice
9.4 Un exemplu
9.5 Mai mult de două clase
9.6 Verificarea calității discriminării
10 metode euristice
10.1 Grupare extremă
10.1.1 Criteriul pătratelor
10.1.2 Criteriul modulului
10 2 Metoda Pleiadelor
11 Analiza componentelor principale
11 1 Enunțarea problemei
112 Calculul componentelor principale
11.3 Exemplu
114 Proprietăţile componentelor principale
11.4.1 Auto-reproductibilitatea
11.4.2 Proprietăţi geometrice
12 Analiza factorială
12.1 Enunțarea problemei
12.1.1 Comunicarea cu componentele principale
12.1.2 Decizie fără ambiguitate
12.2 Model matematic
12.2.1 Condiții pentru At A
12.2.2 Condiții pe matricea de sarcină. metoda centroidului
12.3 Factori latenți
12.3.1 Metoda Bartlett
12.3.2 Metoda Thomson
12.4 Exemplu
13 Digitalizare
13.1 Analiza corespondenței
13.1.1 Distanța chi-pătrat
13.1.2 Digitalizare pentru probleme de analiză discriminantă
13.2 Mai mult de două variabile
13.2.1 Utilizarea unei matrice de date binare ca matrice de mapare
13.2.2 Corelații maxime
13.3 Dimensiunea
13.4 Exemplu
13.5 Caz de date mixte
14 Scalare multidimensională
14.1 Observații introductive
14.2 Modelul Thorgerson
14.2.1 Criteriul de stres
14.3 Algoritmul lui Thorgerson
14.4 Diferențele individuale
15 Serii de timp
15.1 Generalități
15.2 Criterii aleatorii
15.2.1 Vârfuri și gropi
15.2.2 Distribuția lungimii de fază
15.2.3 Criterii bazate pe corelarea rangului
15.2.4 Corelogramă
15.3 Tendință și sezonalitate
15.3.1 Tendințe polinomiale
15.3.2 Selectarea gradului de tendință
15.3.3 Netezire
15.3.4 Estimarea fluctuațiilor sezoniere
O distribuție normală
În distribuția X2
Cu distribuția t a lui Student
D Distribuția Fisher.


Descărcați gratuit cărți electronice într-un format convenabil, vizionați și citiți:
Descarcă cartea Analiză statistică multivariată, Dronov SV, 2003 - fileskachat.com, descărcare rapidă și gratuită.

Descărcați pdf
Mai jos puteți cumpăra această carte la cel mai bun preț redus cu livrare în toată Rusia.

Econometrie

Analiza statistică multivariată


În analiza statistică multivariată, un eșantion este format din elemente ale unui spațiu multivariat. De aici și denumirea acestei secțiuni de metode econometrice. Dintre numeroasele probleme ale analizei statistice multivariate, să luăm în considerare două - recuperarea dependenței și clasificarea.

Estimarea funcției predictive liniare

Să începem cu problema estimării punctuale și de încredere a unei funcții predictive liniare a unei variabile.

Datele inițiale sunt un set de n perechi de numere (t k , x k), k = 1,2,…,n, unde t k este o variabilă independentă (de exemplu, timpul) și x k este o variabilă dependentă (de exemplu, indicele inflației, cursul de schimb al dolarului american, producția lunară sau mărimea venitului zilnic al punctului de desfacere). Se presupune că variabilele sunt legate

x k = a (t k - t cf)+ b + e k , k = 1,2,…,n,

unde a și b sunt parametri necunoscuți de statistică și supuși estimării, iar e k sunt erori care distorsionează dependența. Media aritmetică a punctelor de timp

t cf \u003d (t 1 + t 2 + ... + t n) / n

introduse în model pentru a facilita calculele ulterioare.

De obicei, parametrii a și b ai dependenței liniare sunt estimați folosind metoda celor mai mici pătrate. Relația reconstruită este apoi utilizată pentru predicția punctului și a intervalului.

După cum știți, metoda celor mai mici pătrate a fost dezvoltată de marele matematician german K. Gauss în 1794. Conform acestei metode, pentru a calcula cea mai bună funcție care aproximează liniar dependența lui x de t, ar trebui să se ia în considerare o funcție a două variabile.


Estimările celor mai mici pătrate sunt acele valori ale lui a* și b* pentru care funcția f(a,b) atinge un minim peste toate valorile argumentelor.

Pentru a găsi aceste estimări, este necesar să se calculeze derivatele parțiale ale funcției f(a,b) față de argumentele a și b, să le echivalăm cu 0, apoi să găsim estimările din ecuațiile rezultate: Avem:

Să transformăm părțile corecte ale relațiilor obținute. Să luăm factorii comuni 2 și (-1) din semnul sumei. Atunci să ne uităm la termeni. Să deschidem parantezele din prima expresie, obținem că fiecare termen este împărțit în trei. În a doua expresie, fiecare termen este și suma a trei. Deci fiecare dintre sume este împărțită în trei sume. Noi avem:


Echivalăm derivatele parțiale cu 0. Atunci factorul (-2) poate fi redus în ecuațiile rezultate. În măsura în care

(1)

ecuațiile iau forma

Prin urmare, estimările metodei celor mai mici pătrate au forma

(2)

Datorită relației (1), estimarea a* poate fi scrisă într-o formă mai simetrică:

Nu este dificil să transformi această estimare în formă

Prin urmare, funcția reconstruită, care poate fi folosită pentru a prezice și a interpola, are forma

x*(t) = a*(t - t cf) + b*.

Să acordăm atenție faptului că utilizarea lui t cf în ultima formulă nu limitează în niciun caz generalitatea acesteia. Comparați cu modelul de vizualizare

x k = c t k + d + e k , k = 1,2,…,n.

Este clar că

Estimările parametrilor sunt similare legate de:

Nu este nevoie să ne referim la niciun model probabilistic pentru a obține estimări ale parametrilor și o formulă predictivă. Totuși, pentru a studia erorile în estimările parametrilor și a funcției restaurate, i.e. construiți intervale de încredere pentru a*, b* și x*(t), este necesar un astfel de model.

Model probabilistic neparametric. Să fie determinate valorile variabilei independente t, iar erorile e k , k = 1,2,…,n, să fie variabile aleatoare independente distribuite identic cu așteptare și varianță matematică zero

statistici necunoscute.

În viitor, vom folosi în mod repetat Teorema Limită Centrală (CLT) a teoriei probabilităților pentru valorile e k , k = 1,2,…,n (cu ponderi), prin urmare, pentru a-și îndeplini condițiile, este necesar să presupunem, de exemplu, că erorile e k , k = 1,2 ,…,n, sunt finite sau au un moment absolut al treilea finit. Cu toate acestea, nu este nevoie să ne concentrăm asupra acestor „condiții de regularitate” intramatematice.

Distribuții asimptotice ale estimărilor parametrilor. Din formula (2) rezultă că

(5)

Conform CLT, estimarea b* are o distribuție normală asimptotic cu așteptarea b și varianță

care este evaluat mai jos.

Din formulele (2) și (5) rezultă că

Ultimul termen din a doua relație dispare atunci când este însumat peste i, așa că din formulele (2-4) rezultă că

(6)

Formula (6) arată că estimarea

este normal asimptotic cu medie și varianță

Rețineți că normalitatea multidimensională există atunci când fiecare termen din formula (6) este mic în comparație cu întreaga sumă, i.e.


Din formulele (5) și (6) și ipotezele inițiale despre erori, rezultă și imparțialitatea estimărilor parametrilor.

Nepărtinirea și normalitatea asimptotică a estimărilor celor mai mici pătrate facilitează specificarea limitelor de încredere asimptotice pentru acestea (asemănătoare cu limitele din capitolul anterior) și testarea ipotezelor statistice, de exemplu, despre egalitatea la anumite valori, în primul rând 0. Lăsăm cititorului posibilitatea de a scrie formule pentru calcularea limitelor de încredere și de a formula reguli pentru testarea ipotezelor menționate.

Distribuția asimptotică a funcției de prognostic. Din formulele (5) și (6) rezultă că

acestea. estimarea funcției de prognostic luată în considerare este imparțială. Asa de

În același timp, deoarece erorile sunt independente în agregat și

, apoi

Prin urmare,

ANALIZA STATISTICĂ MULTIVARIATĂ

Secţia de Matematică. statistică, dedicată matematicii. metode de construire a planurilor optime pentru colectarea, sistematizarea și prelucrarea statisticii multidimensionale. date care vizează identificarea naturii și structurii relației dintre componentele trăsăturii multidimensionale studiate și destinate obținerii științifice și practice. concluzii. Un atribut multidimensional este înțeles ca indicatori p-dimensionali (trăsături, variabile) printre care se pot număra: ordonarea obiectelor analizate în funcție de gradul de manifestare a proprietății studiate în ele; și clasificarea (sau nominală), adică permițând împărțirea setului studiat de obiecte în clase care nu sunt susceptibile de a ordona omogen (în funcție de proprietatea analizată). Rezultatele măsurării acestor indicatori

pe fiecare dintre obiectele populației studiate, ele formează observații multidimensionale, sau o serie inițială de date multidimensionale pentru efectuarea M. s. A. O parte semnificativă din M. s. A. se adresează situațiilor în care trăsătura multidimensională studiată este interpretată ca multidimensională și, în consecință, succesiunea de observații multidimensionale (1) ca din populația generală. În acest caz, alegerea metodelor de procesare a statisticii originale. datele și analiza proprietăților acestora se bazează pe anumite ipoteze privind natura legii distribuției probabilităților multidimensionale (comunite).

Analiza statistică multivariată a distribuțiilor multivariate și a principalelor caracteristici ale acestora acoperă numai situațiile în care observațiile prelucrate (1) sunt de natură probabilistică, adică sunt interpretate ca un eșantion din populația generală corespunzătoare. Sarcinile principale ale acestei subsecțiuni includ: statistice. estimarea distribuţiilor multivariate studiate, a principalelor caracteristici numerice şi parametri ai acestora; studiul proprietăților statisticilor utilizate. evaluări; studiul distribuțiilor de probabilitate pentru un număr de statistici, cu ajutorul cărora sunt construite date statistice. criterii de testare a diverselor ipoteze despre natura probabilistică a datelor multivariate analizate. Principalele rezultate se referă la un caz particular când caracteristica studiată este supusă unei legi de distribuție normală multidimensională, a cărei funcție de densitate este dată de relația

unde este vectorul matematicii. așteptările componentelor variabilei aleatoare, i.e. este matricea de covarianță a vectorului aleator, adică covarianța componentelor vectoriale (se consideră cazul nedegenerat când ; în caz contrar, adică pentru rangul , toate rezultatele rămân valabile, dar așa cum sunt aplicate unui subspațiu de dimensiune inferioară). , în care se dovedește a fi un vector aleator concentrat în studiu).

Deci, dacă (1) este o secvență de observații independente care formează un eșantion aleatoriu din atunci estimările de probabilitate maximă pentru parametri și care participă la (2) sunt, respectiv, statistici (vezi , )

unde vectorul aleatoriu se supune legii normale p-dimensionale și nu depinde de , iar distribuția comună a elementelor matricei este descrisă de așa-numitul Distribuția dorințelor r-t a (vezi), to-rogo

În cadrul aceleiași scheme, distribuțiile și momentele unor astfel de caracteristici ale eșantionului unei variabile aleatoare multidimensionale ca coeficienții corelațiilor perechi, parțiale și multiple, generalizate (adică ), statistici Hotelling generalizate (a se vedea ). În special (vezi ), dacă definim ca matrice de covarianță eșantion estimarea corectată „pentru imparțialitate”, și anume:

apoi variabilă aleatoare tinde spre , iar variabilele aleatoare

respectați distribuțiile F cu numerele de grade de libertate, respectiv (p, n-p) și (p, n 1 + n 2-p-1). În relație (7) p 1și n 2 - volumele a două eșantioane independente de forma (1), extrase din aceeași populație generală - estimări ale formei (3) și (4)-(5), construite pe eșantionul i, și

Covarianța totală a eșantionului, construită din estimări și

Analiza statistică multivariată a naturii și structurii interrelațiilor dintre componentele atributului multidimensional studiat combină conceptele și rezultatele care servesc astfel de metode și modele ale lui M. s. a., ca plural, multidimensional analiza variatieiși analiza covarianței, analiza factorilorși analiza componentelor principale, analiza canonică. corelații. Rezultatele care compun conținutul acestei subsecțiuni pot fi împărțite aproximativ în două tipuri principale.

1) Construirea celei mai bune (într-un anumit sens) statistică. estimări pentru parametrii modelelor menționate și analiza proprietăților acestora (acuratețea, iar în formularea probabilistică - legile distribuției lor, încrederea: arii etc.). Deci, atributul multidimensional studiat să fie interpretat ca un vector aleator, supus distribuției normale p-dimensionale și împărțit în doi subvectori - coloane și dimensiuni q și, respectiv, p-q. Aceasta determină și împărțirea corespunzătoare a vectorului matematic. așteptări, matrice de covarianță teoretică și eșantion, și anume:

Apoi (vezi , ) subvectorul (presupunând că al doilea subvector a luat o valoare fixă ​​) va fi de asemenea normal). În acest caz, estimări de probabilitate maximă. pentru matricele coeficienților de regresie și covarianțele acestui model clasic de regresie multiplă multivariată

vor exista statistici reciproc independente, respectiv

aici repartizarea devizului este supusă legii normale , și estimează n - la legea Wishart cu parametrii și (elementele matricei de covarianță sunt exprimate în termeni de elemente ale matricei ).

Principalele rezultate privind construirea estimărilor parametrilor și studiul proprietăților acestora în modele de analiză factorială, componente principale și corelații canonice se referă la analiza proprietăților probabilistic-statistice ale valorilor proprii și ale vectorilor diferitelor matrice de covarianță eșantion.

În scheme care nu se încadrează în cadrul clasicului. model normal, și cu atât mai mult în cadrul oricărui model probabilistic, principalele rezultate se referă la construcția algoritmilor (și studiul proprietăților acestora) pentru calcularea estimărilor parametrilor care sunt cele mai bune din punctul de vedere al unei calități date exogen ( sau adecvarea) funcţional al modelului.

2) Construirea de statistici. criterii de testare a diverselor ipoteze despre structura relaţiilor studiate. În cadrul unui model normal multivariat (secvențele de observații de forma (1) sunt interpretate ca eșantioane aleatorii din populațiile generale normale multivariate corespunzătoare), de exemplu, sunt construite date statistice. criterii de testare a următoarelor ipoteze.

I. Ipoteze despre egalitatea vectorului matematic. așteptările indicatorilor studiați față de un vector specific dat; se verifică cu ajutorul statisticilor Hotelling cu substituție în formula (6)

II. Ipoteze despre egalitatea vectorilor matematică. așteptări în două populații (cu aceleași, dar necunoscute matrice de covarianță) reprezentate de două eșantioane; verificat folosind statistici (vezi ).

III. Ipoteze despre egalitatea vectorilor matematică. așteptări în mai multe populații generale (cu aceleași, dar necunoscute matrice de covarianță) reprezentate de eșantioanele lor; verificate cu statistici

în care există observația i-a p-dimensională în eșantionul de mărime , reprezentând j-a populație generală, și și sunt estimări de forma (3), construite respectiv separat pentru fiecare dintre eșantioane și pentru eșantionul combinat de mărime

IV. Ipoteza despre echivalența mai multor populații normale reprezentate de eșantioanele lor este verificată folosind statistici

în care - o estimare de forma (4), construită separat de observații j- mostre, j=1, 2, ... , k.

V. Ipotezele despre independența reciprocă a subvectorilor-coloană de dimensiuni, respectiv, în care se împarte vectorul p-dimensional inițial al indicatorilor studiați se verifică cu ajutorul statisticilor

în care și sunt matrice de covarianță eșantion de forma (4) pentru întregul vector și pentru subvectorul său X(i), respectiv.

Analiza statistică multivariată a structurii geometrice a setului studiat de observații multivariate combină conceptele și rezultatele unor astfel de modele și scheme precum analiza discriminanta, amestecuri de distribuții de probabilitate, analiză cluster și taxonomie, scalare multivariată. Nodal în toate aceste scheme este conceptul de distanță (măsuri de proximitate, măsuri de similitudine) între elementele analizate. În același timp, ele pot fi analizate ca obiecte reale, pe fiecare dintre acestea fiind fixate valorile indicatorilor - apoi geometrice. imaginea celui de-al i-lea obiect cercetat va fi un punct în spațiul p-dimensional corespunzător, iar indicatorii înșiși - apoi geometrici. imaginea indicelui l-lea va fi un punct în spațiul n-dimensional corespunzător.

Metodele și rezultatele analizei discriminante (vezi , , ) vizează următoarele sarcini. Se știe că există un anumit număr de populații, iar cercetătorul are câte un eșantion din fiecare populație („training samples”). Este necesar să se construiască cea mai bună regulă de clasificare pe baza eșantioanelor de antrenament disponibile într-un anumit sens, care să permită să se atribuie un anumit element nou (observare) populației sale generale într-o situație în care cercetătorul nu știe dinainte care dintre ele. populaţiilor cărora le aparţine acest element. De obicei, o regulă de clasificare este înțeleasă ca o succesiune de acțiuni: prin calcularea unei funcții scalare din indicatorii studiați, în funcție de valorile cărora, se ia decizia de a atribui un element uneia dintre clase (construcția unui funcția discriminantă); ordonarea indicatorilor propriu-zis în funcție de gradul de informativitate al acestora din punctul de vedere al atribuirii corecte a elementelor la clase; prin calculul probabilităților de clasificare greșită corespunzătoare.

Problema analizei amestecurilor de distribuții de probabilitate (vezi ) cel mai adesea (dar nu întotdeauna) apare și în legătură cu studiul „structurii geometrice” a populației luate în considerare. În acest caz, conceptul de clasa a r-a omogenă este formalizat cu ajutorul unei populații generale descrise de o lege de distribuție (de obicei unimodală), astfel încât distribuția populației generale, din care se extrage eșantionul (1), este descris printr-un amestec de distribuții de forma în care p r - probabilitatea a priori (elementele specifice) clasei a r-a în populația generală. Sarcina este de a avea o statistică „bună”. estimarea (pe eşantion) a parametrilor necunoscuţi şi uneori la. Acest lucru, în special, face posibilă reducerea problemei clasificării elementelor la o schemă de analiză discriminantă, deși în acest caz nu existau mostre de antrenament.

Metodele și rezultatele analizei cluster (clasificare, taxonomie, recunoaștere a modelelor „fără profesor”, vezi , , ) au ca scop rezolvarea următoarei probleme. Geometric a mulțimii de elemente analizate este dată fie de coordonatele punctelor corespunzătoare (adică de matricea ... , n) , sau un set de geometrice caracteristicile poziției lor relative, de exemplu, prin matricea distanțelor perechi. Este necesar să se împartă setul de elemente studiate în clase relativ mici (cunoscute dinainte sau nu), astfel încât elementele unei clase să fie la o distanță mică unele de altele, în timp ce diferitele clase ar fi, dacă este posibil, suficient de reciproc îndepărtate unele de altele și nu ar fi împărțite în astfel de părți care sunt îndepărtate unele de altele.

Problema scalării multidimensionale (vezi ) se referă la o situație în care mulțimea elementelor studiate este specificată folosind o matrice de distanțe pe perechi și constă în alocarea unui număr dat de coordonate (p) fiecăruia dintre elemente în așa fel încât structura distanțelor reciproce perechi între elemente măsurate folosind aceste coordonate auxiliare, în medie, ar fi cea mai puțin diferită de cea dată. Trebuie remarcat faptul că principalele rezultate și metode de analiză a clusterelor și scalare multidimensională sunt de obicei dezvoltate fără nicio presupunere cu privire la natura probabilistică a datelor inițiale.

Scopul aplicației analizei statistice multivariate este, în principal, de a servi următoarele trei probleme.

Problema cercetării statistice a dependenţelor dintre indicatorii analizaţi. Presupunând că setul studiat de indicatori x înregistrați statistic este împărțit, pe baza semnificației semnificative a acestor indicatori și a obiectivelor finale ale studiului, într-un subvector q-dimensional de variabile predictive (dependente) și un subvector (p-q)-dimensional de variabile predictive (independente), putem spune că problema este de a determina, pe baza eșantionului (1), o astfel de funcție vectorială q-dimensională din clasa soluțiilor admisibile F, ar oferi cea mai bună aproximare, într-un anumit sens, a comportamentului subvectorului indicatorilor. În funcție de tipul specific al calității funcționale de aproximare și de natura indicatorilor analizați, aceștia ajung la una sau alta schemă de regresie multiplă, dispersie, covarianță sau analiză confluentă.

Problema clasificării elementelor (obiectelor sau indicatorilor) într-o formulare generală (nestrict) constă în împărțirea întregului set analizat de elemente, prezentate statistic sub forma unei matrice sau matrice, într-un număr relativ mic de omogene, într-un anumit sens, grupuri. În funcție de natura informațiilor a priori și de tipul specific de funcțional care stabilește criteriul de calitate a clasificării, se ajunge la una sau alta schemă de analiză discriminantă, analiza cluster (taxonomie, recunoaștere a modelelor „nesupravegheată”) și împărțirea amestecurilor de distribuții. fi.

Problema reducerii dimensiunii spațiului factorilor studiat și a selectării celor mai informativi indicatori constă în determinarea unui astfel de set dintr-un număr relativ mic de indicatori regăsiți în clasa transformărilor acceptabile ale indicatorilor originali. pe Krom, se atinge o anumită măsură exogenă superioară a conținutului informațional al unui sistem m-dimensional de caracteristici (vezi ). Specificarea funcționalității care stabilește măsura autoinformativității (adică, care vizează conservarea maximă a informațiilor conținute în tabloul statistic (1) în raport cu caracteristicile originale în sine), conduce, în special, la diverse scheme de analiză factorială și principală. componente, la metode de grupare extremă a caracteristicilor. Funcționalele care definesc măsura conținutului informațional extern, adică, care vizează extragerea din (1) a maximului de informații cu privire la unele altele neconținute direct în w, indicativ sau fenomene, conduc la diverse metode de selectare a celor mai informative indicatori în schemele statistice. studii de dependență și analiză discriminantă.

Principalele instrumente matematice ale lui M. s. A. constituie metode speciale în teoria sistemelor de ecuații liniare și în teoria matricelor (metode de rezolvare a unei probleme simple și generalizate de valori proprii și vectori; inversare simplă și pseudoinversie a matricelor; proceduri de diagonalizare a matricelor etc.) și anumite algoritmi de optimizare (metode de coborâre în funcție de coordonate, gradienți adiacenți, ramuri și limite, diferite versiuni de căutare aleatoare și aproximări stocastice etc.).

Lit.: Anderson T., Introducere în analiza statistică multivariată, trad. din engleză, M., 1963; Kendall M. J., Stewart A., Multivariate statistical analysis and time series, trad. din engleză, M., 1976; Bolşev L. N., „Bull. Int. Stat. Inst.”, 1969, nr. 43, p. 425-41; Wishart.J., „Biometrika”, 1928, v. 20A, p. 32-52: Hotelling H., „Ann. Math. Stat.”, 1931, v. 2, p. 360-78; [c] Kruskal J. V., „Psychometrika”, 1964, v. 29, p. 1-27; Ayvazyan S. A., Bezhaeva Z. I., . Staroverov O. V., Clasificarea observațiilor multidimensionale, M., 1974.

S. A. Ayvazyan.


Enciclopedie matematică. - M.: Enciclopedia Sovietică. I. M. Vinogradov. 1977-1985.

Manualul Traducătorului Tehnic

Secțiunea de statistică matematică (vezi), dedicată matematicii. metode care vizează identificarea naturii și structurii relației dintre componentele trăsăturii multidimensionale studiate (vezi) și destinate obținerii științifice. si practic……

În sens larg, o ramură a statisticii matematice (vezi Statistica matematică), care combină metode de studiere a datelor statistice legate de obiecte care sunt caracterizate de mai multe calitative sau cantitative ... ... Marea Enciclopedie Sovietică

ANALIZA STATISTICĂ MULTIVARIATĂ- o secțiune de statistici matematice concepută pentru a analiza relațiile dintre trei sau mai multe variabile. Putem distinge în mod condiționat trei clase principale de A.M.S. Acesta este un studiu al structurii relațiilor dintre variabile și o reducere a dimensiunii spațiului... Sociologie: Enciclopedie

ANALIZA COVARIANTA- - un set de metode matematice. statistici legate de analiza modelelor de dependență a valorii medii a unei anumite variabile aleatoare Y de un set de factori necantitativi F și simultan de un set de factori cantitativi X. În raport cu Y ... ... Enciclopedia sociologică rusă

Secţia de Matematică. statistici, al cărei conținut este dezvoltarea și studiul statisticilor. metode de rezolvare a următoarei probleme de discriminare (discriminare): pe baza rezultatelor observațiilor, determinați care dintre mai multe posibile ... ... Enciclopedia matematică, Orlova Irina Vladlenovna, Kontsevaya Natalya Valerievna, Turundaevsky Viktor Borisovich. Cartea este dedicată analizei statistice multivariate (MSA) și organizării calculelor conform MSA. Pentru a implementa metodele de statistică multivariată, se utilizează un program de procesare statistică ...