Misurazione della variabilità: una panoramica

Misurazione della variabilità: una panoramica!

Significato della variabilità:

Variabilità significa "dispersione" o "diffusione". Quindi le misure di variabilità si riferiscono alla dispersione o diffusione di punteggi attorno alla loro tendenza centrale. Le misure di variabilità indicano come la dispersione di distribuzione al di sopra e al di sotto dell'offerta centrale.

Dall'esempio seguente possiamo avere un'idea chiara del concetto di misure di variabilità:

Supponiamo, ci sono due gruppi. In un gruppo ci sono 50 ragazzi e in un altro gruppo 50 ragazze. Viene eseguito un test su entrambi questi gruppi. Il punteggio medio dei ragazzi è 54, 4 e le ragazze sono confrontate con il punteggio medio di entrambi i gruppi, scopriamo che non c'è differenza nelle prestazioni dei due gruppi. Ma supponiamo che i punteggi dei ragazzi siano compresi tra 20 e 80 e che i punteggi delle ragazze siano compresi tra 40 e 60.

Questa differenza nel range indica che i ragazzi sono più variabili, perché coprono più territorio rispetto alle ragazze. Se il gruppo contiene individui con capacità molto diverse, i punteggi saranno sparsi da alto a basso, l'intervallo sarà relativamente ampio e la variabilità diventa grande.

Questa situazione può essere illustrata graficamente nelle figure riportate di seguito:

La figura sopra mostra due distribuzioni di frequenza dell'area (N) e una media (50) ma di variabilità molto diversa. Il gruppo A va dal 20 all'80 e il Gruppo B dal 40 al 60 Il gruppo A è tre volte più variabile del gruppo B-Spread oltre tre volte la distanza sulla scala dei punteggi, sebbene entrambe le distribuzioni abbiano una certa tendenza centrale.

Definizioni di variabilità:

Dizionario di educazione-CV Buono. "La dispersione o variabilità delle osservazioni di una distribuzione su una certa misura di tendenza centrale." Collins Dizionario delle statistiche: "La dispersione è la diffusione di una distribuzione"

AL Bowley:

"La dispersione è la misura della variazione degli articoli."

Brooks and Dicks:

"La dispersione o diffusione è il grado di dispersione o variazione delle variabili rispetto a un valore centrale." Così la proprietà che denota la misura in cui i valori sono dispersi attorno ai valori centrali è chiamata dispersione. Indica anche la mancanza di uniformità nella dimensione degli articoli di una distribuzione.

Bisogno di variabilità:

1. Aiuta ad accertare le misure di deviazione:

Le misure di variabilità ci aiutano a misurare il grado di deviazione, che esiste nei dati. In tal modo è possibile determinare i limiti entro i quali i dati saranno disponibili in una varietà o qualità misurabile.

2. Aiuta a confrontare diversi gruppi:

Con l'aiuto di misure di validità possiamo confrontare i dati originali espressi in unità diverse.

3. È utile integrare le informazioni fornite dalle misure di tendenza centrale.

4. È utile calcolare ulteriori statistiche anticipate in base alle misure di dispersione.

Misure di variabilità:

Esistono quattro misure di variabilità:

1. La gamma

2. La deviazione del quartile

3. La deviazione media

4. La deviazione standard

Questi sono:

1. La gamma:

La gamma è la differenza tra una serie. È la misura più generale di diffusione o dispersione. È una misura della variabilità delle varietà o dell'osservazione tra di loro e non dà un'idea della diffusione delle osservazioni attorno ad un valore centrale.

Intervallo = H-L

Qui H = punteggio più alto

L = punteggio più basso

Esempio:

In una classe, 20 studenti hanno ottenuto i voti come segue:

22, 48, 43, 60, 55, 25, 15, 45, 35, 68, 50, 70, 35, 40, 42, 48, 53, 44, 55, 52

Qui: il punteggio più alto è 70

Il punteggio più basso è 15

Intervallo = H - L = 70 -15 = 55

Se l'intervallo è superiore al gruppo indica più eterogeneità e se l'intervallo è inferiore al gruppo indica più omogeneità. Quindi la gamma ci fornisce un'indicazione immediata e approssimativa della variabilità di una distribuzione.

Meriti della gamma:

1. La portata è facilmente calcolabile e facilmente comprensibile.

2. È la misura più semplice di variabilità.

3. Fornisce una rapida stima della misura della variabilità.

Demeriti della gamma:

1. L'intervallo è fortemente influenzato dalla fluttuazione dei punteggi.

2. Non è basato su tutte le osservazioni della serie. Richiede solo il punteggio più alto e il punteggio più basso in considerazione.

3. Nel caso di un intervallo di distribuzione aperto non può essere utilizzato.

4. È influenzato notevolmente dalle fluttuazioni nel campionamento.

5. È influenzato molto dai punteggi estremi.

6. La serie non è veramente rappresentata dalla gamma. Una distribuzione simmetrica e una simmetrica possono avere lo stesso intervallo ma non la stessa dispersione.

Usi di gamma:

1. L'intervallo è usato come misura della dispersione quando le variazioni nel valore della variabile non sono molto.

2. L'intervallo è la migliore misura di variabilità quando i dati sono troppo sparsi o troppo scarsi.

3. L'intervallo viene utilizzato quando si desidera la conoscenza del punteggio estremo o dello spread totale.

4. Quando viene utilizzata una stima rapida della variabilità, viene utilizzato l'intervallo.

2. The Quartile Deviation (Q):

Accanto alla deviazione del quartile è un'altra misura di variabilità. Si basa sull'intervallo che contiene il cinquanta percento medio dei casi in una data distribuzione. Un quarto significa 1/4 di qualcosa, quando una scala è divisa in quattro parti uguali. "La deviazione quartile o Q è la metà della distanza della scala tra il 75 ° e il 25 ° percentile in una distribuzione di frequenza."

Dalla figura 9.2 abbiamo rilevato che il 1 ° quartile o Q 1 è posizionato in una distribuzione al di sotto del quale il 25% dei casi e al di sopra del quale si trovano i casi del 75%. Il 2 ° quartile o Q2 è una posizione inferiore e superiore a quella dei casi del 50%. È la mediana della distribuzione.

Il 3 ° quartile o Qg è il 75 ° percentile, al di sotto del quale il 75% dei casi e oltre il quale il 25% dei casi giace. Quindi la deviazione del quartile (Q) è la metà delle distanze tra il 3 ° quartile (Q 3 ) e il 1 ° quartile (Q 1 ). È anche noto come la rabbia semi-interquartile.

simbolicamente:

Quindi, per poter calcolare la deviazione del quartile, dobbiamo prima calcolare il primo quartile (Q 1 ) e il terzo quartile (Q 3 )

Dove = L = limite inferiore della classe del primo quartile,

La prima classe del quartile è quella classe, la cui frequenza cumulativa è maggiore del valore di N / 4 quando viene calcolata dalla parte inferiore.

N / 4 = un quarto del numero totale di casi.

F = Frequenza cumulativa dell'intervallo di classe al di sotto del

1a classe quartile.

Fq 1 = La frequenza della classe Q 1

i = Dimensione dell'intervallo di classe 3N

Dove: L = limite inferiore della terza classe del quartile

La terza classe del quartile è quella classe la cui frequenza cumulativa (C f ) è maggiore del valore di 3N / 4 cioè Cf> 3N / 4, quando Cf viene calcolato dall'estremità inferiore.

3N / 4 = ¾ di N o 75% del numero totale di casi.

F = Frequenza cumulativa della classe al di sotto della classe.

fq 2 = La frequenza della classe Q 3 .

i = Dimensione dell'intervallo di classe.

Calcolo del quartile dai dati del gruppo:

Esempio:

Scopri la deviazione quartile dei seguenti dati:

Passi per calcolare la deviazione del quartile:

Passo 1:

Calcola N / 4 ovvero il 25% della distribuzione e 3N / 4 ossia il 75% della distribuzione.

Qui -N = 50 quindi N / 4 = 12, 5

e 3N / 4 = 37, 5

Passo 2:

Calcola il C f dall'estremità inferiore. Come nella tabella-9.1 colonna-3.

Passo-3:

Scopri la classe Q 1 e Q 3 .

In questo esempio:

Ci, 60-64 è di classe Q1 perché C f > N / 4

Ci 75-79 è di classe Q 3 perché

il Cf> 3N / 4

Step-4:

Scopri F per la classe Q 1 e la classe Q 3 . In questo esempio

F per Q 1 classe = 10

F per Q3 class = 30 Step

Passaggio 5:

Scopri Q1 inserendo i valori sopra indicati in formula.

Q 1 = L + N / 4 - F / fq1 xi

Qui L = 59, 5 perché i limiti esatti della classe Q 1 60-64 sono 59, 5-64, 5.

F = 10 il Cf sotto la classe Q 1

Fq 1 = 4: la frequenza esatta della classe Q 1

i = 5, dimensione dell'intervallo di classe

N / 4 = 12, 5

Ora Q 1 = 59, 5+ 12, 5-10 / 4 x 5

= 59, 5 + 2, 5 / 4 x 5

= 59, 5 + 0, 63 x 5

= 59, 5 + 3, 13 = 62, 63

Passaggio 6:

Scopri la Q 3 inserendo i valori nella formula.

Qui L = 74, 5 perché i limiti esatti della classe Q 3 75-79 sono 74, 5-79, 5.

F = 30 il Cf sotto la classe Q 3 .

3N / 4 = 37, 5

Fq 1 = 8 la frequenza esatta della classe Q 3 .

i = 5 dimensioni degli intervalli di classe.

Q 3 = 74, 5 + 37, 5-30 / 8 x 5

= 74, 5 + 7, 5 / 8 x 5 = 74, 5 + .94 x 5

= 74, 5 + 4, 7 = 79, 2

Step 7:

Scopri Q inserendo il valore sopra nella formula.

Q = Q 3 -Q 1/2 = 79, 2 - 62, 63 / 2

= 16, 5 / 2 = 8, 285 = 8, 29

Meriti della deviazione quartile:

1. La deviazione del quartile è semplice da calcolare e facile da capire.

2. È più rappresentativo e si fida di un valore superiore all'intervallo. In caso di intervalli di classe aperti è usato nello studio delle misure di dispersione.

3. Nel caso di intervalli di classe aperti è usato nello studio delle misure di dispersione.

4. È un buon indice di densità del punteggio al centro della distribuzione.

5. Quando prendiamo Median come misura della tendenza centrale in quel momento Q è preferito come misura della dispersione.

6. Come gamma non è influenzato da punteggi estremi.

Demeriti della deviazione quartile:

1. Non è basato su tutte le osservazioni dei dati. Ignora il primo 25% e l'ultimo 25% dei punteggi.

2. Un ulteriore trattamento algebrico non è possibile in caso di Q. È solo una media posizionale. Non studia la variazione dei valori di una variabile da qualsiasi media. Indica semplicemente una distanza su una scala.

3. È influenzato dalla fluttuazione dei punteggi. Il suo valore è influenzato in ogni caso, da un cambiamento nel valore di un singolo punteggio.

4. Q non è una misura adatta di dispersione, quando in una serie c'è una variazione considerevole nei valori dei vari punteggi.

Usi della deviazione quartile:

1. Quando la mediana è la misura della tendenza centrale in quel momento, Q è usato come misura della dispersione.

2. Quando i punteggi estremi influenzano la SD o i punteggi sono sparsi in quel momento Q è usato come misura della variabilità.

3. Quando il nostro interesse principale è conoscere la concentrazione intorno alla mediana - il 50% medio dei casi, in quel momento si usa Q.

4. Quando gli intervalli di classe sono aperti, Q viene utilizzato come misura della dispersione.

3. La deviazione media (AD):

Abbiamo discusso su due variabilità, intervallo e deviazione quartile. Ma nessuna di queste dispersioni indica la composizione della distribuzione. È perché entrambe le dispersioni non prendono in considerazione tutti i punteggi individuali. Siamo in grado di superare alcune delle gravi carenze di intervallo e deviazione del quartile utilizzando un'altra dispersione chiamata Deviazione media o Deviazione media.

"La deviazione media è la media aritmetica di tutte le deviazioni di diversi punteggi dal valore medio dei punteggi senza il rispetto per il segno della deviazione."

Quindi la media aritmetica della deviazione media delle deviazioni di una serie calcolata da una certa misura di tendenza centrale. Quindi la deviazione media è la media delle deviazioni prese dalla loro media (a volte dalla mediana e dalla modalità).

definizioni:

Dizionario delle statistiche Collins:

"La deviazione media è la media dei valori assoluti delle differenze tra i valori di una variabile e la media della sua distribuzione."

Dizionario di educazione, CV Buono:

"Una misura che esprime l'importo medio in base al quale i singoli elementi di una distribuzione si discostano da una misura di tendenza centrale come la media della mediana".

HE Garrett:

"La deviazione media o AD è la media delle deviazioni di tutti i punteggi separati in una serie presa dalla loro media (occasionalmente dalla mediana o dalla modalità)."

Quindi si può dire che la deviazione media o la deviazione media come viene chiamata è la media delle deviazioni di tutti i punteggi.

Non viene tenuto conto dei segni e di tutte le deviazioni se + ve o -ve sono considerati positivi.

dove AD = Deviazione media

£ = Capital Sigma, significa somma totale di

II = Modular in short Mod, significa non rispetto per il segno negativo.

x = deviazione, (X-M)

Calcolo della deviazione media:

Esistono due situazioni per calcolare la deviazione media:

(a) Quando i dati non sono raggruppati.

(b) Quando i dati sono raggruppati.

Calcolo dell'AD da dati non raggruppati.

Esempio:

Trova AD dei seguenti 10 punteggi indicati di seguito:

23, 34, 16, 27, 28, 39, 45, 26, 18, 27

Soluzione:

Passo 1:

Scopri la media dei punteggi con la formula

ΣX / N

Passo 2:

Scopri la deviazione di tutti i punteggi deducendo la media dai punteggi.

Passo-3:

Scopri la deviazione assoluta come mostrato nella tabella 9.2 e poi in Σ | x |

Step-4:

Metti i valori in formula.

AD = 7, 58.

Calcolo dell'AD dai dati raggruppati:

Esempio:

Scopri l'AD dei seguenti dati:

Soluzione :

Passo 1:

Scopri la media della distribuzione.

Media = 70.80

Passo 2:

Scopri il punto medio per ogni intervallo di classe. Come nella colonna -3 della tabella -9.3

Passo-3:

Scopri la x deducendo la media dal punto medio (X). Come mostrato nella colonna -5 della Tabella-9.3.

Step-4:

Scopri la deviazione assoluta o | x |. Come colonna -6 sopra.

Step-5:

Scoprilo f x |. moltiplicando f con | x. Come mostrato nella colonna -7 e scopri Σ | f x |.

Step-6:

Metti i valori sopra in formula.

La formula per AD da dati raggruppati

Dove = AD = Deviazione media

Σ = somma totale di

f = frequenza

x = deviazione cioè (X-M)

N = Numero totale di casi vale a dire Σ f .

Mettendo i valori in formula

Meriti di AD:

1. La deviazione media è rigidamente definita e il suo valore è preciso e definito.

2. È facile da calcolare.

3. È facile da capire. Perché è la media delle deviazioni da una misura di tendenza centrale.

4. Si basa su tutte le osservazioni.

5. È meno influenzato dal valore dei punteggi estremi.

Demeriti di AD:

1. Lo svantaggio più grave con la deviazione media è che ignora i segni algebrici delle deviazioni che sono contrarie alle regole fondamentali della matematica.

2. Un ulteriore trattamento algebrico non è possibile in caso di AD.

3. È usato molto raramente. A causa della deviazione standard è generalmente usato come misura della dispersione.

4. Se calcolato dalla modalità AD non fornisce una misura accurata della dispersione.

Usi della deviazione media:

1. La deviazione media viene utilizzata quando si desidera pesare tutte le deviazioni dalla media in base alla loro dimensione.

2. Quando i punteggi estremi influenzano la deviazione standard in quel momento, l'AD è la migliore misura di dispersione.

3. L'AD è usato quando vogliamo sapere fino a che punto le misure sono distribuite su entrambi i lati della media.

4. Deviazione standard (SD):

Abbiamo discusso tre misure di variabilità, ovvero Range, Deviazione del Quartile e Deviazione media. Abbiamo anche scoperto che tutti loro soffrono di seri inconvenienti.

La gamma appena presa in considerazione solo il punteggio più alto e il punteggio più basso. La deviazione del quartile tiene conto solo del 50% medio dei punteggi e in caso di deviazione media ignoriamo i segni.

Quindi per superare tutte queste difficoltà usiamo un'altra misura di dispersione chiamata Deviazione Standard. È comunemente usato nella ricerca sperimentale in quanto è l'indice di variabilità più stabile. Simbolicamente è scritto come σ (greco sigma piccola lettera).

definizioni:

Collin's Dizionario delle statistiche.

"La deviazione standard è una misura di diffusione o dispersione. È la deviazione quadratica media quadrata. "

Dizionario di educazione-CV Buono.

"Una misura di variabilità ampiamente utilizzata, costituita dalla radice quadrata della media delle deviazioni quadrate dei punteggi dalla media della distribuzione."

La deviazione standard è la radice quadrata del valore medio delle deviazioni quadrate dei punteggi dalla loro media aritmetica.

La SD viene calcolata sommando la deviazione quadrata di ciascuna misura dalla media, divisa per il numero di casi ed estraendo la radice quadrata. Per essere più chiari, dovremmo notare qui che nel calcolo della SD quadriamo tutte le deviazioni separatamente, troviamo la loro somma, dividiamo la somma per il numero totale di punteggi e poi troviamo la radice quadrata della media della deviazione quadrata. In questo modo viene anche chiamata la "deviazione quadrata media della radice".

Il quadrato della deviazione standard è chiamato Varianza (σ 2 ). Si riferisce a come la deviazione quadrata media. È anche chiamato la dispersione del secondo momento.

Calcolo della SD da dati non raggruppati:

Esempio:

Scopri la SD dei seguenti dati:

6, 8, 10, 12, 5, 8, 9, 17, 20, 11.

Soluzione:

Passo 1:

Scopri la media dei punteggi.

Passo 2:

Scopri la deviazione (x) di ogni punteggio.

Calcolo della SD dai dati raggruppati:

Nei dati raggruppati, la SD può essere calcolata in due modi:

1. Metodo diretto o metodo lungo

2. Metodo corto o metodo medio supposto

1. Metodo diretto o metodo lungo:

Esempio:

Scopri la SD della seguente distribuzione:

Soluzione:

Passo 1:

Scopri il punto medio di ciascun intervallo di classe. (Tabella Colum-3 9.4)

Passo 2:

Scopri la media della distribuzione:

Qui M = Σ f x / N = 3540/50

= 70.80

Passaggio 3:

Scopri la deviazione (x) deducendo la media dai punti.

Passaggio 4:

Scopri la f x moltiplicando la f (col-2) con x (col-5)

Step-5:

Scopri la f x moltiplicando f x (col-2) con x (col-5)

Step-6:

Calcola Σ f x aggiungendo i valori in col-7.

Step-7:

Metti i valori in formula.

2. Metodo corto o metodo medio presunto:

In breve il calcolo del metodo di SD è facile e richiede meno tempo. Se i punti centrali degli intervalli di classe sono numeri decimali, diventa più complicato calcolare l'SD nel metodo lungo. Questo metodo consiste essenzialmente nell'indovinare o nell'assumere una media e successivamente applicare una correzione per dare una media effettiva. In modo che sia chiamato come metodo medio assunto.

Esempio:

Calcola la SD, della seguente distribuzione:

Soluzione:

Passo 1:

Assumi il punto centrale di qualsiasi intervallo di classe come "Media assunta". Ma è meglio assumere il punto medio dell'intervallo di classe nel mezzo avendo la frequenza più alta come media assunta. Qui supponiamo = 72 come media assunta.

Passo 2:

Scopri x (deviazione dei punteggi dalla media assunta) come mostrato in col-3.

x '= X - M / i

Passo-3:

Calcola f x ', moltiplicando x' con f (col-4).

Step-4:

Calcola f x 2 moltiplicando x '(col-3) con f x (col-5).

Step-5:

Scopri Σ f x 'e Σ f x ' 2 it 'aggiungendo i valori in col-4 e col-5 rispettivamente. '

Step-6:

Metti i valori in formula:

La formula per SD in breve è:

Dove i = Dimensione dell'intervallo di classe

Σ = somma totale di

f = frequenza

x '= deviazione dei punteggi dalla loro media ipotizzata.

Ora se sostituiremo Σ f x '/ N al posto di C.

La formula sarà la seguente:

Ora inserendo i valori nella formula otteniamo.

1.Se un valore costante viene aggiunto a ciascun punteggio o sottratto da ciascun punteggio, il valore di SD rimane invariato:

Significa che la SD è indipendente dal cambiamento di origine (addizione, sottrazione). Quindi se un valore costante viene aggiunto o sottratto da ogni varietà, la SD rimane la stessa.

Possiamo esaminare questo dal seguente esempio:

Nella tabella sopra sono indicati punteggi di 5 studenti. Vediamo cosa succede alla SD dei punteggi se aggiungiamo un numero costante diciamo 5 e sottraiamo 5 da ogni punteggio.

2. Se un valore costante viene moltiplicato o diviso per i punteggi originali, anche il valore di SD viene moltiplicato o diviso per lo stesso numero:

Significa che la SD è indipendente dal cambiamento di scala (moltiplicazione, divisione). Se moltiplichiamo i punteggi originali per un numero costante, anche la SD viene moltiplicata per lo stesso numero.

Di nuovo, se dividiamo ogni punteggio per un numero costante, anche la SD viene divisa per lo stesso numero.

Possiamo illustrarlo con il seguente esempio:

Nella tabella sopra sono indicati punteggi di 5 studenti. Vediamo cosa succede alla SD dei 5 punteggi se la moltiplichiamo con un numero costante diciamo 2 e lo dividiamo con lo stesso numero costante.

Così da ciò abbiamo scoperto che se i punteggi sono moltiplicati con un numero costante anche il σ viene moltiplicato con quello. Se i punteggi sono divisi per un numero costante, anche σ viene diviso per lo stesso numero.

Meriti di SD:

1. La deviazione standard è rigidamente definita e il suo valore è sempre definito.

2. Si basa su tutte le osservazioni dei dati.

3. È capace di un ulteriore trattamento algebrico e possiede molte proprietà matematiche.

4. A differenza di Q e AD, è meno influenzato dalle fluttuazioni dei punteggi.

5. A differenza di AD, non ignora i segni negativi. Con la quadratura delle deviazioni supera queste difficoltà.

6. È la misura affidabile e più accurata della variabilità. Va sempre con la media che è la misura più stabile della tendenza centrale.

7. La SD fornisce una misura che è un significato paragonabile da un test all'altro. Soprattutto le unità della curva normale sono espresse in un'unità.

Demeriti di SD:

1. La SD è difficile da capire e non facile da calcolare.

2. La SD dà maggior peso a punteggi e perdite estremi a quelli che sono più vicini alla media. È perché i quadrati delle deviazioni, che sono di grandi dimensioni, sarebbero proporzionalmente maggiori dei quadrati di quelle deviazioni che sono relativamente piccole.

Usi della SD:

1. La SD viene utilizzata quando la nostra spinta è di misurare la variabilità che ha maggiore stabilità.

2. Quando le deviazioni estreme possono influenzare la variabilità in quel momento viene utilizzata la SD.

3. La SD viene utilizzata per calcolare le ulteriori statistiche come il coefficiente di correlazione, i punteggi standard, gli errori standard, l'analisi della varianza, l'analisi della co-varianza, ecc.

4. Quando viene utilizzata l'interpretazione dei punteggi in termini di NPC, viene utilizzata la SD.

5. Quando vogliamo determinare l'affidabilità e la validità dei punteggi dei test, viene utilizzata la SD.

Deviazione standard combinata:

Durante il lavoro di ricerca a volte preleviamo più di un campione dalla popolazione. Pertanto otteniamo diverse SD per ciascun gruppo o campione. Ma a volte abbiamo bisogno di interpretare questi risultati come un unico gruppo. Pertanto, quando insiemi di punteggi diversi sono stati combinati in un singolo lotto, è possibile calcolare la SD della distribuzione totale dalle SD dei sottogruppi.

Formula per calcolare la deviazione standard combinata o è la seguente:

N 1, N 2, N n = Numero di punteggi nel gruppo 1, gruppo 2 quindi fino all'ennesima categoria.

d = (Mean-M comb ) 'd' si trova sottraendo M comb dalla media del gruppo in questione.

Allo stesso modo d 1, d 2 ... d n sono scoperti.

σ = Deviazione standard del gruppo in questione σ 1, σ 2, σ 3 significa σ del gruppo 1, gruppo 2, gruppo 3 ecc.

Esempio:

Soluzione:

Adesso metti i valori in formula.