5 metodi per descrivere la distribuzione di frequenza

I seguenti metodi sono comunemente usati per rappresentare le distribuzioni di frequenza in forma grafica: 1. Istogramma o diagramma a colonne 2. Diagramma a barre o grafico a barre 3. Poligono di frequenza 4. Poligono a frequenza levigata 5. Diagramma a torta.

Metodo # 1. Istogramma o diagramma a colonne:

È uno dei più popolari e ampiamente utilizzati per presentare una distribuzione di frequenza. Un istogramma è un insieme di rettangoli le cui aree sono proporzionali alle frequenze delle classi. È un grafico in cui le frequenze sono rappresentate da barre. L'istogramma appare come una serie di istogrammi disposti l'uno accanto all'altro in modo verticale.

Notare le seguenti proprietà dell'istogramma:

(i) Le frequenze sono lungo l'asse verticale e i punteggi (CI) sono lungo l'asse orizzontale.

(ii) Si presume che i punteggi siano equamente distribuiti nell'intervallo della classe, dandoci quindi barre rettangolari.

(iii) Le frequenze all'interno di ciascun intervallo di un istogramma sono rappresentate da un rettangolo, la dimensione dell'intervallo essendo la base e la frequenza di tale intervallo l'altezza.

(iv) L'area di ciascun rettangolo in un istogramma corrisponde alla frequenza entro un dato intervallo, mentre l'area totale di un istogramma corrisponde alla frequenza totale (N) della distribuzione.

(v) Un istogramma può essere meglio costruito su una carta millimetrata, che è governata da linee orizzontali e verticali equidistanti.

Vediamo come l'istogramma per la distribuzione di frequenza può essere costruito in due situazioni, cioè quando gli intervalli di classe sono uguali e quando gli intervalli di classe non sono uguali.

Istogramma (uguale intervallo di classe):

Passo 1:

Nella Tabella sono indicate 12 classi inclusive e, come primo passo, queste devono essere convertite in classi con limiti di classe reali o reali come indicato nella seconda colonna della stessa tabella.

Passo 2:

In generale, una classe libera è consentita anche a entrambe le estremità delle classi e deve essere riflessa a due estremi della scala orizzontale, cioè 9.5 e 99.5 (vedi Fig. 2.1). Ciò migliora la leggibilità del grafico ed è anche utile nella costruzione di un poligono di frequenza.

Passo-3:

Quindi questi veri limiti di classe vengono quindi tracciati insieme all'asse orizzontale (asse X) con l'aiuto di un'adeguata scala di misurazione. Per dare simmetria ed equilibrio all'istogramma o a qualsiasi rappresentazione grafica, è necessario fare attenzione nella selezione delle distanze unitarie per rappresentare il limite di classe sull'asse X e le frequenze sull'asse Y.

Per rappresentare queste distanze, le scale di misura su due assi sono così selezionate in modo che l'altezza dell'istogramma o di qualsiasi altra rappresentazione grafica sia di circa il 75 percento della sua larghezza.

Step-4:

Quando il limite inferiore risulta essere un punteggio distante dall'origine, dare una pausa nell'asse X (∫∫) per indicare che l'asse verticale è stato spostato per comodità. Quindi avviare l'asse X con il limite inferiore dell'intervallo di classe più basso.

Un istogramma che rappresenta la distribuzione di frequenza dei punteggi nella Tabella 2.12 è mostrato in Fig. 2.1. In questa figura, l'altezza del rettangolo formato sopra la classe 19.5- 29.5 è di 4 unità lungo la scala verticale e come tale la sua area diventa 4 x 1 = 4 unità quadrate, che è uguale alla frequenza della classe. Allo stesso modo, le altezze degli altri rettangoli formati su classi consecutive sono prese come 6, 8, 12. 9, 7 e 4 rispettivamente.

Istogramma (intervallo di classe non uguale):

Per fare un esempio, raggruppiamo arbitrariamente le classi 150 - 154 e 155-159 in una classe come 150 - 159 * e 185 - 189 e 190 - 194 in una classe come 185 - 194 ** nella Tabella 2.13.

L'intervallo di classe della quarta e decima classe è il doppio rispetto al resto delle classi. Pertanto, le frequenze in queste due classi non sono confrontabili con altre classi. Per stabilire questa comparabilità, le frequenze nelle classi più grandi dovrebbero essere dimezzate o divise per due.

Quindi, prima di formare un istogramma per la distribuzione di frequenza con intervalli di classi disuguali, tutte le classi più grandi dovrebbero essere espresse come multipli di classi più piccole; e quindi dividere le frequenze di classe corrispondenti per questi multipli.

Questa divisione, quindi, fornisce l'altezza dei rettangoli come mostrato nella Tabella 2.14. Tuttavia, le altezze degli altri rettangoli formati su classi di lunghezze unitarie rimarranno uguali alle frequenze corrispondenti della classe. La distribuzione di frequenza dei punteggi nella Tabella 2.14 si riflette in Fig. 2.3.

vantaggi:

1. È semplice e facilmente realizzabile.

2. Tutti i vantaggi della rappresentazione grafica come mostrato in precedenza sono applicabili qui.

limitazioni:

1. È difficile sovrapporre più di un istogramma sullo stesso grafico.

2. Il confronto di diverse distribuzioni di frequenza non può essere effettuato facilmente tramite gli istogrammi. I poligoni di frequenza sono molto più adatti a tale scopo.

3. L'ipotesi che i punteggi siano equamente distribuiti all'interno dell'elemento della configurazione genera un errore più grande quando N è piccolo rispetto a quando N è grande.

4. Non può essere levigato.

Metodo # 2. Diagramma a barre o grafico a barre:

Il diagramma a barre è uno dei dispositivi più semplici e più comunemente usati per presentare dati di serie discreti. Questi sono particolarmente soddisfacenti per dati categoriali o serie. Sono costituiti da un gruppo di rettangoli equidistanti, uno per ciascun gruppo o categoria di dati in cui i valori o le grandezze sono rappresentati dalla lunghezza o dall'altezza dei rettangoli, la larghezza dei rettangoli essendo arbitraria e immateriale.

Questi diagrammi sono detti unidimensionali perché in tali diagrammi viene presa in considerazione solo una dimensione, altezza (o lunghezza) dei rettangoli per presentare i valori dati.

I seguenti punti possono essere presi in considerazione per disegnare diagrammi a barre:

(i) Tutte le barre disegnate in un singolo studio devono avere una larghezza uniforme (sebbene arbitraria) a seconda del numero di barre da disegnare e dello spazio disponibile.

(ii) Si dovrebbe dare una spaziatura corretta ma uniforme tra diverse barre per rendere il diagramma più attraente ed elegante.

(iii) L'altezza (lunghezza) dei rettangoli o delle barre viene presa proporzionale all'ampiezza delle osservazioni, la scala che si sta selezionando tiene in considerazione l'ampiezza dell'osservazione più grande.

(iv) Tutte le barre dovrebbero essere costruite sulla stessa linea di base.

(v) È auspicabile scrivere le cifre (grandezze) rappresentate dalle barre nella parte superiore delle barre per consentire al lettore di avere un'idea precisa del valore senza guardare la scala.

(vi) Le barre possono essere disegnate verticalmente o orizzontalmente. Tuttavia, in pratica, le barre verticali sono generalmente utilizzate perché danno un allettamento attraente e attraente.

(vii) Ove possibile, le barre devono essere disposte da sinistra a destra (dall'alto verso il basso in caso di barre orizzontali) in ordine di grandezza per dare un effetto piacevole.

In una città particolare, il numero totale di scuole è di 24 e la distribuzione gestionale da parte della direzione delle scuole, come mostrato nella Tabella 2.15.

Per una variabile discreta l'unità di misura sull'asse orizzontale non è importante. Né le classi sono legate l'una all'altra. Quindi le barre sono equidistanti e hanno la stessa larghezza sull'asse orizzontale.

Tuttavia, l'altezza delle barre è proporzionale alle rispettive frequenze. I grafici a barre sono frequentemente utilizzati per la presentazione pittorica di dati discreti. Se due variabili vengono utilizzate contemporaneamente, anche i grafici a barre potrebbero essere piuttosto efficaci.

Ad esempio, se insieme al numero totale di scuole (dal punto di vista gestionale) è indicato anche il numero di scuole maschili, scuole femminili e scuole miste, questo può essere fatto sulla stessa carta millimetrata utilizzando colori diversi, ognuno indicando la categoria del sesso. Per ogni gestione ci saranno 4 barre con colori diversi che indicano diverse categorie.

Metodo # 3. Poligono di frequenza:

Un poligono è una figura stretta a molte angolazioni. Il poligono di frequenza è una rappresentazione grafica della distribuzione di frequenza in cui i punti medi dell'IC sono tracciati rispetto alle frequenze.

Vediamo come disegnare un poligono di frequenza:

Passo 1:

Disegna due linee rette perpendicolari l'una all'altra, la linea verticale vicino al lato sinistro del foglio, la linea orizzontale vicino al fondo. Etichettare la linea verticale (asse Y) OY e la linea orizzontale (asse X) OX. Metti la O dove le due linee si intersecano. Questo punto è l'origine.

Per dare simmetria ed equilibrio al poligono, occorre prestare attenzione nella scelta delle distanze unitarie su entrambi gli assi. Una buona regola generale è selezionare le unità X e Y che renderanno le altezze della figura circa il 75% della sua larghezza.

Passo 2:

Il prossimo deve indicare i punti medi della CI sull'asse orizzontale, invece di indicare i confini dell'integrale. Qui deve anche essere indicato il punto medio degli intervalli appena prima dell'intervallo più basso e subito dopo l'intervallo più alto (i punti medi 137 e 202 rispettivamente nella Tabella 2.16). Lungo la linea verticale tracciare le unità per rappresentare le frequenze degli intervalli di classe.

Passo-3:

Nel punto centrale di ciascun intervallo sull'asse X, salire in direzione Y una distanza pari al numero di punteggi dell'intervallo. Piazzare punti in queste posizioni.

Step-4:

Dopo aver tracciato tutti i punti sul grafico, congiungere questi punti con una serie di brevi linee rette per formare il poligono di frequenza.

Metodo n. 4. Poligono di frequenza levigato:

Un poligono di frequenza dovrebbe essere livellato:

io. Per appianare le irregolarità casuali;

ii. Per ottenere una migliore idea di come la figura può apparire se i dati fossero più numerosi;

iii. Per sapere come apparirà un poligono se gli errori di raggruppamento e gli errori di campionamento vengono rimossi da esso;

iv. Accertare la forma che assumerebbe se rappresentasse condizioni liberate da lievi fluttuazioni accidentali.

Nel livellamento di un poligono di frequenza, vengono prese una serie di medie mobili o di corsa, da cui vengono determinate le frequenze nuove o regolate. Per trovare un f regolato o attenuato, aggiungi il f all'intervallo dato e il f s ai due intervalli adiacenti (l'intervallo appena sotto e l'intervallo appena sopra) e dividili per 3.

Ad esempio, la f uniforme per l'intervallo 170-174 nella Tabella 2.17 è (8 + 10 + 6) / 3 o 8.00. Per trovare le f levigate per i due intervalli agli estremi della distribuzione, vale a dire 140-144 e 195-199, è necessaria una procedura leggermente diversa. Per prima cosa, aggiungiamo 0, la f nell'intervallo di passo al di sotto o al di sopra, alla f sull'intervallo dato e alla f sull'intervallo adiacente, e dividiamo per 3. La f levigata per 140-144 è (0 + 1 + 3) / 3 è o 1, 33; e la f uniforme per 195-199 è (2 + 1 + 0) / 3 o 1.00.

Dobbiamo prendere altri due CI sul 135-139 e l'altro 200-204, per il quale il f è preso come 0. Il loro f smoothed in ogni caso, è (0 + 0 + 1) / 3 o .33 e (0 + 0 + 1) / 3 o .33. L'inclusione di questi ultimi due intervalli rende N = 50.00 per la distribuzione ottimizzata.

Se N è grande, la levigatura potrebbe non cambiare la forma di un grafico, e quindi spesso non è necessaria.

vantaggi:

(i) È semplice e facilmente realizzabile.

(Ii) È possibile sovrapporre più di un poligono di frequenza sullo stesso grafico usando linee colorate, linee spezzate, linee tratteggiate, ecc.

(iii) Il confronto di diverse distribuzioni di frequenza può essere fatto facilmente tramite poligoni di frequenza.

(iv) Tutti i vantaggi della rappresentazione grafica discussa in precedenza sono applicabili qui.

(v) Può essere levigato. Limitazioni.

Limitazione:

(ii) La parte dell'area che si trova al di sopra di un dato intervallo non può essere considerata proporzionale alla frequenza di tale intervallo a causa di irregolarità nella superficie di frequenza.

(Ii) L'ipotesi che tutti i punteggi all'interno di un CI cadano nel punto centrale di tale intervallo produce un errore più grande quando N è maggiore di quando N è piccolo.

(Iii) È meno preciso dell'istogramma in quanto non rappresenta in modo preciso, cioè in termini di area, la frequenza su ciascun intervallo.

Il grafico della frequenza cumulativa:

Il grafico della frequenza cumulativa è un altro modo di rappresentare una distribuzione di frequenza per mezzo di un diagramma. Prima di poter tracciare un grafico di frequenza cumulativa, i punteggi della distribuzione devono essere aggiunti in serie o cumulati, come mostrato nella Tabella 2.18.

Per determinare il Cum.f per ogni riga dobbiamo continuare ad aggiungere i f progressivamente dal basso. Per illustrare, nella distribuzione dei punteggi, la prima frequenza cumulativa è 1; 1 + 3, dalla parte bassa della distribuzione, dà 4 come la voce successiva; 4 + 2 = 6; 6 + 4 = 10, ecc. L'ultimo cumulativo / è uguale, ovviamente, a 50 o N, la frequenza totale.

Nel tracciare il poligono di frequenza, la frequenza su ciascun intervallo viene presa al punto centrale dell'intervallo di classe. Ma nel costruire una curva di frequenza cumulativa ogni frequenza cumulativa viene tracciata al limite superiore esatto dell'intervallo in cui cade.

Questo perché aggiungendo progressivamente dal basso verso l'alto ogni vettore di frequenza cumulativo fino al limite superiore esatto dell'intervallo di classe. Con una scala scelta, se prendiamo i limiti superiori dell'asse X lungo l'asse ci e prendiamo il valore Cum- f s lungo l'asse Y, possiamo tracciare un grafico per la distribuzione della frequenza cumulativa.

In una curva di frequenza cumulativa ogni frequenza cumulativa viene tracciata al limite superiore dell'intervallo. Per far iniziare la curva sull'asse X, questo viene avviato a 139, 5 (limite superiore esatto di 134, 5-139, 5), la cui frequenza cumulativa è 0.

La curva percentuale cumulativa o Ogiva:

Nel disegnare un 'Ogive' dobbiamo calcolare le frequenze percentuali cumulative al limite superiore di ogni 'Percentuale di Frequenza cumulativa' significa quale percentuale di N è il Cum- f . La curva percentuale o l'ogiva cumulativa differisce dal grafico della frequenza cumulativa in quanto le frequenze sono espresse come percentuali cumulative di N sull'asse Y anziché come frequenze cumulative. La Tabella 2.19 mostra come le frequenze cumulative possono essere trasformate in percentuale di N.

Nelle colonne (1), (2) e (3) intervalli di classe, sono elencati i limiti superiori di ci e frequenze; e nella colonna (4) le f sono state cumulate dalla parte bassa della distribuzione verso l'alto. Questi Cum- f sono espressi come percentuali di N nella colonna (5). La conversione di Cum- f s in percentuali cumulative può essere effettuata dividendo ogni cumulativo / per N; ad es. 2 + 40 = .05, 6 + 40 = .15, e così via.

Un metodo migliore, specialmente quando è disponibile una calcolatrice, è quello di determinare prima il reciproco. 1 / N, chiamato Rate, e moltiplicare ogni cumulativo f in ordine per questa frazione. Come mostrato nella Tabella 2.19, la frequenza è 1/40 o .025. Quindi, moltiplicando 2 per 0, 025, otteniamo 0, 05 o 5%; 6 X. 025 =. 15 o 15%, ecc.

La curva in figura 2.8 rappresenta un'ogiva tracciata dai dati nella colonna (5), tabella 2.19. I limiti di intervallo esatti sono stati eliminati sull'asse X e una scala consistente in 10 distanze uguali, ciascuna rappresentante il 10% della distribuzione, è stata segnata sull'asse Y. Il primo punto sull'ogiva è collocato 5 unità Y appena sopra 35, 5. L'ultimo punto è 100 unità Y oltre il limite superiore preciso di 56, 5 dell'intervallo della classe più alta.

Dall'osservazione possiamo leggere PR. di diversi punteggi e anche i percentili:

(a) Lettura di percentili dall'ogiva:

Supponiamo di voler scoprire P 2 5- Come sappiamo, P 25 è un punto sotto il quale si trova il 25% dei casi. Cerchiamo di localizzare 25 sull'asse Y e quindi tracciamo una linea orizzontale da questo punto. Incontrerà l'ogiva ad un certo punto.

Da quel punto disegnare una perpendicolare sull'asse X. Dall'asse X possiamo leggere il punteggio. Dall'osservazione possiamo leggere che P 2 5 = 41, 5. Allo stesso modo possiamo leggere che P 50 = 46.7 e P 75 = 49. Possiamo leggere altri percentili allo stesso modo dall'ogiva.

(b) Leggere i punteggi percentili dei punteggi:

Supponiamo di voler sapere che PR di un punteggio di 53.5. Dobbiamo individuare questo punteggio sull'asse X e tracciare una linea verticale da questo punto. La linea incontrerà l'ogiva in un punto dal quale possiamo tracciare una linea orizzontale a sinistra e questa linea incontrerebbe l'asse Y in un punto. Possiamo leggere lo sperma% f a questo punto. Questo cum% / valore è il PR. del punteggio.

Quindi, possiamo leggere che:

PR di un punteggio, 40 = 20

PR di un punteggio, 53 = 90.

Possiamo leggere le PR di qualsiasi altro punteggio dall'ogiva in modo simile.

Metodo # 5. Diagramma a torta:

I diagrammi a torta sono usati molto comunemente per indicare la ripartizione percentuale. È così chiamato perché l'intero grafico sembra una torta, ei componenti della torta assomigliano a fette tagliate dalla torta. Presenta le percentuali e non le cifre assolute.

I diagrammi a torta sono molto utili per mostrare le spese di un Govt., O di un'azienda ecc. Distribuite su diverse teste. Viene anche utilizzato nell'insegnamento della geografia, della scienza, ecc.

I seguenti passi potrebbero essere seguiti nella costruzione di un diagramma a torta:

1. Disegna un cerchio di dimensioni appropriate con una bussola. La dimensione del raggio dipende dallo spazio disponibile e da altri fattori.

2. Preparare i dati sotto forma di% sotto diverse teste. Queste% per vari settori dovrebbero essere trasposte in gradi corrispondenti sul cerchio.

A tale scopo, il valore dell'angolo di ogni sotto-parte deve essere scoperto. Sappiamo che il valore di tutti gli angoli su qualsiasi punto è uguale a 360 °, ovvero l'intero cerchio è 360 ° che rappresenta il 100%. Quindi un% significa 360 ° / 100 = 3, 6 °.

La seguente formula si applicherà quindi per trovare il valore dell'angolo di ogni sottogruppo:

3. Supponiamo che ci siano 3 componenti con il valore del 60% come risultati alti, il 25% come risultati medi e il 15% come risultati inferiori. Pertanto, devono rappresentare rispettivamente 216 ° (60 x 3, 6 °), 90 ° (25 x 3, 6 °) e 54 ° (15 x 3, 6 °).

4. Quando i valori di tutti gli angoli sono stati così determinati, il loro totale potrebbe non essere esattamente 360 ​​° a causa dell'approssimazione. In tal caso, potrebbe essere necessario regolare leggermente il valore dell'angolo per rendere il totale uguale a 360 °.

5. Misurare i punti sul cerchio per rappresentare la dimensione di ciascun settore con l'aiuto di un goniometro. È una pratica comune organizzare i settori in base alle dimensioni, con il settore più grande in alto e altri in

sequenza in senso orario. I settori possono essere etichettati. Le etichette possono essere posizionate all'interno del settore o all'esterno del cerchio.