docgid.ru

Le cifre medie nelle statistiche sono. Come calcolare la media in Excel

In statistica si utilizzano vari tipi di medie, che si dividono in due grandi classi:

Medie di potenza (media armonica, media geometrica, media aritmetica, media quadratica, media cubica);

Mezzi strutturali (modalità, mediana).

Calcolare medie di potenzaè necessario utilizzare tutti i valori caratteristici disponibili. Moda E mediano sono determinati solo dalla struttura della distribuzione, quindi sono chiamati medie strutturali e posizionali. La mediana e la moda sono spesso utilizzate come caratteristiche medie in quelle popolazioni in cui il calcolo della media della potenza è impossibile o poco pratico.

Il tipo più comune di media è la media aritmetica. Sotto significato aritmeticoè inteso come il valore di una caratteristica che ciascuna unità della popolazione avrebbe se la somma totale di tutti i valori della caratteristica fosse distribuita equamente tra tutte le unità della popolazione. Il calcolo di questo valore si riduce alla somma di tutti i valori della caratteristica variabile e alla divisione dell'importo risultante per il numero totale di unità della popolazione. Ad esempio, cinque lavoratori hanno eseguito un ordine per la produzione di pezzi, mentre il primo ha realizzato 5 pezzi, il secondo – 7, il terzo – 4, il quarto – 10, il quinto – 12. Poiché nei dati di origine il valore di ciascuno l'opzione si è verificata solo una volta, da determinare

Per determinare la produzione media di un lavoratore, si dovrebbe applicare la semplice formula della media aritmetica:

cioè nel nostro esempio, la produzione media di un lavoratore è pari a

Insieme alla semplice media aritmetica, studiano media aritmetica ponderata. Ad esempio, calcoliamo l'età media degli studenti in un gruppo di 20 persone, la cui età varia dai 18 ai 22 anni, dove xi– varianti della caratteristica mediata, fi– frequenza, che mostra quante volte si verifica i-esimo valore complessivo (Tabella 5.1).

Tabella 5.1

Età media degli studenti

Applicando la formula della media aritmetica ponderata, otteniamo:


Esiste una certa regola per scegliere una media aritmetica ponderata: se c'è una serie di dati su due indicatori, per uno dei quali è necessario calcolare

valore medio, e allo stesso tempo i valori numerici del denominatore della sua formula logica sono noti, e i valori del numeratore sono sconosciuti, ma possono essere trovati come il prodotto di questi indicatori, quindi il valore medio dovrebbe essere calcolati utilizzando la formula della media aritmetica ponderata.

In alcuni casi, la natura dei dati statistici iniziali è tale che il calcolo della media aritmetica perde il suo significato e l'unico indicatore generalizzante può essere solo un altro tipo di valore medio - media armonica. Attualmente, le proprietà computazionali della media aritmetica hanno perso la loro rilevanza nel calcolo degli indicatori statistici generali a causa della diffusa introduzione della tecnologia informatica elettronica. La media armonica, che può essere anche semplice e ponderata, ha acquisito grande importanza pratica. Se i valori numerici del numeratore di una formula logica sono noti e i valori del denominatore sono sconosciuti, ma possono essere trovati come divisione parziale di un indicatore per un altro, il valore medio viene calcolato utilizzando l'armonica formula della media ponderata.

Ad esempio, si sappia che l'auto ha percorso i primi 210 km ad una velocità di 70 km/he i restanti 150 km ad una velocità di 75 km/h. È impossibile determinare la velocità media di un'auto lungo l'intero percorso di 360 km utilizzando la formula della media aritmetica. Poiché le opzioni sono velocità nelle singole sezioni xj= 70 km/h e X2= 75 km/h, e i pesi (fi) sono considerati i tratti corrispondenti del percorso, allora i prodotti delle opzioni e dei pesi non avranno né significato fisico né economico. In questo caso i quozienti acquistano significato dividendo i tratti del percorso nelle corrispondenti velocità (opzioni xi), ovvero il tempo impiegato per percorrere i singoli tratti del percorso (fi / xi). Se i segmenti del percorso sono indicati con fi, allora l'intero percorso sarà espresso come?fi, e il tempo trascorso sull'intero percorso sarà espresso come?fi. fi / xi , Quindi la velocità media può essere trovata come il quoziente dell'intero percorso diviso per il tempo totale impiegato:

Nel nostro esempio otteniamo:

Se, quando si utilizza la media armonica, i pesi di tutte le opzioni (f) sono uguali, allora al posto di quello ponderato è possibile utilizzare media armonica semplice (non ponderata):

dove xi sono le opzioni individuali; N– numero di varianti della caratteristica mediata. Nell'esempio della velocità, si potrebbe applicare la media armonica semplice se i segmenti del percorso percorsi a velocità diverse fossero uguali.

Qualsiasi valore medio deve essere calcolato in modo tale che, quando sostituisce ciascuna variante della caratteristica media, il valore di qualche indicatore generale finale associato all'indicatore medio non cambi. Pertanto, quando si sostituiscono le velocità effettive sui singoli tratti del percorso con il loro valore medio (velocità media), la distanza totale non dovrebbe cambiare.

La forma (formula) del valore medio è determinata dalla natura (meccanismo) della relazione di questo indicatore finale con quello medio, quindi l'indicatore finale, il cui valore non dovrebbe cambiare quando si sostituiscono le opzioni con il loro valore medio, è chiamato indicatore di definizione. Per ricavare la formula della media, è necessario creare e risolvere un'equazione utilizzando la relazione tra l'indicatore medio e quello determinante. Questa equazione viene costruita sostituendo le varianti della caratteristica (indicatore) mediate con il loro valore medio.

Oltre alla media aritmetica e alla media armonica, nelle statistiche vengono utilizzati altri tipi (forme) di media. Sono tutti casi particolari potenza media. Se calcoliamo tutti i tipi di medie di potenza per gli stessi dati, allora i valori

risulteranno essere gli stessi, qui vale la regola tasso maggiore media. All’aumentare dell’esponente della media aumenta il valore medio stesso. Le formule più frequentemente utilizzate per il calcolo di vari tipi di medie di potenza nella ricerca pratica sono presentate nella tabella. 5.2.

Tabella 5.2

Tipi di mezzi di potere


La media geometrica viene utilizzata quando esiste N coefficienti di crescita, mentre i valori individuali della caratteristica sono, di regola, valori dinamici relativi, costruiti sotto forma di valori a catena, come rapporto con il livello precedente di ciascun livello nella serie dinamica. La media caratterizza quindi il tasso di crescita medio. Geometria media semplice calcolato dalla formula

Formula media geometrica ponderata ha la seguente forma:

Le formule di cui sopra sono identiche, ma una viene applicata per i coefficienti attuali o i tassi di crescita e la seconda viene applicata ai valori assoluti dei livelli delle serie.

Quadrato medio utilizzato nei calcoli con i valori delle funzioni quadratiche, utilizzato per misurare il grado di fluttuazione dei singoli valori di una caratteristica attorno alla media aritmetica nella serie di distribuzione ed è calcolato dalla formula

Media quadrata ponderata calcolato utilizzando un'altra formula:

Cubicità media viene utilizzato quando si calcola con valori di funzioni cubiche e viene calcolato dalla formula

cubatura media ponderata:

Tutti i valori medi discussi sopra possono essere presentati come una formula generale:

dov'è il valore medio; – significato individuale; N– numero di unità della popolazione oggetto di studio; K– esponente che determina il tipo di media.

Quando si utilizzano gli stessi dati di origine, tanto più K nella formula generale della media della potenza, maggiore è il valore medio. Ne consegue che esiste una relazione naturale tra i valori delle medie di potenza:

I valori medi sopra descritti danno un'idea generalizzata della popolazione studiata e, da questo punto di vista, il loro significato teorico, applicato ed educativo è indiscutibile. Ma succede che il valore medio non coincide con nessuna delle opzioni effettivamente esistenti, quindi, oltre alle medie considerate, nell'analisi statistica è consigliabile utilizzare i valori di opzioni specifiche che occupano una posizione molto specifica nel serie ordinata (classificata) di valori di attributo. Tra queste quantità, le più comunemente utilizzate sono strutturale, O descrittivo, medio– moda (Mo) e mediana (Me).

Moda– il valore di una caratteristica che si riscontra più spesso in una data popolazione. In relazione a una serie variazionale, la moda è il valore che ricorre più frequentemente della serie classificata, ovvero l'opzione con la frequenza più alta. La moda può essere utilizzata per determinare i negozi visitati più spesso e il prezzo più comune per qualsiasi prodotto. Mostra la dimensione di una caratteristica caratteristica di una parte significativa della popolazione ed è determinata dalla formula

dove x0 è il limite inferiore dell'intervallo; H– dimensione dell'intervallo; FM– frequenza dell'intervallo; fm_ 1 – frequenza dell'intervallo precedente; FM+ 1 – frequenza dell'intervallo successivo.

Mediano viene richiamata l'opzione situata al centro della riga classificata. La mediana divide la serie in due parti uguali in modo che vi sia lo stesso numero di unità di popolazione su entrambi i lati. In questo caso, metà delle unità della popolazione ha un valore della caratteristica variabile inferiore alla mediana, mentre l'altra metà ha un valore maggiore di essa. La mediana viene utilizzata quando si studia un elemento il cui valore è maggiore o uguale o allo stesso tempo inferiore o uguale alla metà degli elementi di una serie di distribuzione. La mediana dà un’idea generale di dove sono concentrati i valori degli attributi, in altre parole, dove si trova il loro centro.

La natura descrittiva della mediana si manifesta nel fatto che essa caratterizza il limite quantitativo dei valori di una caratteristica variabile che possiede la metà delle unità della popolazione. Il problema di trovare la mediana per una serie di variazioni discrete è facilmente risolvibile. Se a tutte le unità della serie vengono assegnati numeri di serie, allora il numero di serie dell'opzione mediana viene determinato come (n + 1) / 2 con un numero dispari di membri pari a n. Se il numero di membri della serie è un numero pari , la mediana sarà il valore medio di due opzioni che hanno numeri di serie N/2 e N/ 2 + 1.

Quando si determina la mediana nelle serie di variazioni di intervallo, determinare innanzitutto l'intervallo in cui si trova (intervallo mediano). Questo intervallo è caratterizzato dal fatto che la somma accumulata delle frequenze è pari o superiore alla metà della somma di tutte le frequenze della serie. La mediana di una serie di variazioni di intervallo viene calcolata utilizzando la formula

Dove X0– limite inferiore dell'intervallo; H– dimensione dell'intervallo; FM– frequenza dell'intervallo; F– numero dei membri della serie;

M -1 – la somma dei termini accumulati della serie precedente a quella data.

Insieme alla mediana, per caratterizzare più compiutamente la struttura della popolazione studiata, vengono utilizzati anche altri valori di opzioni che occupano una posizione ben specifica nelle serie classificate. Questi includono quartili E decili. I quartili dividono la serie in base alla somma delle frequenze in 4 parti uguali e i decili in 10 parti uguali. Ci sono tre quartili e nove decili.

La mediana e la moda, a differenza della media aritmetica, non eliminano le differenze individuali nei valori di una caratteristica variabile e quindi sono caratteristiche aggiuntive e molto importanti della popolazione statistica. In pratica, vengono spesso utilizzati al posto della media o insieme ad essa. È particolarmente consigliabile calcolare la mediana e la moda nei casi in cui la popolazione in studio contiene un certo numero di unità con un valore molto grande o molto piccolo della caratteristica variabile. Questi valori delle opzioni, poco caratteristici della popolazione, pur influenzando il valore della media aritmetica, non influiscono sui valori della mediana e della moda, il che rende questi ultimi indicatori molto preziosi per i fini economici e statistici. analisi.

5.1. Il concetto di media

Valore medio - Si tratta di un indicatore generale che caratterizza il livello tipico del fenomeno. Esprime il valore di una caratteristica per unità di popolazione.

La media generalizza sempre la variazione quantitativa di un tratto, cioè nei valori medi vengono eliminate le differenze individuali tra unità della popolazione dovute a circostanze casuali. A differenza della media, il valore assoluto che caratterizza il livello di una caratteristica di una singola unità di una popolazione non consente di confrontare i valori di una caratteristica tra unità appartenenti a popolazioni diverse. Pertanto, se è necessario confrontare i livelli di retribuzione dei lavoratori di due imprese, non è possibile confrontare su questa base due dipendenti di diverse imprese. La retribuzione dei lavoratori selezionati per il confronto potrebbe non essere tipica di queste imprese. Se confrontiamo l'entità dei fondi salariali nelle imprese considerate, il numero dei dipendenti non viene preso in considerazione e quindi è impossibile determinare dove il livello dei salari è più alto. In definitiva, è possibile confrontare solo gli indicatori medi, vale a dire Quanto guadagna in media un dipendente in ciascuna impresa? Pertanto, è necessario calcolare il valore medio come caratteristica generalizzante della popolazione.

Il calcolo della media è una delle tecniche di generalizzazione comuni; l'indicatore medio nega ciò che è comune (tipico) a tutte le unità della popolazione studiata, mentre allo stesso tempo ignora le differenze delle singole unità. In ogni fenomeno e nel suo sviluppo c'è una combinazione di caso e necessità. Nel calcolo delle medie, a causa dell'azione della legge dei grandi numeri, la casualità si annulla e si bilancia, quindi è possibile astrarre dalle caratteristiche non importanti del fenomeno, dai valori quantitativi della caratteristica in ogni caso specifico . La capacità di astrarre dalla casualità dei valori e delle fluttuazioni individuali risiede nel valore scientifico delle medie come caratteristiche generalizzanti degli aggregati.

Affinché la media sia veramente rappresentativa, deve essere calcolata tenendo conto di alcuni principi.

Soffermiamoci su alcuni principi generali per l'uso delle medie.
1. La media deve essere determinata per popolazioni costituite da unità qualitativamente omogenee.
2. La media deve essere calcolata per una popolazione costituita da un numero sufficientemente elevato di unità.
3. La media deve essere calcolata per una popolazione le cui unità si trovano in uno stato naturale normale.
4. La media dovrebbe essere calcolata tenendo conto del contenuto economico dell'indicatore in esame.

5.2. Tipi di medie e metodi per calcolarle

Consideriamo ora i tipi di valori medi, le caratteristiche del loro calcolo e le aree di applicazione. I valori medi si dividono in due grandi classi: medie di potenza, medie strutturali.

A potenza media Questi includono i tipi più conosciuti e utilizzati frequentemente, come la media geometrica, la media aritmetica e la media quadratica.

COME medie strutturali vengono considerate la moda e la mediana.

Concentriamoci sulle medie di potenza. Le medie di potenza, a seconda della presentazione dei dati di origine, possono essere semplici o ponderate. Media semplice Viene calcolato sulla base di dati non raggruppati e ha la seguente forma generale:

dove X i è la variante (valore) della caratteristica mediata;

n – opzione numero.

Media ponderata viene calcolato in base a dati raggruppati e ha un aspetto generale

,

dove X i è la variante (valore) della caratteristica mediata o il valore medio dell'intervallo in cui viene misurata la variante;
m – indice medio dei titoli di studio;
f i – frequenza che mostra quante volte si verifica il valore i-e della caratteristica media.

Diamo come esempio il calcolo dell'età media degli studenti in un gruppo di 20 persone:


Calcoliamo l'età media utilizzando la formula media semplice:

Raggruppiamo i dati di origine. Otteniamo la seguente serie di distribuzione:

Come risultato del raggruppamento, otteniamo un nuovo indicatore: la frequenza, che indica il numero di studenti di X anni. Pertanto l’età media degli studenti del gruppo verrà calcolata utilizzando la formula della media ponderata:

Le formule generali per il calcolo delle medie di potenza hanno un esponente (m). A seconda del valore che assume si distinguono le seguenti tipologie di medie di potenza:
media armonica se m = -1;
media geometrica, se m –> 0;
media aritmetica se m = 1;
radice quadrata media se m = 2;
cubo medio se m = 3.

Le formule per le medie di potenza sono riportate nella tabella. 4.4.

Se calcoli tutti i tipi di medie per gli stessi dati iniziali, i loro valori risulteranno diversi. Qui vale la regola della maggioranza delle medie: all’aumentare dell’esponente m aumenta anche il corrispondente valore medio:

Nella pratica statistica, le medie aritmetiche e le medie ponderate armoniche vengono utilizzate più spesso rispetto ad altri tipi di medie ponderate.

Tabella 5.1

Tipi di mezzi di potere

Tipo di potere
media
Indice
grado (m)
Formula di calcolo
Semplice Ponderato
Armonico -1
Geometrico 0
Aritmetica 1
Quadratico 2
Cubo 3

La media armonica ha una struttura più complessa della media aritmetica. La media armonica viene utilizzata per i calcoli quando come pesi non vengono utilizzate le unità della popolazione - i portatori della caratteristica, ma il prodotto di queste unità per i valori della caratteristica (cioè m = Xf). Si dovrebbe ricorrere alla media armonica semplice nei casi di determinazione, ad esempio, del costo medio della manodopera, del tempo, dei materiali per unità di produzione, per una parte per due (tre, quattro, ecc.) Imprese, lavoratori impegnati nella produzione dello stesso tipo di prodotto, della stessa parte, di prodotto.

Il requisito principale per la formula per il calcolo del valore medio è che tutte le fasi del calcolo abbiano una giustificazione realmente significativa; il valore medio risultante dovrebbe sostituire i singoli valori dell'attributo per ciascun oggetto senza interrompere la connessione tra gli indicatori individuali e quelli sintetici. In altre parole, il valore medio deve essere calcolato in modo tale che quando ogni singolo valore dell'indicatore medio viene sostituito dal suo valore medio, qualche indicatore riassuntivo finale, collegato in un modo o nell'altro al valore medio, rimanga invariato. Questo totale è chiamato definendo poiché la natura del suo rapporto con i valori individuali determina la formula specifica per il calcolo del valore medio. Dimostriamo questa regola usando l'esempio della media geometrica.

Formula della media geometrica

utilizzato più spesso quando si calcola il valore medio in base alla dinamica relativa individuale.

La media geometrica viene utilizzata se viene data una sequenza di dinamiche relative a catena, che indica, ad esempio, un aumento della produzione rispetto al livello dell'anno precedente: i 1, i 2, i 3,..., i n. Ovviamente il volume della produzione nell'ultimo anno è determinato dal suo livello iniziale (q 0) e dal successivo aumento nel corso degli anni:

q n =q 0 × io 1 × io 2 ×...×io n .

Prendendo q n come indicatore determinante e sostituendo i singoli valori degli indicatori dinamici con quelli medi, arriviamo alla relazione

Da qui

5.3. Medie strutturali

Un tipo speciale di valori medi - medie strutturali - viene utilizzato per studiare la struttura interna delle serie di distribuzione dei valori degli attributi, nonché per stimare il valore medio (tipo di potenza), se, secondo i dati statistici disponibili, il suo il calcolo non può essere eseguito (ad esempio, se nell'esempio considerato non ci fossero dati sia sul volume di produzione che sull'importo dei costi per gruppo di imprese).

Gli indicatori vengono spesso utilizzati come medie strutturali moda - il valore ripetuto più frequentemente dell'attributo – e mediane – il valore di una caratteristica che divide la sequenza ordinata dei suoi valori in due parti uguali. Di conseguenza, per la metà delle unità della popolazione il valore dell'attributo non supera il livello mediano e per l'altra metà non è inferiore ad esso.

Se la caratteristica oggetto di studio ha valori discreti, non ci sono particolari difficoltà nel calcolo della moda e della mediana. Se i dati sui valori dell'attributo X sono presentati sotto forma di intervalli ordinati della sua variazione (serie di intervalli), il calcolo della moda e della mediana diventa un po' più complicato. Poiché il valore mediano divide l'intera popolazione in due parti uguali, finisce in uno degli intervalli della caratteristica X. Utilizzando l'interpolazione, il valore della mediana si trova in questo intervallo mediano:

,

dove X Me è il limite inferiore dell'intervallo mediano;
h Me – il suo valore;
(Somma m)/2 – metà del numero totale di osservazioni o metà del volume dell'indicatore utilizzato come ponderazione nelle formule per il calcolo del valore medio (in termini assoluti o relativi);
S Me-1 – la somma delle osservazioni (o il volume dell'attributo di ponderazione) accumulate prima dell'inizio dell'intervallo mediano;
m Me – il numero di osservazioni o il volume della caratteristica di ponderazione nell'intervallo mediano (anche in termini assoluti o relativi).

Nel nostro esempio si possono ottenere anche tre valori mediani, in base al numero di imprese, al volume di produzione e ai costi di produzione totali:

Pertanto, nella metà delle imprese il costo per unità di produzione supera i 125,19 mila rubli, la metà del volume totale dei prodotti viene prodotta con un costo per prodotto superiore a 124,79 mila rubli. e il 50% dei costi totali si forma quando il costo di un prodotto supera i 125,07 mila rubli. Si noti inoltre che esiste una certa tendenza all'aumento dei costi, poiché Me 2 = 124,79 mila rubli e il livello medio è di 123,15 mila rubli.

Quando si calcola il valore modale di una caratteristica sulla base dei dati di una serie di intervalli, è necessario prestare attenzione al fatto che gli intervalli sono identici, poiché da questo dipende l'indicatore di ripetibilità dei valori della caratteristica X. Per una serie di intervalli con intervalli uguali, la grandezza della moda è determinata come

dove X Mo è il valore inferiore dell'intervallo modale;
m Mo – numero di osservazioni o volume della caratteristica di ponderazione nell'intervallo modale (in termini assoluti o relativi);
m Mo -1 – idem per l'intervallo precedente quello modale;
m Mo+1 – idem per l'intervallo successivo a quello modale;
h – il valore dell'intervallo di cambiamento della caratteristica nei gruppi.

Per il nostro esempio, possiamo calcolare tre valori modali in base alle caratteristiche del numero di imprese, del volume dei prodotti e dell'importo dei costi. In tutti e tre i casi, l’intervallo modale è lo stesso, poiché per lo stesso intervallo il numero di imprese, il volume della produzione e l’importo totale dei costi di produzione sono maggiori:

Pertanto, molto spesso ci sono imprese con un livello di costo di 126,75 mila rubli, molto spesso i prodotti vengono realizzati con un livello di costo di 126,69 mila rubli e molto spesso i costi di produzione sono spiegati da un livello di costo di 123,73 mila rubli.

5.4. Indicatori di variazione

Le condizioni specifiche in cui si trova ciascuno degli oggetti studiati, nonché le caratteristiche del proprio sviluppo (sociale, economico, ecc.) sono espresse dai corrispondenti livelli numerici degli indicatori statistici. Così, variazione, quelli. la discrepanza tra i livelli dello stesso indicatore in diversi oggetti è di natura oggettiva e aiuta a comprendere l'essenza del fenomeno studiato.

Esistono diversi metodi utilizzati per misurare la variazione nelle statistiche.

Il più semplice è calcolare l'indicatore intervallo di variazione H come differenza tra i valori massimo (X max) e minimo (X min) osservati della caratteristica:

H=Xmax - Xmin .

Tuttavia, l’intervallo di variazione mostra solo i valori estremi del tratto. La ripetibilità dei valori intermedi non viene presa in considerazione qui.

Le caratteristiche più stringenti sono indicatori di variabilità rispetto al livello medio dell'attributo. L'indicatore più semplice di questo tipo è deviazione lineare media L come media aritmetica delle deviazioni assolute di una caratteristica dal suo livello medio:

Quando i singoli valori X sono ripetibili, utilizzare la formula della media aritmetica ponderata:

(Ricordiamo che la somma algebrica delle deviazioni dal livello medio è zero.)

L'indicatore di deviazione lineare media è ampiamente utilizzato nella pratica. Con il suo aiuto, ad esempio, vengono analizzati la composizione dei lavoratori, il ritmo di produzione, l'uniformità delle forniture di materiali e vengono sviluppati sistemi di incentivi materiali. Ma, sfortunatamente, questo indicatore complica i calcoli probabilistici e complica l'uso di metodi statistici matematici. Pertanto, nella ricerca scientifica statistica, l’indicatore più spesso utilizzato per misurare la variazione è varianze.

La varianza della caratteristica (s 2) è determinata in base alla media della potenza quadratica:

.

Viene chiamato l'indicatore s uguale a deviazione standard.

Nella teoria generale della statistica, l'indicatore di dispersione è una stima dell'omonimo indicatore della teoria della probabilità e (come somma dei quadrati delle deviazioni) una stima della dispersione nella statistica matematica, che consente di utilizzare le disposizioni di questi discipline teoriche per l'analisi dei processi socio-economici.

Se la variazione viene stimata da un piccolo numero di osservazioni prese da una popolazione illimitata, il valore medio della caratteristica viene determinato con qualche errore. Il valore calcolato della dispersione risulta spostato verso una diminuzione. Per ottenere una stima imparziale, la varianza campionaria ottenuta utilizzando le formule precedentemente fornite deve essere moltiplicata per il valore n / (n - 1). Di conseguenza, con un piccolo numero di osservazioni (< 30) дисперсию признака рекомендуется вычислять по формуле

Di solito, già per n > (15÷20), la discrepanza tra le stime distorte e quelle imparziali diventa insignificante. Per lo stesso motivo, la distorsione solitamente non viene presa in considerazione nella formula per aggiungere le varianze.

Se si prelevano più campioni dalla popolazione generale e ogni volta si determina il valore medio di una caratteristica, allora si pone il problema di valutare la variabilità delle medie. Varianza di stima valore medioè possibile sulla base di una sola osservazione del campione utilizzando la formula

,

dove n è la dimensione del campione; s 2 – varianza della caratteristica calcolata dai dati campione.

Grandezza è chiamato errore medio di campionamento ed è una caratteristica della deviazione del valore medio campionario dell'attributo X dal suo valore medio reale. L'indicatore di errore medio viene utilizzato per valutare l'affidabilità dei risultati dell'osservazione del campione.

Indicatori di dispersione relativa. Per caratterizzare la misura della variabilità della caratteristica studiata, gli indicatori di variabilità vengono calcolati in valori relativi. Permettono di confrontare la natura della dispersione in diverse distribuzioni (diverse unità di osservazione della stessa caratteristica in due popolazioni, con valori medi diversi, quando si confrontano popolazioni con nomi diversi). Il calcolo degli indicatori della misura di dispersione relativa viene effettuato come rapporto tra l'indicatore di dispersione assoluta e la media aritmetica, moltiplicato per il 100%.

1. Coefficiente di oscillazione riflette la fluttuazione relativa dei valori estremi della caratteristica attorno alla media

.

2. L'arresto lineare relativo caratterizza la proporzione del valore medio del segno delle deviazioni assolute dal valore medio

.

3. Coefficiente di variazione:

è la misura di variabilità più comune utilizzata per valutare la tipicità dei valori medi.

Nelle statistiche, le popolazioni con un coefficiente di variazione maggiore del 30-35% sono considerate eterogenee.

Questo metodo di valutazione della variazione presenta anche uno svantaggio significativo. Infatti, supponiamo, ad esempio, che la popolazione originaria di lavoratori con un'esperienza media di 15 anni, con una deviazione standard di s = 10 anni, “invecchi” di altri 15 anni. Ora = 30 anni e la deviazione standard è ancora 10. La popolazione precedentemente eterogenea (10/15 × 100 = 66,7%), risultando quindi abbastanza omogeneo nel tempo (10/30×100 = 33,3%).

Boyarsky A.Ya. Studi teorici in statistica: sab. Scientifico Trudov.-M.: Statistica, 1974. pagine 19–57.

Precedente

Ora parliamo di come calcolare la media.
Nella sua forma classica, la teoria generale della statistica ci offre una versione delle regole per la scelta di un valore medio.
Innanzitutto, è necessario creare la formula logica corretta per calcolare il valore medio (AFV). Per ogni valore medio esiste sempre una sola formula logica per calcolarlo, quindi è difficile commettere errori qui. Ma dobbiamo sempre ricordare che nel numeratore (questo è ciò che è in cima alla frazione) c'è la somma di tutti i fenomeni, e nel denominatore (ciò che è in fondo alla frazione) il numero totale di elementi.

Dopo aver compilato la formula logica, puoi utilizzare le regole (per facilità di comprensione, le semplificheremo e le abbrevieremo):
1. Se i dati di origine (determinati dalla frequenza) contengono il denominatore di una formula logica, il calcolo viene eseguito utilizzando la formula della media aritmetica ponderata.
2. Se nei dati di origine è presentato il numeratore di una formula logica, il calcolo viene eseguito utilizzando la formula della media armonica ponderata.
3. Se il problema presenta sia il numeratore che il denominatore di una formula logica (questo accade raramente), allora eseguiamo il calcolo utilizzando questa formula o la formula della media aritmetica semplice.
Questa è l'idea classica di scegliere la formula giusta per calcolare la media. Successivamente, presentiamo la sequenza di azioni durante la risoluzione dei problemi per il calcolo del valore medio.

Algoritmo per la risoluzione di problemi sul calcolo del valore medio

A. Determinare il metodo per calcolare il valore medio - semplice o ponderato . Se i dati sono presentati in una tabella, utilizziamo un metodo ponderato, se i dati sono presentati tramite una semplice enumerazione, utilizziamo un metodo di calcolo semplice.

B. Definiamo o sistemiamo i simboli - X - opzione, F – frequenza . L'opzione è per quale fenomeno si desidera trovare il valore medio. I restanti dati nella tabella costituiranno la frequenza.

B. Determiniamo il modulo per il calcolo del valore medio - aritmetica o armonica . La determinazione viene effettuata utilizzando la colonna della frequenza. La forma aritmetica viene utilizzata se le frequenze sono specificate da una quantità esplicita (condizionatamente, è possibile sostituire la parola pezzi con il numero di elementi “pezzi”). La forma armonica viene utilizzata se le frequenze non sono specificate da una quantità esplicita, ma da un indicatore complesso (il prodotto della quantità media e della frequenza).

La cosa più difficile è indovinare dove e quale quantità viene fornita, soprattutto per uno studente inesperto in tali questioni. In una situazione del genere, è possibile utilizzare uno dei seguenti metodi. Per alcuni compiti (economici) è adatta una formulazione sviluppata in anni di pratica (punto B.1). In altre situazioni, dovrai utilizzare il punto B.2.

B.1 Se la frequenza è espressa in unità monetarie (in rubli), per il calcolo viene utilizzata la media armonica, questa affermazione è sempre vera, se la frequenza identificata è espressa in denaro, in altre situazioni questa regola non si applica.

B.2 Utilizzare le regole per la scelta del valore medio sopra indicate in questo articolo. Se la frequenza è data dal denominatore della formula logica per il calcolo del valore medio, allora calcoliamo utilizzando la forma della media aritmetica; se la frequenza è data dal numeratore della formula logica per il calcolo del valore medio, allora calcoliamo utilizzando la forma forma media armonica.

Diamo un'occhiata ad esempi di utilizzo di questo algoritmo.

R. Poiché i dati sono presentati in una riga, utilizziamo un metodo di calcolo semplice.

B.V. Abbiamo solo dati sull'importo delle pensioni e saranno la nostra opzione - x. I dati sono presentati come un numero semplice (12 persone), per il calcolo utilizziamo la media aritmetica semplice.

La pensione media per un pensionato è di 9208,3 rubli.

B. Poiché dobbiamo trovare il pagamento medio per figlio, le opzioni sono nella prima colonna, inseriamo lì la designazione x, la seconda colonna diventa automaticamente la frequenza f.

B. La frequenza (numero di bambini) è data da una quantità esplicita (puoi sostituire la parola con pezzi di bambini, dal punto di vista della lingua russa questa è una frase errata, ma, in effetti, è molto conveniente check), il che significa che per il calcolo viene utilizzata la media aritmetica ponderata.

Lo stesso problema può essere risolto non con un metodo formulario, ma con un metodo tabellare, ovvero inserendo tutti i dati dei calcoli intermedi in una tabella.

Di conseguenza, tutto ciò che deve essere fatto ora è separare i due totali nell'ordine corretto.

Il pagamento medio per bambino al mese era di 1.910 rubli.

R. Poiché i dati sono presentati nella tabella, utilizziamo una forma ponderata per il calcolo.

B. La frequenza (costo di produzione) è data da una quantità implicita (la frequenza è data in rubli punto dell'algoritmo B1), il che significa che per il calcolo viene utilizzata la media armonica ponderata. In generale, in sostanza, il costo di produzione è un indicatore complesso, che si ottiene moltiplicando il costo di un'unità di prodotto per il numero di tali prodotti, questa è l'essenza del valore medio armonico.

Affinché questo problema possa essere risolto utilizzando la formula della media aritmetica, è necessario che al posto del costo di produzione ci sia il numero di prodotti con il costo corrispondente.

Tieni presente che la somma al denominatore ottenuta dopo i calcoli è 410 (120+80+210), questo è il numero totale di prodotti prodotti.

Il costo medio per unità di prodotto è stato di 314,4 rubli.

R. Poiché i dati sono presentati nella tabella, utilizziamo una forma ponderata per il calcolo.

B. Poiché dobbiamo trovare il costo medio per unità di prodotto, le opzioni sono nella prima colonna, inseriamo lì la designazione x, la seconda colonna diventa automaticamente la frequenza f.

B. La frequenza (numero totale di assenze) è data da una quantità implicita (questo è il prodotto di due indicatori del numero di assenze e del numero di studenti con quel numero di assenze), il che significa che viene utilizzata la media armonica ponderata per il calcolo. Utilizzeremo il punto dell'algoritmo B2.

Affinché questo problema possa essere risolto utilizzando la formula della media aritmetica, è necessario che al posto del numero totale delle assenze ci sia il numero degli studenti.

Creiamo una formula logica per calcolare il numero medio di assenze per studente.

Frequenza per condizione dell'attività Numero totale di omissioni. Nella formula logica, questo indicatore è al numeratore, il che significa che utilizziamo la formula della media armonica.

Si prega di notare che la somma al denominatore, risultante dopo i calcoli 31 (18+8+5), è il numero totale di studenti.

Il numero medio di assenze per studente è di 13,8 giorni.

Questo termine ha altri significati, vedi significato medio.

Media(in matematica e statistica) insiemi di numeri: la somma di tutti i numeri divisa per il loro numero. È una delle misure più comuni di tendenza centrale.

Fu proposto (insieme alla media geometrica e alla media armonica) dai Pitagorici.

Casi particolari di media aritmetica sono la media (popolazione generale) e la media campionaria (campione).

introduzione

Indichiamo l'insieme dei dati X = (X 1 , X 2 , …, X N), allora la media campionaria è solitamente indicata da una barra orizzontale sopra la variabile (x ¯ (\displaystyle (\bar (x))), pronunciata " X con una linea").

La lettera greca μ è usata per indicare la media aritmetica dell'intera popolazione. Per una variabile casuale per la quale viene determinato il valore medio, μ è media probabilistica o l'aspettativa matematica di una variabile casuale. Se l'insieme Xè una raccolta di numeri casuali con media probabilistica μ, quindi per qualsiasi campione X io da questo insieme μ = E( X io) è l'aspettativa matematica di questo campione.

In pratica, la differenza tra μ e x ¯ (\displaystyle (\bar (x))) è che μ è una variabile tipica perché è possibile vedere un campione anziché l'intera popolazione. Pertanto, se il campione è rappresentato in modo casuale (in termini di teoria della probabilità), allora x ¯ (\displaystyle (\bar (x))) (ma non μ) può essere trattato come una variabile casuale avente una distribuzione di probabilità sul campione ( la distribuzione di probabilità della media).

Entrambe queste quantità si calcolano allo stesso modo:

X ¯ = 1 n ∑ io = 1 n X io = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Se Xè una variabile casuale, quindi l'aspettativa matematica X può essere considerata come la media aritmetica dei valori nelle misurazioni ripetute di una quantità X. Questa è una manifestazione della legge dei grandi numeri. Pertanto, la media campionaria viene utilizzata per stimare il valore atteso sconosciuto.

In algebra elementare è stato dimostrato che la media N+ 1 numeri sopra la media N numeri se e solo se il nuovo numero è maggiore della vecchia media, minore se e solo se il nuovo numero è inferiore alla media, e non cambia se e solo se il nuovo numero è uguale alla media. Più N, minore è la differenza tra la nuova e la vecchia media.

Si noti che sono disponibili molte altre "medie", tra cui la media di potenza, la media di Kolmogorov, la media armonica, la media aritmetico-geometrica e varie medie ponderate (ad esempio, media aritmetica ponderata, media geometrica ponderata, media armonica ponderata).

Esempi

  • Per tre numeri, devi sommarli e dividerli per 3:
x1 + x2 + x33 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • Per quattro numeri, devi sommarli e dividerli per 4:
x1 + x2 + x3 + x4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

O più semplice 5+5=10, 10:2. Poiché stavamo sommando 2 numeri, il che significa quanti numeri aggiungiamo, li dividiamo per quel numero.

Variabile casuale continua

Per una quantità distribuita in modo continuo f (x) (\displaystyle f(x)), la media aritmetica sull'intervallo [ a ; b ] (\displaystyle ) è determinato tramite un integrale definito:

F (x) ¯ [ un ; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Alcuni problemi nell'utilizzo della media

Mancanza di robustezza

Articolo principale: Robustezza nelle statistiche

Sebbene le medie aritmetiche siano spesso utilizzate come medie o tendenze centrali, questo concetto non è una statistica robusta, nel senso che la media aritmetica è fortemente influenzata da "grandi deviazioni". È interessante notare che per distribuzioni con un elevato coefficiente di asimmetria, la media aritmetica potrebbe non corrispondere al concetto di "media" e i valori della media provenienti da statistiche robuste (ad esempio, la mediana) potrebbero descrivere meglio la parte centrale tendenza.

Un classico esempio è il calcolo del reddito medio. La media aritmetica può essere interpretata erroneamente come mediana, il che può portare alla conclusione che ci sono più persone con redditi più alti di quante ce ne siano effettivamente. Il reddito “medio” viene interpretato nel senso che la maggior parte delle persone ha un reddito attorno a questo numero. Questo reddito “medio” (nel senso della media aritmetica) è superiore ai redditi della maggior parte delle persone, poiché un reddito elevato con una grande deviazione dalla media rende la media aritmetica altamente distorta (al contrario, il reddito medio al livello mediano “resiste” a tale distorsione). Tuttavia, questo reddito “medio” non dice nulla sul numero di persone vicine al reddito mediano (e non dice nulla sul numero di persone vicine al reddito modale). Tuttavia, se si prendono alla leggera i concetti di “media” e “la maggior parte delle persone”, si può trarre la conclusione errata che la maggior parte delle persone ha redditi più alti di quanto non siano in realtà. Ad esempio, un rapporto sul reddito netto "medio" a Medina, Washington, calcolato come media aritmetica di tutti i redditi netti annuali dei residenti, produrrebbe un numero sorprendentemente elevato a causa di Bill Gates. Considera il campione (1, 2, 2, 2, 3, 9). La media aritmetica è 3,17, ma cinque valori su sei sono al di sotto di questa media.

Interesse composto

Articolo principale: Ritorno sull'investimento

Se i numeri moltiplicare, ma no piega, è necessario utilizzare la media geometrica e non la media aritmetica. Molto spesso questo incidente si verifica quando si calcola il ritorno sull'investimento in finanza.

Ad esempio, se un titolo è sceso del 10% nel primo anno e è aumentato del 30% nel secondo, non è corretto calcolare l’aumento “medio” in questi due anni come media aritmetica (−10% + 30%) / 2 = 10%; la media corretta in questo caso è data dal tasso di crescita annuo composto, che dà un tasso di crescita annuo di solo circa 8,16653826392% ≈ 8,2%.

La ragione di ciò è che le percentuali hanno ogni volta un nuovo punto di partenza: 30% è 30% da un numero inferiore al prezzo all'inizio del primo anno: se un titolo iniziava a $ 30 e scendeva del 10%, varrebbe $ 27 all'inizio del secondo anno. Se il titolo aumentasse del 30%, varrebbe 35,1 dollari alla fine del secondo anno. La media aritmetica di questa crescita è del 10%, ma poiché il titolo è aumentato solo di 5,1 dollari in 2 anni, la crescita media dell’8,2% dà un risultato finale di 35,1 dollari:

[$ 30 (1 - 0,1) (1 + 0,3) = $ 30 (1 + 0,082) (1 + 0,082) = $ 35,1]. Se usiamo la media aritmetica del 10% allo stesso modo, non otterremo il valore effettivo: [$30 (1 + 0,1) (1 + 0,1) = $36,3].

Interesse composto alla fine di 2 anni: 90% * 130% = 117%, ovvero l'aumento totale è del 17% e l'interesse composto medio annuo è 117% ≈ 108,2% (\displaystyle (\sqrt (117\% ))\circa 108,2\%) , ovvero un aumento medio annuo dell'8,2%.

Indicazioni

Articolo principale: Statistiche sulla destinazione

Quando si calcola la media aritmetica di alcune variabili che cambiano ciclicamente (come la fase o l'angolo), è necessario prestare particolare attenzione. Ad esempio, la media di 1° e 359° sarebbe 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Questo numero non è corretto per due motivi.

  • Innanzitutto, le misure angolari sono definite solo per l'intervallo da 0° a 360° (o da 0 a 2π se misurate in radianti). Quindi la stessa coppia di numeri potrebbe essere scritta come (1° e −1°) oppure come (1° e 719°). I valori medi di ciascuna coppia saranno diversi: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2 ))=0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\ circo )) .
  • In secondo luogo, in questo caso, un valore di 0° (equivalente a 360°) sarà un valore medio geometricamente migliore, poiché i numeri deviano meno da 0° che da qualsiasi altro valore (il valore 0° ha la varianza più piccola). Confrontare:
    • il numero 1° si discosta da 0° solo di 1°;
    • il numero 1° si discosta di 179° dalla media calcolata di 180°.

Il valore medio di una variabile ciclica calcolata utilizzando la formula di cui sopra verrà spostato artificialmente rispetto alla media reale verso la metà dell'intervallo numerico. Per questo motivo, la media viene calcolata in modo diverso, vale a dire, il numero con la varianza più piccola (il punto centrale) viene selezionato come valore medio. Inoltre, invece della sottrazione, viene utilizzata la distanza modulare (ovvero la distanza circonferenziale). Ad esempio, la distanza modulare tra 1° e 359° è 2°, non 358° (sul cerchio tra 359° e 360°==0° - un grado, tra 0° e 1° - anche 1°, in totale -2°).

4.3. Valori medi. L'essenza e il significato dei valori medi

Taglia media in statistica è un indicatore generale che caratterizza il livello tipico di un fenomeno in specifiche condizioni di luogo e di tempo, riflettendo il valore di una caratteristica variabile per unità di una popolazione qualitativamente omogenea. Nella pratica economica viene utilizzata un'ampia gamma di indicatori, calcolati come valori medi.

Ad esempio, un indicatore generale del reddito dei lavoratori di una società per azioni (JSC) è il reddito medio di un lavoratore, determinato dal rapporto tra la cassa salariale e i pagamenti sociali per il periodo in esame (anno, trimestre, mese ) al numero dei lavoratori della JSC.

Il calcolo della media è una delle tecniche di generalizzazione comuni; l'indicatore medio riflette ciò che è comune (tipico) a tutte le unità della popolazione studiata, ignorando allo stesso tempo le differenze delle singole unità. In ogni fenomeno e nel suo sviluppo c'è una combinazione incidenti E necessario. Nel calcolo delle medie, a causa dell'azione della legge dei grandi numeri, la casualità si annulla e si bilancia, quindi è possibile astrarre dalle caratteristiche non importanti del fenomeno, dai valori quantitativi della caratteristica in ogni caso specifico . La capacità di astrarre dalla casualità dei valori individuali e dalle fluttuazioni risiede nel valore scientifico delle medie generalizzando caratteristiche delle popolazioni.

Laddove si presenti la necessità di generalizzazione, il calcolo di tali caratteristiche porta alla sostituzione di molti valori individuali diversi dell'attributo media un indicatore che caratterizza l'intero insieme dei fenomeni, che consente di identificare modelli inerenti ai fenomeni sociali di massa che sono invisibili nei fenomeni individuali.

La media riflette il livello caratteristico, tipico, reale dei fenomeni studiati, caratterizza questi livelli e i loro cambiamenti nel tempo e nello spazio.

La media è una caratteristica riassuntiva delle leggi del processo nelle condizioni in cui esso avviene.

4.4. Tipi di medie e metodi per calcolarle

La scelta del tipo di media è determinata dal contenuto economico di un determinato indicatore e dai dati di origine. In ogni caso specifico, viene utilizzato uno dei valori medi: aritmetica, garmonico, geometrico, quadratico, cubico eccetera. Le medie elencate appartengono alla classe tranquillo media.

Oltre alle medie di potenza, nella pratica statistica vengono utilizzate le medie strutturali, che sono considerate moda e mediana.

Soffermiamoci più in dettaglio sulle medie di potenza.

Significato aritmetico

Il tipo più comune di media è media aritmetica. Viene utilizzato nei casi in cui il volume di una caratteristica variabile per l'intera popolazione è la somma dei valori delle caratteristiche delle sue singole unità. I fenomeni sociali sono caratterizzati dall'additività (sommarità) dei volumi di caratteristica variabile; ciò determina l'ambito di applicazione della media aritmetica e spiega la sua prevalenza come indicatore generale, ad esempio: il fondo salariale totale è la somma dei salari di di tutti i lavoratori, il raccolto lordo è la somma dei prodotti ottenuti dall'intera superficie della stagione di semina.

Per calcolare la media aritmetica, è necessario dividere la somma di tutti i valori delle caratteristiche per il loro numero.

Nella forma viene utilizzata la media aritmetica media semplice e media ponderata. La forma iniziale e determinante è la media semplice.

Media aritmetica semplice pari alla semplice somma dei singoli valori della caratteristica di cui si fa la media, divisa per il numero totale di questi valori (viene utilizzato nei casi in cui sono presenti valori individuali della caratteristica non raggruppati):

Dove
- valori individuali della variabile (varianti); M - il numero di unità della popolazione.

Inoltre, nelle formule non verranno indicati i limiti di sommatoria. Ad esempio, è necessario trovare la produzione media di un lavoratore (meccanico) se si conosce quante parti hanno prodotto ciascuno dei 15 lavoratori, ovvero vengono forniti un numero di valori individuali della caratteristica, pz .:

21; 20; 20; 19; 21; 19; 18; 22; 19; 20; 21; 20; 18; 19; 20.

La media aritmetica semplice si calcola utilizzando la formula (4.1), 1 pz.:

Viene chiamata la media delle opzioni che si ripetono un numero diverso di volte o, come si suol dire, hanno pesi diversi ponderato. I pesi rappresentano il numero di unità nei diversi gruppi della popolazione (le opzioni identiche vengono combinate in un gruppo).

Media aritmetica ponderata- media dei valori raggruppati, - viene calcolata utilizzando la formula:

, (4.2)

Dove
- peso (frequenza di ripetizione di segni identici);

- la somma dei prodotti della grandezza delle caratteristiche e delle loro frequenze;

- il numero totale di unità abitative.

Illustriamo la tecnica di calcolo della media aritmetica ponderata utilizzando l'esempio discusso sopra. Per fare ciò, raggrupperemo i dati di origine e li inseriremo in una tabella. 4.1.

Tabella 4.1

Distribuzione dei lavoratori per la produzione di componenti

Secondo la formula (4.2), la media aritmetica ponderata è pari a, pz.:

In alcuni casi, i pesi possono essere presentati non come valori assoluti, ma come valori relativi (in percentuali o frazioni di unità). Quindi la formula per la media aritmetica ponderata sarà simile a:

Dove
- particolarità, cioè la quota di ciascuna frequenza nella somma totale di tutte

Se le frequenze vengono contate in frazioni (coefficienti), allora
= 1, e la formula per la media aritmeticamente ponderata ha la forma:

Calcolo della media aritmetica ponderata dalle medie di gruppo effettuata secondo la formula:

,

Dove F-numero di unità in ciascun gruppo.

I risultati del calcolo della media aritmetica dalle medie del gruppo sono presentati nella tabella. 4.2.

Tabella 4.2

Distribuzione dei lavoratori per anzianità media di servizio

In questo esempio, le opzioni non sono dati individuali sull'anzianità di servizio dei singoli lavoratori, ma la media per ciascuna officina. Libra Fè il numero dei lavoratori nei negozi. Pertanto, l’esperienza lavorativa media dei lavoratori in tutta l’impresa sarà, in anni:

.

Calcolo della media aritmetica nelle serie di distribuzione

Se i valori della caratteristica di cui si fa la media sono specificati sotto forma di intervalli ("da - a"), ad es. serie di intervalli della distribuzione, quindi quando si calcola la media aritmetica, i punti medi di questi intervalli vengono presi come valori delle caratteristiche nei gruppi, risultando nella formazione di una serie discreta. Consideriamo il seguente esempio (Tabella 4.3).

Passiamo da una serie di intervalli ad una serie discreta sostituendo i valori degli intervalli con i loro valori medi/(media semplice

Tabella 4.3

Distribuzione dei lavoratori JSC per livello salariale mensile

Gruppi di lavoratori

Numero di lavoratori

La metà dell'intervallo

salario, strofinare.

persone, F

strofinare., X

900 o più

i valori degli intervalli aperti (primo e ultimo) sono condizionatamente equiparati agli intervalli ad essi adiacenti (secondo e penultimo).

Con questo calcolo della media sono ammesse alcune imprecisioni, poiché si presuppone la distribuzione uniforme delle unità della caratteristica all'interno del gruppo. Tuttavia, più stretto è l'intervallo e maggiore è il numero di unità nell'intervallo, minore è l'errore.

Dopo aver trovato i punti medi degli intervalli, i calcoli vengono eseguiti come in una serie discreta: le opzioni vengono moltiplicate per le frequenze (pesi) e la somma dei prodotti viene divisa per la somma delle frequenze (pesi) , migliaia di rubli:

.

Pertanto, il livello salariale medio dei lavoratori JSC è di 729 rubli. al mese.

Il calcolo della media aritmetica spesso richiede molto tempo e fatica. Tuttavia, in alcuni casi, la procedura per calcolare la media può essere semplificata e facilitata se si utilizzano le sue proprietà. Presentiamo (senza dimostrazione) alcune proprietà fondamentali della media aritmetica.

Proprietà 1. Se tutti i valori individuali di una caratteristica (ad es. tutte le opzioni) ridurre o aumentare iovolte, quindi il valore medio la nuova caratteristica diminuirà o aumenterà di conseguenza iouna volta.

Proprietà 2. Se tutte le varianti della caratteristica di cui si fa la media vengono ridottecucire o aumentare del numero A, quindi corrisponderà la media aritmeticadiminuirà o aumenterà effettivamente dello stesso numero A.

Proprietà 3. Se i pesi di tutte le opzioni medie vengono ridotti o aumentare di A volte, la media aritmetica non cambierà.

Come pesi medi, invece degli indicatori assoluti, è possibile utilizzare pesi specifici nel totale complessivo (quote o percentuali). Ciò semplifica i calcoli della media.

Per semplificare i calcoli della media, si segue il percorso di riduzione dei valori delle opzioni e delle frequenze. La massima semplificazione si ottiene quando, come UN il valore di una delle opzioni centrali, che ha la frequenza più alta, viene selezionato come / - il valore dell'intervallo (per serie con intervalli uguali). La quantità A è chiamata punto di riferimento, quindi questo metodo di calcolo della media è chiamato “metodo di conteggio dallo zero condizionale” o "in termini di momenti."

Supponiamo che tutte le opzioni X prima diminuito dello stesso numero A, e poi diminuito di io una volta. Otteniamo una nuova serie variazionale di distribuzione di nuove opzioni .

Poi nuove opzioni sarà espresso:

,

e la loro nuova media aritmetica , -momento del primo ordine-formula:

.

È pari alla media delle opzioni originarie, prima ridotta di UN, e poi dentro io una volta.

Per ottenere la media reale è necessario un momento del primo ordine M 1 , moltiplicato per io e aggiungi UN:

.

Questo metodo per calcolare la media aritmetica da una serie di variazioni è chiamato "in termini di momenti." Questo metodo viene utilizzato in righe a intervalli uguali.

Il calcolo della media aritmetica con il metodo dei momenti è illustrato dai dati in Tabella. 4.4.

Tabella 4.4

Distribuzione delle piccole imprese nella regione in base al valore delle immobilizzazioni produttive (FPF) nel 2000.

Gruppi di imprese per valore OPF, migliaia di rubli.

Numero di imprese F

Punti medi degli intervalli X

14-16 16-18 18-20 20-22 22-24

Trovare il momento del primo ordine

.

Quindi, prendendo A = 19 e sapendolo io= 2, calcola X, mille rubli.:

Tipi di valori medi e metodi del loro calcolo

Nella fase di elaborazione statistica è possibile impostare una serie di problemi di ricerca, per la cui soluzione è necessario selezionare la media appropriata. In questo caso è necessario lasciarsi guidare dalla seguente regola: le quantità che rappresentano il numeratore e il denominatore della media devono essere logicamente correlate tra loro.

  • medie di potenza;
  • medie strutturali.

Introduciamo le seguenti convenzioni:

Le quantità per le quali viene calcolata la media;

Media, dove la barra in alto indica che avviene la media dei singoli valori;

Frequenza (ripetibilità dei valori caratteristici individuali).

Varie medie derivano dalla formula generale della media della potenza:

(5.1)

quando k = 1 - media aritmetica; k = -1 - media armonica; k = 0 - media geometrica; k = -2 - radice quadrata media.

I valori medi possono essere semplici o ponderati. Medie ponderate Si tratta di valori che tengono conto del fatto che alcune varianti dei valori degli attributi possono avere numeri diversi, e quindi ogni opzione deve essere moltiplicata per questo numero. In altre parole, le “scale” sono i numeri di unità aggregate in diversi gruppi, vale a dire Ciascuna opzione è “ponderata” in base alla sua frequenza. Si chiama la frequenza f peso statistico O peso medio.

Significato aritmetico- il tipo più comune di media. Viene utilizzato quando il calcolo viene effettuato su dati statistici non raggruppati, dove è necessario ottenere il termine medio. La media aritmetica è il valore medio di una caratteristica, al raggiungimento del quale il volume totale della caratteristica nell'aggregato rimane invariato.

Formula della media aritmetica ( semplice) ha la forma

dove n è la dimensione della popolazione.

Ad esempio, lo stipendio medio dei dipendenti di un’impresa viene calcolato come media aritmetica:

Gli indicatori determinanti qui sono lo stipendio di ciascun dipendente e il numero di dipendenti dell'impresa. Nel calcolare la media, l’importo totale dei salari è rimasto lo stesso, ma distribuito equamente tra tutti i dipendenti. Ad esempio, è necessario calcolare lo stipendio medio dei lavoratori in una piccola azienda che impiega 8 persone:

Quando si calcolano i valori medi, i singoli valori della caratteristica di cui viene calcolata la media possono essere ripetuti, quindi il valore medio viene calcolato utilizzando dati raggruppati. In questo caso parliamo di utilizzo media aritmetica ponderata, che ha la forma

(5.3)

Quindi, dobbiamo calcolare il prezzo medio delle azioni di una società per azioni durante le negoziazioni in borsa. È noto che le transazioni sono state effettuate entro 5 giorni (5 transazioni), il numero di azioni vendute al tasso di vendita è stato distribuito come segue:

1 - 800 aC. - 1010 rubli.

2-650 aC. - 990 rubli.

3-700 a.C. - 1015 rubli.

4-550 aC. - 900 rubli.

5 - 850 aC. - 1150 rubli.

Il rapporto iniziale per determinare il prezzo medio delle azioni è il rapporto tra l'importo totale delle transazioni (TVA) e il numero di azioni vendute (KPA).

Per trovare il valore medio in Excel (non importa se si tratta di un valore numerico, di testo, percentuale o altro), ci sono molte funzioni. E ognuno di loro ha le sue caratteristiche e vantaggi. In effetti, in questo compito possono essere poste alcune condizioni.

Ad esempio, i valori medi di una serie di numeri in Excel vengono calcolati utilizzando funzioni statistiche. Puoi anche inserire manualmente la tua formula. Consideriamo varie opzioni.

Come trovare la media aritmetica dei numeri?

Per trovare la media aritmetica, devi sommare tutti i numeri dell'insieme e dividere la somma per la quantità. Ad esempio, i voti di uno studente in informatica: 3, 4, 3, 5, 5. Cosa è compreso nel trimestre: 4. Abbiamo trovato la media aritmetica utilizzando la formula: =(3+4+3+5+5) /5.

Come farlo rapidamente utilizzando le funzioni di Excel? Prendiamo ad esempio una serie di numeri casuali in una stringa:

Oppure: crea la cella attiva e inserisci semplicemente la formula manualmente: = MEDIA (A1: A8).

Ora vediamo cos'altro può fare la funzione MEDIA.


Troviamo la media aritmetica dei primi due e degli ultimi tre numeri. Formula: =MEDIA(A1:B1;F1:H1). Risultato:



Condizioni nella media

La condizione per trovare la media aritmetica può essere un criterio numerico o testuale. Utilizzeremo la funzione: =MEDIA.SE().

Trova la media aritmetica dei numeri maggiori o uguali a 10.

Funzione: =MEDIA.SE(A1:A8;">=10")


Il risultato dell'utilizzo della funzione MEDIA.SE nella condizione ">=10":

Il terzo argomento – “Intervallo di media” – viene omesso. Innanzitutto non è obbligatorio. In secondo luogo, l'intervallo analizzato dal programma contiene SOLO valori numerici. Le celle specificate nel primo argomento verranno cercate in base alla condizione specificata nel secondo argomento.

Attenzione! Il criterio di ricerca può essere specificato nella cella. E crea un collegamento ad esso nella formula.

Troviamo il valore medio dei numeri utilizzando il criterio del testo. Ad esempio, le vendite medie dei prodotti “tavoli”.

La funzione sarà simile a questa: =MEDIA.SE($A$2:$A$12,A7,$B$2:$B$12). Gamma: una colonna con i nomi dei prodotti. Il criterio di ricerca è un collegamento ad una cella con la parola “tabelle” (puoi inserire la parola “tabelle” al posto del collegamento A7). Intervallo di media: quelle celle da cui verranno presi i dati per calcolare il valore medio.

Come risultato del calcolo della funzione, otteniamo il seguente valore:

Attenzione! Per un criterio testuale (condizione), è necessario specificare l'intervallo della media.

Come calcolare il prezzo medio ponderato in Excel?

Come abbiamo scoperto il prezzo medio ponderato?

Formula: =SOMMAPRODOTTO(C2:C12;B2:B12)/SOMMA(C2:C12).


Utilizzando la formula SUMPRODOTTO, troviamo le entrate totali dopo aver venduto l'intera quantità di beni. E la funzione SOMMA riassume la quantità di beni. Dividendo i ricavi totali derivanti dalla vendita di beni per il numero totale di unità di beni, abbiamo ottenuto il prezzo medio ponderato. Questo indicatore tiene conto del “peso” di ciascun prezzo. La sua quota nella massa totale dei valori.

Deviazione standard: formula in Excel

Esistono deviazioni standard per la popolazione generale e per il campione. Nel primo caso, questa è la radice della varianza generale. Nel secondo, dalla varianza campionaria.

Per calcolare questo indicatore statistico, viene compilata una formula di dispersione. Da esso si estrae la radice. Ma in Excel esiste una funzione già pronta per trovare la deviazione standard.


La deviazione standard è legata alla scala dei dati di origine. Ciò non è sufficiente per una rappresentazione figurata della variazione dell'intervallo analizzato. Per ottenere il livello relativo di dispersione dei dati, viene calcolato il coefficiente di variazione:

deviazione standard/media aritmetica

La formula in Excel è simile alla seguente:

DEV.ST (intervallo di valori) / MEDIA (intervallo di valori).

Il coefficiente di variazione è calcolato in percentuale. Pertanto, impostiamo il formato percentuale nella cella.

Caricamento...