docgid.ru

Intervallo di confidenza. Cos'è e come può essere utilizzato? Intervallo di confidenza per la stima della media (la varianza è nota) in MS EXCEL

Intervallo di confidenza

Intervallo di confidenza- un termine utilizzato nella statistica matematica per la stima intervallare (in opposizione alla stima puntuale) dei parametri statistici, che è preferibile quando la dimensione del campione è piccola. Un intervallo di confidenza è quello che copre un parametro sconosciuto con una determinata affidabilità.

Il metodo degli intervalli di confidenza è stato sviluppato dallo statistico americano Jerzy Neumann, basandosi sulle idee dello statistico inglese Ronald Fisher.

Definizione

Intervallo di confidenza del parametro θ distribuzione di variabili casuali X con livello di confidenza 100 P%, generato dal campione ( X 1 ,…,X n), è chiamato intervallo con confini ( X 1 ,…,X n) e ( X 1 ,…,X n), che sono realizzazioni di variabili casuali l(X 1 ,…,X n) e U(X 1 ,…,X n), tale che

.

Vengono chiamati i punti di confine dell'intervallo di confidenza limiti di confidenza.

Un'interpretazione intuitiva dell'intervallo di confidenza sarebbe: se Pè grande (diciamo 0,95 o 0,99), allora l'intervallo di confidenza contiene quasi certamente il valore vero θ .

Un'altra interpretazione del concetto di intervallo di confidenza: può essere considerato come un intervallo di valori di parametri θ compatibili con i dati sperimentali e non contraddittori.

Esempi

  • Intervallo di confidenza per l'aspettativa matematica di un campione normale;
  • Intervallo di confidenza per la varianza normale del campione.

Intervallo di confidenza bayesiano

Nelle statistiche bayesiane esiste una definizione simile ma diversa in alcuni dettagli chiave di un intervallo di confidenza. Qui, il parametro stimato stesso è considerato una variabile casuale con una determinata distribuzione a priori (nel caso più semplice, uniforme) e il campione è fisso (nella statistica classica tutto è esattamente l'opposto). Un intervallo di confidenza bayesiano è un intervallo che copre il valore del parametro con la probabilità a posteriori:

.

In generale, gli intervalli di confidenza classici e bayesiani sono diversi. Nella letteratura in lingua inglese, l'intervallo di confidenza bayesiano è solitamente chiamato termine intervallo credibile, e quello classico - intervallo di confidenza.

Appunti

Fonti

Fondazione Wikimedia. 2010.

  • Bambini (film)
  • Colono

Scopri cos'è "Intervallo di confidenza" in altri dizionari:

    Intervallo di confidenza- un intervallo calcolato a partire da dati campionari, che con una data probabilità (confidenza) copre il valore vero incognito del parametro di distribuzione stimato. Fonte: GOST 20522 96: Suoli. Metodi per l'elaborazione statistica dei risultati... Dizionario-libro di consultazione dei termini della documentazione normativa e tecnica

    intervallo di confidenza- per un parametro scalare della popolazione, questo è un segmento che molto probabilmente contiene questo parametro. Questa frase non ha senso senza ulteriore elaborazione. Poiché i confini dell’intervallo di confidenza sono stimati dal campione, è naturale... ... Dizionario di statistica sociologica

    INTERVALLO DI CONFIDENZA- un metodo di stima dei parametri che differisce dalla stima puntuale. Sia il campione x1, . . ., xn da una distribuzione con densità di probabilità f(x, α) e a*=a*(x1, . . ., xn) stima α, stima della densità di probabilità g(a*, α). Stai cercando… … Enciclopedia geologica

    INTERVALLO DI CONFIDENZA- (intervallo di confidenza) Intervallo in cui l'affidabilità del valore del parametro per la popolazione ottenuto sulla base di un'indagine campionaria ha un certo grado di probabilità, ad esempio il 95%, che è dovuto al campione stesso. Larghezza… … Dizionario economico

    intervallo di confidenza- è l'intervallo in cui si trova il valore vero della quantità determinata con una data probabilità di confidenza. Chimica generale: libro di testo / A. V. Zholnin ... Termini chimici

    Intervallo di confidenza CI- Intervallo di confidenza, CI * intervallo dei dati, CI * intervallo di confidenza del valore caratteristico, calcolato per k.l. parametro di distribuzione (ad esempio, il valore medio di una caratteristica) nel campione e con una certa probabilità (ad esempio, 95% per 95%... Genetica. Dizionario enciclopedico

    INTERVALLO DI CONFIDENZA- un concetto che emerge quando si stima un parametro statistico. distribuzione per intervallo di valori. D. e. per il parametro q, corrispondente a questo coefficiente. la fiducia P è uguale a un intervallo (q1, q2) tale che per qualsiasi distribuzione di probabilità di disuguaglianza... ... Enciclopedia fisica

    intervallo di confidenza- - Argomenti delle telecomunicazioni, concetti di base EN intervallo di confidenza ... Guida del traduttore tecnico

    intervallo di confidenza- pasikliovimo intervalas statusas T sritis Standartizacija ir metrologija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultato vertė. atikmenys: ingl. intervallo di confidenza vok. Vertrauensbereich, m rus.… … Penkiakalbis aiškinamasis metrologijos terminų žodynas

    intervallo di confidenza- pasikliovimo intervalas statusas T sritis chemija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultatų vertė. atikmenys: ingl. intervallo di confidenza russo. area di fiducia; intervallo di confidenza... Chemijos terminų aiškinamasis žodynas

Da questo articolo imparerai:

    Che è successo intervallo di confidenza?

    Qual e il punto 3 regole sigma?

    Come puoi applicare questa conoscenza nella pratica?

Al giorno d'oggi, a causa della sovrabbondanza di informazioni associate a un vasto assortimento di prodotti, indicazioni di vendita, dipendenti, aree di attività, ecc., può essere difficile evidenziare la cosa principale, a cui, prima di tutto, vale la pena prestare attenzione e impegnarsi per gestirlo. Definizione intervallo di confidenza e l'analisi dei valori reali che vanno oltre i suoi confini è una tecnica che ti aiuterà a evidenziare le situazioni, influenzare le tendenze in cambiamento. Sarai in grado di sviluppare fattori positivi e ridurre l'influenza di quelli negativi. Questa tecnologia è utilizzata in molte rinomate aziende globali.

Esistono i cosiddetti " avvisi", Quale informare i gestori che il valore successivo è in una certa direzione è andato oltre intervallo di confidenza. Cosa significa questo? Questo è un segnale che si è verificato un evento insolito, che potrebbe cambiare la tendenza esistente in questa direzione. Questo è un segnale a tale per capirlo nella situazione e capire cosa l’ha influenzata.

Ad esempio, considera diverse situazioni. Abbiamo calcolato le previsioni di vendita con limiti di previsione per 100 articoli di prodotto per il 2011 per mese e vendite effettive a marzo:

  1. Per l'“Olio di girasole” hanno superato il limite superiore delle previsioni e non sono rientrati nell'intervallo di confidenza.
  2. Per il “Lievito secco” abbiamo superato il limite inferiore della previsione.
  3. Il "porridge di farina d'avena" ha superato il limite superiore.

Per gli altri prodotti, le vendite effettive rientrano nei limiti previsti. Quelli. le loro vendite erano entro le aspettative. Quindi, abbiamo identificato 3 prodotti che andavano oltre i confini e abbiamo iniziato a capire cosa li ha spinti ad andare oltre i confini:

  1. Per l'Olio di Girasole siamo entrati in una nuova rete di distribuzione, che ci ha dato un ulteriore volume di vendite, che ci ha portato a superare il limite massimo. Per questo prodotto vale la pena ricalcolare le previsioni fino alla fine dell'anno, tenendo conto delle previsioni di vendita per questa rete.
  2. Per "Lievito secco", l'auto è rimasta bloccata alla dogana e nel giro di 5 giorni si è verificata una carenza, che ha influito sul calo delle vendite e ha superato il limite inferiore. Potrebbe essere utile capire cosa l'ha causato e cercare di non ripetere questa situazione.
  3. È stato lanciato un evento di promozione delle vendite per il porridge di farina d'avena, che ha dato un aumento significativo delle vendite e ha portato l'azienda ad andare oltre le previsioni.

Abbiamo individuato 3 fattori che hanno influenzato il superamento dei limiti previsti. Possono essercene molti di più nella vita: per aumentare la precisione delle previsioni e della pianificazione, fattori che portano al fatto che le vendite effettive possono andare oltre le previsioni, vale la pena evidenziarle e costruire previsioni e piani separatamente. E poi considera il loro impatto sulle principali previsioni di vendita. Puoi anche valutare regolarmente l'impatto di questi fattori e cambiare la situazione in meglio. riducendo l’influenza dei fattori negativi e aumentando l’influenza dei fattori positivi.

Con un intervallo di confidenza possiamo:

  1. Seleziona le direzioni, a cui vale la pena prestare attenzione, perché in queste direzioni si sono verificati eventi che potrebbero influenzare cambiamento di tendenza.
  2. Identificare i fattori, che influenzano davvero il cambiamento della situazione.
  3. Accettare decisione informata(ad esempio, sugli acquisti, sulla pianificazione, ecc.).

Ora vediamo cos'è un intervallo di confidenza e come calcolarlo in Excel utilizzando un esempio.

Cos'è un intervallo di confidenza?

L'intervallo di confidenza rappresenta i limiti della previsione (superiore e inferiore), entro i quali con una data probabilità (sigma) appariranno i valori effettivi.

Quelli. Calcoliamo la previsione: questa è la nostra linea guida principale, ma comprendiamo che è improbabile che i valori effettivi siano pari al 100% alla nostra previsione. E sorge spontanea la domanda: entro quali confini i valori effettivi potrebbero diminuire, se la tendenza attuale continua? E questa domanda ci aiuterà a rispondere calcolo dell'intervallo di confidenza, cioè. - limiti superiore e inferiore della previsione.

Cos'è un dato sigma di probabilità?

Durante il calcolo intervallo di confidenza che possiamo impostare la probabilità colpi valori reali entro i limiti previsionali indicati. Come farlo? Per fare ciò impostiamo il valore di sigma e, se sigma è uguale a:

    3 sigma- quindi, la probabilità che il successivo valore effettivo rientri nell'intervallo di confidenza sarà del 99,7%, ovvero 300 a 1, oppure c'è una probabilità dello 0,3% di oltrepassare i limiti.

    2 sigma- allora la probabilità che il valore successivo rientri nei limiti è ≈ 95,5%, cioè le probabilità sono di circa 20 a 1, ovvero c'è una probabilità del 4,5% di esagerare.

    1 sigma- allora la probabilità è ≈ 68,3%, cioè le probabilità sono circa 2 a 1, ovvero c'è una probabilità del 31,7% che il valore successivo cada al di fuori dell'intervallo di confidenza.

Abbiamo formulato regola dei 3 sigma,che lo dice probabilità di successo un altro valore casuale nell'intervallo di confidenza con un dato valore tre sigma è 99,7%.

Il grande matematico russo Chebyshev ha dimostrato il teorema secondo cui esiste una probabilità del 10% di superare i limiti previsti con un dato valore di tre sigma. Quelli. la probabilità di rientrare nell'intervallo di confidenza di 3 sigma sarà almeno del 90%, mentre un tentativo di calcolare la previsione e i suoi confini “a occhio” è irto di errori molto più significativi.

Come calcolare da solo un intervallo di confidenza in Excel?

Diamo un'occhiata al calcolo dell'intervallo di confidenza in Excel (ovvero i limiti superiore e inferiore della previsione) utilizzando un esempio. Abbiamo una serie temporale: vendite per mese per 5 anni. Guardare il file allegato.

Per calcolare i limiti di previsione, calcoliamo:

  1. Previsioni di vendita().
  2. Sigma - deviazione standard modelli previsionali a partire dai valori effettivi.
  3. Tre sigma.
  4. Intervallo di confidenza.

1. Previsioni di vendita.

=(RC[-14] (dati di serie temporali)- RC[-1] (valore del modello))^2(quadrato)


3. Per ogni mese, sommiamo i valori di deviazione dalla fase 8 Sum((Xi-Ximod)^2), ovvero Riassumiamo gennaio, febbraio... per ogni anno.

Per fare ciò, usa la formula =SOMMA.SE()

SOMMA.SE(array con numeri di periodo all'interno del ciclo (per i mesi da 1 a 12); collegamento al numero di periodo nel ciclo; collegamento a un array con quadrati della differenza tra i dati di origine e i valori del periodo)


4. Calcolare la deviazione standard per ciascun periodo del ciclo da 1 a 12 (fase 10 nel file allegato).

Per fare ciò, estraiamo la radice dal valore calcolato nella fase 9 e la dividiamo per il numero di periodi di questo ciclo meno 1 = SQRT((Sum(Xi-Ximod)^2/(n-1))

Usiamo le formule in Excel =ROOT(R8 (collegamento a (Somma(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (link all'array con numeri di ciclo); O8 (collegamento a un numero di ciclo specifico che contiamo nell'array))-1))

Utilizzando la formula di Excel = CONTA.SE contiamo il numero n


Calcolando la deviazione standard dei dati effettivi dal modello previsionale, abbiamo ottenuto il valore sigma per ogni mese - fase 10 nel file allegato.

3. Calcoliamo 3 sigma.

Nella fase 11 impostiamo il numero di sigma - nel nostro esempio "3" (fase 11 nel file allegato):

Comodo anche per esercitarsi sui valori sigma:

1,64 sigma - 10% di possibilità di superare il limite (1 possibilità su 10);

1,96 sigma - 5% di possibilità di superare i limiti (1 possibilità su 20);

2,6 sigma - 1% di possibilità di superare i limiti (1 possibilità su 100).

5) Calcolo tre sigma, per questo moltiplichiamo i valori “sigma” di ogni mese per “3”.

3. Determinare l'intervallo di confidenza.

  1. Limite superiore della previsione- previsione delle vendite tenendo conto della crescita e della stagionalità + (più) 3 sigma;
  2. Limite inferiore della previsione- previsioni di vendita tenendo conto della crescita e della stagionalità – (meno) 3 sigma;

Per comodità di calcolo dell'intervallo di confidenza per un lungo periodo (vedi file allegato), utilizzeremo la formula Excel =Y8+CERCA.VERT(W8,$U$8:$V$19,2,0), Dove

Y8- Previsioni di vendita;

W8- il numero del mese per il quale prenderemo il valore 3-sigma;

Quelli. Limite superiore della previsione= “previsione vendite” + “3 sigma” (nell'esempio CERCA.VERT(numero del mese; tabella con valori 3 sigma; colonna da cui estraiamo il valore sigma pari al numero del mese nella riga corrispondente; 0)).

Limite inferiore della previsione= “previsione vendite” meno “3 sigma”.

Quindi, abbiamo calcolato l'intervallo di confidenza in Excel.

Ora abbiamo una previsione e un intervallo con limiti entro i quali i valori effettivi cadranno con una determinata probabilità sigma.

In questo articolo, abbiamo esaminato cosa sono il sigma e la regola del tre sigma, come determinare un intervallo di confidenza e perché è possibile utilizzare questa tecnica nella pratica.

Vi auguriamo previsioni accurate e successo!

Come Forecast4AC PRO può aiutartiquando si calcola l’intervallo di confidenza?:

    Forecast4AC PRO calcolerà automaticamente i limiti superiori o inferiori della previsione per più di 1000 serie temporali contemporaneamente;

    La capacità di analizzare i limiti della previsione rispetto alla previsione, al trend e alle vendite effettive sul grafico con la semplice pressione di un tasto;

Nel programma Forcast4AC PRO è possibile impostare il valore sigma da 1 a 3.

Unisciti a noi!

Scarica app gratuite di previsione e analisi aziendale:


  • Novo Forecast Lite- automatico calcolo delle previsioni V Eccellere.
  • 4analisi - Analisi ABC-XYZ e analisi delle emissioni Eccellere.
  • Qlik Sense Desktop e QlikViewPersonal Edition - Sistemi BI per l'analisi e la visualizzazione dei dati.

Testa le funzionalità delle soluzioni a pagamento:

  • Novo Previsioni PRO- previsione in Excel per set di dati di grandi dimensioni.
Intervallo di confidenza– i valori limite di una quantità statistica che, con una data probabilità di confidenza γ, si troverà in questo intervallo quando si campiona un volume maggiore. Indicata come P(θ - ε. In pratica, la probabilità di confidenza γ viene scelta tra valori abbastanza prossimi all'unità: γ = 0,9, γ = 0,95, γ = 0,99.

Scopo del servizio. Utilizzando questo servizio, puoi determinare:

  • intervallo di confidenza per la media generale, intervallo di confidenza per la varianza;
  • intervallo di confidenza per la deviazione standard, intervallo di confidenza per la quota generale;
La soluzione risultante viene salvata in un file Word (vedi esempio). Di seguito è riportata un'istruzione video su come compilare i dati iniziali.

Esempio n. 1. In una fattoria collettiva, su un totale di 1.000 pecore, 100 sono state sottoposte a tosatura di controllo selettivo. Di conseguenza, è stata stabilita una tosatura media della lana di 4,2 kg per pecora. Determinare con una probabilità di 0,99 l'errore quadratico medio del campione nel determinare la tosatura media della lana per pecora e i limiti entro i quali è contenuto il valore di taglio se la varianza è 2,5. Il campione non è ripetitivo.
Esempio n.2. Da un lotto di prodotti importati presso la dogana settentrionale di Mosca, sono stati prelevati 20 campioni del prodotto "A" mediante campionamento ripetuto casuale. Come risultato del test, è stato stabilito il contenuto medio di umidità del prodotto “A” nel campione, che è risultato pari al 6% con una deviazione standard dell'1%.
Determina con probabilità 0,683 i limiti del contenuto di umidità medio del prodotto nell'intero lotto di prodotti importati.
Esempio n.3. Da un sondaggio condotto su 36 studenti è emerso che il numero medio di libri di testo letti da loro durante l'anno accademico era pari a 6. Assumendo che il numero di libri di testo letti da uno studente per semestre abbia una legge di distribuzione normale con una deviazione standard pari a 6, trovare : A) con un'attendibilità di stima intervallare di 0,99 per l'aspettativa matematica di questa variabile casuale; B) con quale probabilità possiamo affermare che il numero medio di libri di testo letti da uno studente per semestre, calcolato da questo campione, si discosterà dall'aspettativa matematica in valore assoluto di non più di 2.

Classificazione degli intervalli di confidenza

Per tipologia di parametro oggetto di valutazione:

Per tipo di campione:

  1. Intervallo di confidenza per un campione infinito;
  2. Intervallo di confidenza per il campione finale;
Il campione è chiamato ricampionamento, se l'oggetto selezionato viene restituito alla popolazione prima di selezionare quello successivo. Il campione è chiamato non ripetuto, se l'oggetto selezionato non viene restituito alla popolazione. In pratica si tratta solitamente di campioni non ripetitivi.

Calcolo dell'errore medio di campionamento per il campionamento casuale

Viene chiamata la discrepanza tra i valori degli indicatori ottenuti dal campione e i corrispondenti parametri della popolazione generale errore di rappresentatività.
Designazioni dei principali parametri delle popolazioni generali e campione.
Formule dell'errore medio di campionamento
riselezioneripetere la selezione
per mediaper condivisioneper mediaper condivisione
La relazione tra il limite dell'errore di campionamento (Δ) è garantita con una certa probabilità Р(t), e l'errore medio di campionamento ha la forma: oppure Δ = t·μ, dove T– coefficiente di confidenza, determinato in base al livello di probabilità P(t) secondo la tabella della funzione integrale di Laplace.

Formule per il calcolo della dimensione del campione utilizzando un metodo di campionamento puramente casuale

Supponiamo di avere un gran numero di articoli con una distribuzione normale di alcune caratteristiche (ad esempio, un magazzino pieno di verdure dello stesso tipo, le cui dimensioni e peso variano). Vuoi conoscere le caratteristiche medie dell'intera partita di merce, ma non hai né il tempo né la voglia di misurare e pesare ogni verdura. Capisci che questo non è necessario. Ma quanti pezzi occorrerebbero prelevare per un controllo a campione?

Prima di fornire alcune formule utili per questa situazione, ricordiamo alcune notazioni.

In primo luogo, se misurassimo l'intero magazzino di verdure (questo insieme di elementi è chiamato popolazione generale), sapremmo con tutta la precisione a nostra disposizione il peso medio dell'intero lotto. Chiamiamola media X media .g en . - media generale. Sappiamo già cosa è completamente determinato se se ne conoscono il valore medio e la deviazione s . È vero, anche se non siamo né X media né S Non conosciamo la popolazione generale. Possiamo prendere solo un determinato campione, misurare i valori di cui abbiamo bisogno e calcolare per questo campione sia il valore medio X avg. che la deviazione standard S select.

È noto che se il nostro controllo campione contiene un numero elevato di elementi (di solito n è maggiore di 30), e vengono presi davvero casuale, quindi s la popolazione generale difficilmente differirà dalla selezione S..

Inoltre, per il caso di distribuzione normale possiamo utilizzare le seguenti formule:

Con una probabilità del 95%


Con una probabilità del 99%



In generale, con probabilità P (t)


La relazione tra il valore t ed il valore di probabilità P(t), con cui vogliamo conoscere l'intervallo di confidenza, può essere ricavata dalla seguente tabella:


Pertanto, abbiamo determinato in quale intervallo si trova il valore medio della popolazione (con una determinata probabilità).

A meno che non disponiamo di un campione sufficientemente ampio, non possiamo dire che la popolazione ha s = S seleziona Inoltre, in questo caso la vicinanza del campione alla distribuzione normale è problematica. In questo caso utilizziamo invece anche S select s nella formula:




ma il valore di t per una probabilità fissa P(t) dipenderà dal numero di elementi nel campione n. Maggiore n, più vicino sarà l'intervallo di confidenza risultante al valore dato dalla formula (1). I valori t in questo caso sono presi da un’altra tabella (t-test di Student), che riportiamo di seguito:

Valori del test t di Student per probabilità 0,95 e 0,99


Esempio 3. 30 persone sono state selezionate casualmente tra i dipendenti dell'azienda. Secondo il campione, si è scoperto che lo stipendio medio (al mese) è di 30 mila rubli con una deviazione standard di 5 mila rubli. Determina lo stipendio medio dell'azienda con una probabilità di 0,99.

Soluzione: Per condizione abbiamo n = 30, X avg. =30000, S=5000, P = 0,99. Per trovare l'intervallo di confidenza utilizzeremo la formula corrispondente al test t di Student. Dalla tabella per n = 30 e P = 0,99 troviamo t = 2,756, quindi,


quelli. fiduciario ricercato intervallo 27484< Х ср.ген < 32516.

Quindi, con una probabilità pari a 0,99 possiamo dire che l'intervallo (27484; 32516) contiene al suo interno lo stipendio medio dell'azienda.

Ci auguriamo che utilizzerai questo metodo e non è necessario che tu abbia un tavolo con te ogni volta. I calcoli possono essere eseguiti automaticamente in Excel. Nel file Excel, fai clic sul pulsante fx nel menu in alto. Selezionare quindi la tipologia “statistica” tra le funzioni, e dall'elenco proposto nella finestra - STUDAR DISCOVER. Quindi, quando richiesto, posizionando il cursore nel campo “probabilità”, inserisci il valore della probabilità inversa (cioè nel nostro caso, invece della probabilità di 0,95, devi digitare la probabilità di 0,05). A quanto pare, il foglio di calcolo è progettato in modo tale che il risultato risponda alla domanda su quanto è probabile che ci sbagliamo. Allo stesso modo, nel campo Grado di libertà, inserisci un valore (n-1) per il tuo campione.

Costruiamo un intervallo di confidenza in MS EXCEL per stimare il valore medio della distribuzione nel caso di un valore di dispersione noto.

Ovviamente la scelta livello di fiducia dipende completamente dalla risoluzione del problema. Pertanto, il grado di fiducia di un passeggero aereo nell'affidabilità di un aereo dovrebbe senza dubbio essere superiore al grado di fiducia di un acquirente nell'affidabilità di una lampadina elettrica.

Formulazione del problema

Supponiamo che da popolazione essendo stato preso campione taglia n. Si presume che deviazione standard questa distribuzione è nota. È necessario in base a questo campioni valutare l'ignoto media di distribuzione(μ, ) e costruire il corrispondente doppia faccia intervallo di confidenza.

Stima puntuale

Come è noto da statistiche(denotiamolo X media) È stima imparziale della media Questo popolazione ed ha distribuzione N(μ;σ 2 /n).

Nota: Cosa fare se è necessario costruire intervallo di confidenza nel caso di una distribuzione che non è normale? In questo caso, viene in soccorso, che prevede che abbia una dimensione sufficientemente grande campioni n dalla distribuzione non essendo normale, distribuzione campionaria delle statistiche X avg Volere circa corrispondere distribuzione normale con parametri N(μ;σ 2 /n).

COSÌ, stima puntuale media valori di distribuzione abbiamo - questo campione medio, cioè. X media. Ora cominciamo intervallo di confidenza.

Costruzione di un intervallo di confidenza

Di solito, conoscendo la distribuzione ed i suoi parametri, possiamo calcolare la probabilità che la variabile casuale assuma un valore compreso nell'intervallo da noi specificato. Ora facciamo il contrario: troviamo l’intervallo in cui cadrà la variabile casuale con una data probabilità. Ad esempio, dalle proprietà distribuzione normaleè noto che con una probabilità del 95%, una variabile casuale distribuita su legge normale, rientrerà nell'intervallo di circa +/- 2 da valore medio(vedi articolo su). Questo intervallo ci servirà da prototipo intervallo di confidenza.

Ora vediamo se conosciamo la distribuzione , calcolare questo intervallo? Per rispondere alla domanda dobbiamo indicare la forma della distribuzione e i suoi parametri.

Conosciamo la forma di distribuzione: questa è distribuzione normale(ricordate che stiamo parlando di distribuzione del campionamento statistiche X media).

Il parametro μ ci è sconosciuto (va solo stimato utilizzando intervallo di confidenza), ma ne abbiamo una stima X media, calcolato in base a campioni, che può essere utilizzato.

Secondo parametro - deviazione standard della media campionaria lo considereremo noto, è uguale a σ/√n.

Perché non sappiamo μ, quindi costruiremo l’intervallo +/- 2 deviazioni standard non da valore medio, e dalla sua stima nota X media. Quelli. durante il calcolo intervallo di confidenza NON lo daremo per scontato X media rientra nell'intervallo +/- 2 deviazioni standard da μ con una probabilità del 95% e assumeremo che l'intervallo sia +/- 2 deviazioni standard da X media con una probabilità del 95% coprirà μ – media della popolazione generale, da cui è stato tratto campione. Queste due affermazioni sono equivalenti, ma la seconda affermazione ci permette di costruire intervallo di confidenza.

Inoltre, chiariamo l'intervallo: una variabile casuale distribuita legge normale, con una probabilità del 95% rientra nell'intervallo +/- 1.960 deviazioni standard, non +/- 2 deviazioni standard. Questo può essere calcolato utilizzando la formula =NORM.ST.REV((1+0,95)/2), cm. file di esempio Intervallo foglio.

Ora possiamo formulare un'affermazione probabilistica che ci servirà a formare intervallo di confidenza:
"La probabilità che popolazione media situato da media campionaria entro 1.960" deviazioni standard della media campionaria", pari al 95%".

Il valore di probabilità menzionato nella dichiarazione ha un nome speciale , a cui è associato livello di significatività α (alfa) mediante una semplice espressione livello di fiducia =1 . Nel nostro caso livello di significatività α =1-0,95=0,05 .

Ora, sulla base di questa affermazione probabilistica, scriviamo un'espressione per il calcolo intervallo di confidenza:

dove Zα/2 standard distribuzione normale(questo valore della variabile casuale z, Che cosa P(z>=Zα/2 )=α/2).

Nota: α/2-quantile superiore definisce la larghezza intervallo di confidenza V deviazioni standard campione medio. α/2-quantile superiore standard distribuzione normale sempre maggiore di 0, il che è molto conveniente.

Nel nostro caso, con α=0,05, α/2-quantile superiore equivale a 1.960. Per altri livelli di significatività α (10%; 1%) α/2-quantile superiore Zα/2 può essere calcolato utilizzando la formula =NORM.ST.REV(1-α/2) o, se nota livello di fiducia, =NORM.ST.OBR((1+livello di attendibilità)/2).

Di solito durante la costruzione Intervalli di confidenza per la stima della media Usare solo α superiore/2-quantile e non usare α inferiore/2-quantile. Questo è possibile perché standard distribuzione normale simmetricamente rispetto all'asse x ( la sua densità distributiva simmetrico circa nella media, cioè 0). Pertanto non è necessario calcolare α/2-quantile inferiore(si chiama semplicemente α /2-quantile), Perché è uguale α superiore/2-quantile con un segno meno.

Ricordiamo che, nonostante la forma della distribuzione del valore x, la corrispondente variabile casuale X media distribuito circa Bene N(μ;σ 2 /n) (vedi articolo su). Pertanto, in generale, l'espressione di cui sopra per intervallo di confidenzaè solo un'approssimazione. Se il valore x è distribuito su legge normale N(μ;σ 2 /n), quindi l'espressione per intervallo di confidenzaè accurato.

Calcolo dell'intervallo di confidenza in MS EXCEL

Risolviamo il problema.
Il tempo di risposta di un componente elettronico a un segnale di ingresso è una caratteristica importante del dispositivo. Un ingegnere desidera costruire un intervallo di confidenza per il tempo di risposta medio con un livello di confidenza del 95%. Dall'esperienza precedente, l'ingegnere sa che la deviazione standard del tempo di risposta è di 8 ms. È noto che per valutare il tempo di risposta, l'ingegnere ha effettuato 25 misurazioni, il valore medio era di 78 ms.

Soluzione: Un ingegnere vuole conoscere il tempo di risposta di un dispositivo elettronico, ma capisce che il tempo di risposta non è un valore fisso, ma una variabile casuale che ha una propria distribuzione. Quindi, il meglio che può sperare è determinare i parametri e la forma di questa distribuzione.

Sfortunatamente, dalle condizioni problematiche non conosciamo la forma della distribuzione del tempo di risposta (non deve esserlo). normale). , anche questa distribuzione è sconosciuta. Si conosce solo lui deviazione standardσ=8. Pertanto, mentre non possiamo calcolare le probabilità e costruire intervallo di confidenza.

Tuttavia, nonostante non conosciamo la distribuzione tempo risposta separata, lo sappiamo secondo CPT, distribuzione del campionamento tempo medio di rispostaè approssimativamente normale(supponiamo che le condizioni CPT vengono effettuati, perché misurare campioni abbastanza grande (n=25)) .

Inoltre, media questa distribuzione è uguale a valore medio distribuzione di una singola risposta, ad es. µ. UN deviazione standard di questa distribuzione (σ/√n) può essere calcolata utilizzando la formula =8/ROOT(25) .

È anche noto che l'ingegnere ha ricevuto stima puntuale parametro μ pari a 78 ms (X avg). Pertanto, ora possiamo calcolare le probabilità, perché conosciamo la forma di distribuzione ( normale) e i suoi parametri (X avg e σ/√n).

L'ingegnere vuole sapere valore atteso Distribuzioni dei tempi di risposta μ. Come detto sopra, questo μ è uguale a aspettativa matematica della distribuzione campionaria del tempo medio di risposta. Se usiamo distribuzione normale N(X avg; σ/√n), allora il μ desiderato sarà compreso nell'intervallo +/-2*σ/√n con una probabilità di circa il 95%.

Livello di significatività equivale a 1-0,95=0,05.

Infine, troviamo il bordo sinistro e destro intervallo di confidenza.
Bordo sinistro: =78-NORM.ST.REV(1-0.05/2)*8/ROOT(25) = 74,864
Bordo destro: =78+INV.ST.NORM.(1-0.05/2)*8/ROOT(25)=81.136

Bordo sinistro: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Bordo destro: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Risposta: intervallo di confidenza A Livello di confidenza del 95% e σ=8ms equivale 78+/-3,136 ms.

IN file di esempio sul foglio Sigma noto, ha creato un modulo per il calcolo e la costruzione doppia faccia intervallo di confidenza per arbitrario campioni con dati σ e livello di significatività.

Funzione FIDUCIA.NORM()

Se i valori campioni sono nella gamma B20:B79 , UN livello di significatività pari a 0,05; quindi la formula MS EXCEL:
=MEDIA(B20:B79)-CONFIDENZA.NORM(0,05;σ; CONTEGGIO(B20:B79))
restituirà il bordo sinistro intervallo di confidenza.

Lo stesso limite può essere calcolato utilizzando la formula:
=MEDIA(B20:B79)-NORM.ST.REV(1-0,05/2)*σ/ROOT(COUNT(B20:B79))

Nota: La funzione CONFIDENCE.NORM() è apparsa in MS EXCEL 2010. Nelle versioni precedenti di MS EXCEL, veniva utilizzata la funzione TRUST().

Caricamento...