Come valutare ed esprimere l’ incertezza di una serie di misure

0 votes, average: 0,00 out of 50 votes, average: 0,00 out of 50 votes, average: 0,00 out of 50 votes, average: 0,00 out of 50 votes, average: 0,00 out of 50 voti
Foto Come valutare ed esprimere l' incertezza di una serie di misure
Condividi

Quando riportiamo il risultato di una serie di misure di una grandezza su uno o più campioni, dobbiamo sempre riportare il valore dell’ incertezza che possiamo garantire. Ecco spiegato come farlo in modo semplice.

Istruzioni

  • 1
    1) la qualità nelle misure

    oggi, le norme nazionali ed internazionali impongono la certificazione di qualità non solo nella produzione industriale, agricola e nella fornitura di servizi, ma anche nell’ effettuazione di tests analitici (che rientrano nella categoria dei “servizi”) di qualsiasi tipo: chimico, fisico, tecnico e biologico.
    Riguardo all’ effettuazione di tests analitici (l’ argomento di questa guida), queste norme di qualità impongono di seguire e rendere note precise procedure nell’ effettuazione delle prove, nel calcolo e nella presentazione dei risultati.
  • 2
    Come vanno fatte allora le analisi di una qualunque grandezza per rispettare i requisiti della qualità? Questi dati devono certificare in modo credibile ed affidabile le caratteristiche di un prodotto come la concentrazione di grassi in un alimento, la percentuale di benzene in una benzina, la presenza di grani difettosi nel frumento, nel riso o nel caffé, la composizione di una lega, la differenza di potenziale massima sopportabile di un condensatore, la durata della carica di una pila in condizioni di funzionamento prefissate, la presenza di inquinanti nell’ acqua, nell’ aria, nel terreno o nel sangue in una ricerca scientifica da pubblicare e così via.
    Occorre dimostrare da parte di chi presenta questi dati e capire bene da parte di chi li riceve ed utilizza come sono stati ottenuti in base alle procedure, agli strumenti, agli operatori, ai materiali e al numero di test effettuati.
  • 3
    2) precisione ed accuratezza

    riguardo all’ errore sperimentale nell’ effettuazione delle misure, queste devono essere sempre il risultato di una media x(m) tra un certo numero di prove fatte nelle stesse condizioni su ogni campione che si esprime semplicemente con la formula

    x(m) = (x1 + x2 + x3 + …..+ xn) / n (1)

    dove “n” è il numero di prove effettuate su cui si fa la media. Questa però non basta da sola, ma è molto importante anche la precisione e l’ accuratezza con cui vengono effettuate le misure. A questo punto, chiariamo innanzitutto la differenza molto importante tra accuratezza e precisione:
  • 4
    - accuratezza:
    data una media x(n) calcolata su n prove fatte su di un campione, l’ accuratezza è la distanza della media da un valore di riferimento x(std) considerato molto più sicuro, cioè affetto semplicemente da un margine di errore molto minore che viene definito come “standard di riferimento” e deve essere certificato.
    Più x(n) è vicino al valore di riferimento x(std), più la media che presentiamo è accurata ed indichiamo questo scarto come

    a = x(n) – x(std) (2)
  • 5
    Possiamo indicarlo nella forma (2) che ci dice anche se questo scarto è positivo o negativo, oppure in valore assoluto, se ci interessa solo l’ entità dello scarto.
    L’ affidabilità di uno standard di riferimento come può essere una soluzione a concentrazione ben nota o il campione dell’ unità di massa di 1 kg conservato nell’ ufficio internazionale dei pesi e delle misure di sèvres, a parigi è a sua volta stabilita dopo lunghe serie di misure e di controlli periodici che, ovviamente, danno scarti o incertezze rispetto alla media ben più piccoli di quelli che possiamo ottenere noi con le nostre analisi ordinarie.
    Non sempre però uno standard di riferimento esiste o è utilizzabile nella pratica a causa dei limiti tecnologici nell’ effettuazione delle misure. In questi casi, si può utilizzare come riferimento una media ottenuta anche con lo stesso metodo, se non c’ è nulla di meglio, da un numero di analisi molto più grande rispetto a quello che possiamo effettuare noi con i nostri mezzi.
  • 6
    - precisione

    la precisione è una misura dell’ affidabilità della media delle nostre misure che dipende molto da quanto sono disperse dal valore medio. Quindi, non basta dare una media molto accurata, cioè molto prossima al valore x(std) se i nostri dati sono dispersi in un intervallo troppo ampio cioè, appunto, poco precisi.
    Il valore medio che abbiamo ottenuto, infatti, può essere particolarmente vicino ad x(std) solo per caso e una successiva serie di misure fatta nelle stesse condizioni può darci facilmente una media sensibilmente diversa.
    Anche quando x(std) non è disponibile, una media ottenuta da valori molto dispersi non fa certo una bella impressione e suscita dubbi e contestazioni, specialmente in sede legale.
    La grandezza fondamentale che misura la precisione in una serie di misure è la “deviazione standard”, indicata con “s”. Si ottiene calcolando la media quadratica degli scarti delle singole misure xi dalla media xm:

    s = sqr[sum (xi - xm)^2] / n (3)

    dove “sqr” è la radice quadrata, “sum” è la somma ed “n” il numero di misure fatte. Questo valore al quadrato, s^2, è detto “varianza”.
  • 7
    3) come esprimere l’ intervallo di incertezza di una misura?

    - Trovata “s”, la si utilizza per definire un intervallo opportuno di incertezza di misura intorno alla media. Nei casi più semplici, si esprime scrivendola come
    x = x(m) +/- s, oppure x = x(m) +/- 2s o anche x(m) +/- 3s se vogliamo stare larghi con margini più ampi. Questo intervallo si chiama “intervallo di confidenza”, ma si esprime di solito in modo più rigoroso con una formula che tiene conto del fatto che l’ intervallo di confidenza si restringe se aumenta il numero delle prove “n” che facciamo. Quindi, più analisi facciamo, più ristretto è l’ intervallo di fiducia e più affidabile è la media:

    x = x(m) +/- u = x(m) +/- s * t(stud) / sqr(n) (4)

    dove sqr(n) è la radice quadrata di “n” e t(stud) è un fattore tabulato che diminuisce fino al valore teorico di 1,96 quando il numero di misure tende ad infinito, ma che si approssima spesso a 2 quando si fa una serie di misure intorno a 10 o più.
  • 8
    - t(stud) si trova dalle tavole in base ai gradi di libertà n-1 della nostra serie di analisi e al livello di fiducia con cui definiamo questo intervallo, cioè al 95% di probabilità o al 99% se vogliamo essere più restrittivi, ma con un intervallo di fiducia più ampio.
    Questo significa che, con un livello di fiducia al 95%, per esempio, noi stimiamo che solo il 5% delle misure fatte si trova al di fuori dell’ intervallo di confidenza scritto con la (4), oppure solo l’ 1% nel caso del livello di fiducia del 99%.
  • 9
    4) la distribuzione normale o gaussiana

    alla base degli intervalli di confidenza attorno alla media, c’ è la distribuzione dei valori delle misure intorno la loro media che tendono ad avere la massima frequenza in corrispondenza della media stessa, mentre le misure diventano sempre meno frequenti quanto più ne sono distanti.
    Questa distribuzione è nota come “normale” o “gaussiana” (o distribuzione di student) perchè, con un numero infinito di dati, coincide con l’ andamento a campana della funzione di gauss che ha il suo massimo attorno al valore centrale e tende asintoticamente a zero in modo simmetrico a destra e a sinistra del valore centrale o medio.
  • 10
    Questa funzione si calcola e si studia molto meglio definendo la sua frequenza in funzione non dello scarto dalla media, ma di una grandezza

    z = [x(i) - x(m)] / s (5)

    che è semplicemente il rapporto tra lo scarto di ogni misura rispetto alla media e la deviazione standard “s”. La funzione gaussiana (o normale) si esprime come la frequenza f(z) dei valori intorno alla media in funzione della variabile z sull’ asse delle ascisse:

    f(z) = [1 / s * sqr(2 * pi)] * e ^(-0,5z^2) (6)
    ed è centrata simmetricamente intorno al valore medio x(m) della serie di valori, oppure intorno al valore zero che rappresenta lo scarto nullo rispetto al valore medio.
    L’ area sotto la curva gaussiana rappresenta la probabilità che i valori misurati siano entro un certo intervallo di valori di z e l’ intera area è pari a 1. Delle tabelle apposite permettono di trovare queste aree in % su quella totale in un certo intervallo di “z”.
  • 11
    Misure troppo eccentriche possono essere scartate e, dato che questo giudizio non è sempre facile da dare ad occhio, esistono dei tests statistici da applicare su una serie di “n” dati come il test di dixon (su un singolo dato), quello di grubbs (su 1 o 2 dati) e quello di huber che è il migliore perchè permette di trovare quanti dati sono eccentrici senza partire dall’ ipotesi che siano 1 oppure 2 come per gli altri due tests.
  • 12
    Dalla distribuzione normale ritorniamo con unna spiegazione più matematica all’ intervallo di confidenza entro s, 2s oppure 3s dalla media:

    - l’ intervallo di fiducia x(m) +/- s che corrisponde a quello tra z = 1 e z = -1, equivale ad un’ area, cioè ad una probabilità del 68,27% di trovare i nostri dati entro questo intervallo.
    - L’ intervallo x(m) +/- 2s (tra z = 2 e z = -2) corrisponde ad una probabilità del 95,45%.
    - L’ intervallo x(m) +/- 3s (tra z = 3 e z = -3) corrisponde ad una probabilità del 99,73%, cioè a quasi tutta la curva della distribuzione.
  • 13
    Questi valori percentuali di probabilità corrispondono a dei livelli di confidenza come quelli già descritti al 95% o al 99% che sono quelli più usati per praticità e che corrispondono, rispettivamente, a x(m) +/- 1,96s ed x(m) +/- 2,58s.
    In casi più generali, abbiamo a disposizione delle tabelle che riportano l’ area delimitata dalla curva gaussiana come frazione dell’ unità tra due valori che ci interessano di “z” e ci aiutano a sapere quante misure sul totale di quelle fatte o che si vogliono fare ci si deve aspettare di trovare in un certo intervallo di valori intorno a quello medio.
    Per esempio, se abbiamo misurato i voti tra 0 e 10 di 1000 studenti in un test a quiz trovando una media di 7,1 con s = 1,0, possiamo sapere quanti ce ne dobbiamo aspettare in teoria con voti tra 8,0 e 9,0 e confrontare questo dato con il numero misurato sperimentalmente di studenti che rientrano in questo intervallo.
  • 14
    5) ripetibilità

    quando si fanno serie numerose di misure con 10 o 20 ripetizioni, non è certo per eseguire misure routinarie su ogni campione, altrimenti, occorrerebbe troppo tempo per dare un solo risultato, anche con spreco troppo alto di materiali e reagenti, come nel caso di analisi chimiche.
    Per le analisi correnti secondo un certo metodo, si deve invece fare una misura singola o una in doppio per poter dare una media, ma bisogna avere le spalle coperte da una serie fatta con un numero ben maggiore di misure (almeno 10, di solito) da ogni operatore che attesti l’ incertezza associata ai valori che fornisce.
  • 15
    La deviazione standard “s” di questa serie di riferimento è migliore di quella fatta con meno misure, ma si può utilizzare per determinare la “ripetibilità” dell’ operatore quando fa prove singole o in doppio che indichiamo con “r” ed è sicuramente più ampia. Il suo valore, infatti, è

    r = t(stud) * 2^(1/2) * s (7)

    dove t(stud) si trova sempre sulle tabelle in corrispondenza di n – 1 gradi di libertà, se n sono le prove effettuate.
    In questo modo, se l’ operatore fa un prova in doppio con una media x(m) tra 2 valori x1 ed x2, di solito si dovrà avere che il valore assoluto dello scarto è pari a:

    b = |x1 – x2| < 2r (8)

    per poter considerare accettabile la coppia di misure fatte e non dover ripetere l’ analisi. Questo significa che ogni misura x(i) non deve distare dalla media x(m) più di “r”, cioè

    x(i) = x(m) +/- r (9)
  • 16
    In altri casi, le norme fissano che il rapporto tra lo scarto relativo a due misure e la loro media x(m) moltiplicato per 100 sia inferiore ad un certo valore percentuale ma, comunque, il riferimento è sempre ad una ripetibilità che la misura in doppio deve garantire.

    La ripetibilità “r” si determina quando un operatore inizia ad usare uno strumento di misura nuovo, appena riparato o tarato periodicamente o quando lo utilizza per la prima volta per una certa analisi, oppure a scadenze regolari (ogni anno, ogni 3, 4 o 6 mesi) per verificare e poter garantire la costanza della sua ripetibilità nel tempo, come prescrivono oggi i protocolli della qualità nelle misure.
    La ripetibilità si determina per i singoli operatori della stessa ditta o laboratorio; ognuno ha la sua e quella dell’ intero gruppo adotta di solito il valore peggiore per riportarlo sui certificati, quando il metodo ufficiale applicato non prescrive un valore preciso di “r” a cui fare riferimento. In questo caso, ogni operatore deve fare la sua serie “lunga” di misure per verificare se la sua incertezza di misura rientra nei limiti prescritti.

Tags

,


Commenti alla guida

 
Chiudi

You need to log in to vote

The blog owner requires users to be logged in to be able to vote for this post.

Alternatively, if you do not have an account yet you can create one here.

Powered by Vote It Up