Segnali e misure

Da REW Wiki.

Segnali e misure

"Cosa significa tutta questa roba?"

Per dare un senso a tutte le misure che con REW si possono eseguire, è importante capirne il loro significato. Questo argomento fornisce una panoramica delle nozioni di base dei segnali e delle misure e spiega come sono generati i vari grafici all’interno di REW e come questi sono messi in relazione a quanto è stato misurato.


Segnali, Frequenza di campionamento e Risoluzione

La prima cosa da comprendere è cos'è un segnale, almeno nel contesto di esecuzione di una misura acustica. I segnali a cui noi siamo interessati, sono suoni registrati attraverso un microfono o attraverso un fonometro. La pressione sonora genera nel microfono / fonometro, dei segnali elettrici che vengono catturati dalla nostra scheda audio, che effettua ai suoi ingressi, la misura del livello elettrico. Ogni misura, è indicata come campione. Quanto spesso i campioni vengono catturati, dipende dalla frequenza di campionamento. REW supporta frequenze di campionamento di 44.1kHz o 48kHz, che sta ad indicare quante volte la scheda audio cattura il segnale presente ai suoi ingressi: 44.100 o 48.000 volte al secondo. Tre secondi di un segnale campionato a 48kHz, significano una sequenza di 3 x 48.000 = 144.000 valori. La più alta frequenza che può essere catturata ad una data frequenza di campionamento, è pari alla metà di quest’ultima. Abbiamo quindi bisogno almeno di due campioni per ogni ciclo di frequenza per poterla riprodurre. A 48kHz di campionamento, la massima frequenza che possiamo catturare è pari a 24kHz. Le frequenze che superano la metà della frequenza di campionamento, causerebbero aliasing, e apparirebbero più basse di quanto in realtà sono. Per esempio, un segnale a 25KHz, campionato a 48KHz, apparirebbe come un segnale a 23KHz. Per prevenire questo fenomeno, gli ingressi delle schede audio posseggono dei filtri anti-aliasing, che tentano di bloccare i segnali con una frequenza più alta di quella massima catturabile, ma, non essendo pienamente efficaci, dobbiamo sempre considerare il contenuto in frequenza del segnale che stiamo cercando di catturare.


La risoluzione delle misure della scheda audio, è tipicamente pari a 16 bit o 24 bit. La risoluzione a 16 bit, è la stessa utilizzata nei CD ed è supportata da REW. Avere 16 bit di risoluzione, significa che l'intervallo dei valori di una misura, è compreso tra -32768 e +32767 (numeri che possono essere rappresentati con 15 cifre binarie, più la 16^ cifra per memorizzare il segno del numero). Anziché utilizzare direttamente i numeri della misura, è conveniente fare riferimento ad essi in termini di quanto si avvicinano al numero più grande riferito al Fondo Scala (Full Scale) abbreviato come FS. I valori FS sono -32768 e +32767. Il più piccolo valore di misura diverso da zero, è 1, che, come percentuale del fondo scala, equivale a 100 x (1/32768) o, approssimativamente lo 0.003% FS. Tutto ciò che è più piccolo di questo valore, è visto dalla scheda audio come zero. Il valore di fondo scala, corrisponderà ad una certa tensione agli ingressi della scheda audio, che normalmente si aggira intorno a 1 Volt. Le schede audio che hanno una risoluzione maggiore (24 bit), generalmente accettano la stessa tensione massima (circa 1 Volt), ma possono usare una gamma maggiore di valori per misurare la tensione di ingresso. Per una scheda audio a 24-bit, il numero di valori riferito al FS, varia da -8388608 a +8388607. Questo, rappresenta ancora solo 1 Volt (tipicamente), e non è cambiato ma, data la risoluzione maggiore, il più piccolo valore che può essere rilevato, è pari a 100 x (1/8388608) percentuale del FS, cioè 0.000012% FS. Quindi, la maggior risoluzione offre benefici nella misura di segnali molto piccoli. Il valore di fondo scala è spesso trattato come corrispondente al valore uno e tutto ciò che si trova sotto tale valore rispetto al fondo scala, è considerato come la corrispondente proporzione di uno. Così mezzo fondo scala sarà 0.5 e così via.


Clipping

Se il segnale è maggiore del valore di fondo scala, la scheda audio non sarà in grado di trattarlo. Il valore della misura non potrà essere in ogni caso maggiore del valore FS, qualsiasi cosa succeda all’ingresso. Quando il segnale è andato al di là dell'intervallo che l’ingresso è in grado di misurare, si dice che è stato clippato (tagliato). Il clipping è visualizzato sui segnali di ingresso, come una parte piatta della risposta. Se avviene all’ingresso della scheda audio, sarà a +100% FS o a -100% FS e REW vi avviserà, ma talvolta, il clipping avviene prima che il segnale raggiunga la scheda audio (per esempio, nel preamplificatore microfonico, se è stato impostato un guadagno troppo elevato). In questo caso, i valori di misura, non arriveranno mai al valore FS della scheda audio, ma il segnale sarà comunque clippato. Il clipping deve essere evitato durante la misura, perchè il segnale catturato, non rappresenta più ciò che realmente sta accadendo all’ingresso e che corrompe la misura.

Visualizzare i segnali

Un metodo per visualizzare i segnali, è quello di tracciarne i valori rispetto al tempo. Quando i segnali catturati vengono tracciati nel grafico dell’oscilloscopio di REW, essi vengono mostrati come % FS. Un segnale che raggiunge il 100% FS, è il più grande segnale che la scheda audio è in grado di catturare. Un esempio dell'oscilloscopio è mostrato qui sotto e visualizza un segnale di sweep generato da REW e (in rosso), la risultante catturata dal microfono.


Grafico oscilloscopio.png


Noi siamo generalmente interessati oltre che ai valori dei campioni, alle frequenze che compongono il segnale. La gamma di frequenze che compongono il segnale, è detta Spettro e possiamo calcolarle utilizzando la Fast Fourier Transform o FFT. La FFT elabora le ampiezze e le fasi di un set di onde cosinusoidali che, quando sommate tra loro, danno origine allo stesso insieme di valori di misura del segnale di tempo. L’ampiezza e le fasi di queste onde cosinusoidali, sono un modo differente di rappresentare il segnale di tempo in termini di frequenze che lo compongono, anziché utilizzarne i suoi singoli valori di misura. Le ampiezze, sono facili da comprendere. Una grande ampiezza, significa una grande onda cosinusoidale. Le fasi indicano invece il valore di partenza dell'onda cosinusoidale al tempo del primo campione, nella sequenza che è stata misurata. Una fase di 0 gradi, significa che il valore di partenza ha un'ampiezza che vale: "ampiezza x cos(0) = ampiezza. Una fase di 90 gradi, significa che il valore iniziale vale: "ampiezza x cos(90) = 0". Noi siamo più spesso interessati dai valori delle ampiezze che a quelli delle fasi, ma non dovremmo dimenticare queste ultime, poichè da sole, contengono la metà delle informazioni riguardo alla forma del segnale di tempo originale.
Quando, per calcolare lo spettro, facciamo uso della FFT, essa usa un pacchetto di frequenze che, uniformemente distanziate, partono dalla DC (frequenza zero) fino alla metà della frequenza di campionamento (il massimo che può essere correttamente rappresentato). La spaziatura, dipende dalla lunghezza del segnale che intendiamo analizzare con la FFT. I calcoli della FFT, sono molto più efficienti, quando le lunghezze dei segnali sono potenze di 2, come 16k (16,384), 32k (32768) o 64k (65536). Per calcolare la FFT a 64k da un segnale che è campionato a 48kHz, abbiamo bisogno di 65536/48000 secondi di segnale, cioè 1.365s. Le frequenze, saranno distanziate di 24000/65536 = 0.366Hz. Se la FFT è stata generata da campioni a 16k, le frequenze saranno distanziate di 1.465Hz. Minore è il numero di campioni utilizzati per generare la FFT, maggiore sarà la distanza tra le frequenze e minore sarà la risoluzione in frequenza. Per un'alta risoluzione in frequenza, dobbiamo analizzare lunghi periodi dei segnali.


RTA (Real Time Analyzer)

Un modo comune per visualizzare lo spettro di un segnale di tempo, è l'utilizzo di un Real Time Analyser o RTA. L'RTA mostra un grafico delle ampiezze delle frequenze che costituiscono i segnali che si stanno analizzando. Tuttavia, mentre la FFT produce segnali che sono a frequenze uniformemente distanziate, un RTA le raggruppa insieme in frazioni di ottava. Un'ottava, equivale ad un raddoppio della frequenza, così, l'intervallo tra 100Hz e 200Hz equivale ad un'ottava, così come l'intervallo tra 1kHz e 2kHz. L'intervallo di frequenza di una frazione di ottava, è maggiore della frequenza che si ottiene. Per una RTA a 1/3 di ottava, l'intervallo è di 4.6Hz a 20Hz, ma è di 4.6kHz a 20kHz. Per una RTA a 1/24 di ottava, gli intervalli sono maggiori di 1/8. All'interno dell'intervallo di una frazione di ottava, molti singoli valori FFT possono essere usati per produrre il singolo valore che l'RTA assegna a quella banda di frequenze. In basso, è visualizzata un'immagine dell'RTA di REW che mostra lo spettro di un tono a 1KHz e la sua distorsione armonica.


Spettro.png


Sistemi e Funzioni di Trasferimento

La visualizzazione di un segnale, ha la sua utilità, ma noi siamo interessati anche a quanto un apparato altera lo spettro dei segnali. Il modo in cui un sistema modifica lo spettro dei segnali che lo attraversano, è chiamato Funzione di Trasferimento. La funzione di trasferimento, ha due componenti: la Risposta in Frequenza e la Risposta di Fase. La risposta in frequenza, mostra la variazione delle ampiezze delle frequenze introdotte dal sistema, mentre la risposta di fase mostra parimenti la variazione della fase delle frequenze. Una descrizione completa del sistema, richiede entrambe le risposte. Sistemi molto differenti, possono avere la stessa risposta in frequenza, ma la caratteristica che li distingue, è la loro differente risposta di fase.

Da notare che è importante non confondere la risposta in frequenza di un sistema con lo spettro di uscita del sistema. Ciò che lo spettro di un segnale ci mostra, è la sua composizione nei termini delle frequenze che contiene. La funzione di trasferimento della risposta in frequenza, ci dice come il sistema modifica lo spettro del segnale. Lo scopo di un software come REW è quello di misurare la funzione di trasferimento e i grafici di SPL & Fase, mostrando la funzione di trasferimento della frequenza e della risposta di fase. L’ampiezza della risposta in frequenza è mostrata come una traccia SPL. Sotto è possible vedere un grafico della risposta in frequenza (traccia superiore, asse di sinistra) e della risposta di fase (traccia inferiore, asse di destra), ricavate dalla misura di una stanza fino a una frequenza di 200Hz.


Spl e fase.png


La risposta all’impulso

La funzione di trasferimento, ci mostra attraverso le risposte di fase e di frequenza, come il sistema influisce sullo spettro del segnale che lo attraversa. Essa caratterizza il sistema in quello che è chiamato dominio della frequenza. Ma per quanto riguarda il segnale? Come possiamo descrivere come i singoli campioni del segnale vengono modificati dal sistema e il loro comportamento nel dominio del tempo? Il modo in cui il sistema modifica i campioni di un segnale, è detto risposta all’impulso. La ragione del nome sarà presto chiara. La risposta all’impulso (IR) è essa stessa un segnale composto da una serie di campioni. I segnali che vengono immessi nel sistema, si sovrappongono alla IR mentre lo attraversano, scorrendo sulla risposta, campione dopo campione. Quando il segnale appare, il suo primo campione sarà allineato con il primo campione della risposta all’impulso. L’uscita del sistema per quel primo campione d’ingresso, è il valore del primo campione della IR, moltiplicato per il valore del primo campione del segnale:

output[1] = input[1]*IR[1]

Un campione di intervallo più tardi, l’ingresso avrà 2 campioni sovrapposti con la IR. L’uscita per questo periodo di tempo sarà data dal secondo campione di tempo all’ingresso, moltiplicato per il primo campione della IR, più il primo campione di tempo all’ingresso, moltiplicato per il secondo campione della IR:

output[2] = input[2]*IR[1] + input[1]*IR[2]

Un altro campione di intervallo più tardi, l’ingresso avrà 3 campioni sovrapposti con la IR. L’uscita sarà: output[3] = input[3]*IR[1] + input[2]*IR[2] + input[1]*IR[3]

E così via per ogni successivo campione che appare. Il prodotto ottenuto dalla moltiplicazione dei campioni del segnale d’ingresso , con i campioni della IR, è chiamato convoluzione. Tipicamente, per la misurazione di una parte di un apparato, la risposta all’impulso è abbastanza di breve durata, molto meno di un secondo, mentre assume valori di un secondo o due, per la misura di una stanza domestica di medie dimensioni. Così eventualmente l’uscita ad ogni periodo di tempo, è data dalla lunghezza della IR, moltiplicata per la stessa lunghezza del segnale di ingresso, sommata a tutti i singoli prodotti fino ad ottenere l’uscita per quel periodo di tempo.


Perchè è chiamata "risposta all’impulso"?

Che risultato otterremmo, se il segnale d’ingresso consistesse in un singolo campione a fondo scala, al quale abbiamo assegnato il valore uno, seguito da valori pari a zero per tutti gli altri campioni? Il campione iniziale risultante sarebbe:

output[1] = input[1]*IR[1] = IR[1]

Il successivo campione sarebbe:

output[2] = input[2]*IR[1] + input[1]*IR[2] = 0*IR[1] + 1*IR[2] = IR[2]

Il terzo campione sarebbe:

output[3] = input[3]*IR[1] + input[2]*IR[2] + input[1]*IR[3] = 0*IR[1] + 0*IR[2] + 1*IR[3] = IR[3]

e così via. L’uscita sarebbe costituita a turno, da ciascun campione della IR. Un segnale di ingresso composto da un singolo campione a fondo scala, seguito da zeri, è chiamato impulso. Quando il sistema veicola alla sua uscita un simile segnale di ingresso, ciò viene definito risposta all’impulso.


Relazione tra la Funzione di Trasferimento e la Risposta all’Impulso

Poichè la funzione di trasferimento e la risposta all’impulso sono entrambe descrizioni dello stesso sistema, potremmo ragionevolmente supporre che siano tra loro correlate e lo sono. La funzione di trasferimento è la FFT della risposta all’impulso, e la risposta all’impulso è la FFT inversa della funzione di trasferimento. Entrambe sono visioni dello stesso sistema, una nel dominio della frequenza, e l’altra nel dominio del tempo. La funzione di trasferimento, è semplicemente lo spettro della risposta all’impulso.


Visualizzare la risposta all’impulso

Il grafico dell'impulso di REW, visualizza la risposta all’impulso. Questo mostra i valori espressi in  % FS o in dB FS. La scala in dB, è utile per visualizzare una dinamica più ampia del segnale e, anzichè tracciare i valori direttamente, traccia il log in base 10 dei valori, moltiplicato per 20. La parte superiore del grafico in dB, equivale a 0dB FS, che corrisponde al 100% FS. Ad un livello del 50% FS, corrisponde 20*log(0.5) = -6dB FS. Il 10% FS equivale a 20*log(0.1) = -20dB FS. La scala in dB FS, è utile per vedere come si comporta l’impulso ai livelli più bassi e dove sparisce sotto il livello di rumore della misura. L’immagine qui sotto, mostra prima la risposta all’impulso con l’asse delle Y impostato a % FS, e successivamente la stessa risposta utilizzando i dB FS. Nella seconda immagine possiamo vedere come l’impulso impieghi più tempo a decadere nel rumore di fondo, di quanto sembri invece dal grafico impostato in % FS.


impulso

impulso finestrato


Finestratura della Risposta all’Impulso

Supponiamo di voler eseguire una misura su un dispositivo che potrebbe essere un altoparlante, ma in acustica, il sistema che stiamo misurando, comprende altre variabili che intervengono nel percorso tra il segnale generato per la misurazione e il segnale prelevato per l’analisi. Queste variabili, includono gli amplificatori, il microfono, la scheda audio e soprattutto, la stanza stessa. Quindi il sistema nel suo complesso comprende tutti questi elementi e, per poterci concentrare solo su uno di essi, dovremo conoscere un modo per rimuovere l’influenza di tutte quelle parti alle quali non siamo interessati. La risposta della scheda audio, può essere calibrata misurandola separatamente, così come la risposta del microfono, mentre la rimozione degli effetti della stanza è molto più difficoltosa. Potrebbe essere proprio questa che a noi interessa, specialmente se stiamo studiando cosa sentiamo nella nostra posizione di ascolto ma, se cerchiamo di isolare le prestazioni di un altoparlante, il contributo della stanza potrebbe oscurare i dettagli che questo è in grado di riprodurre.

Il viaggio del suono che raggiunge il microfono attraverso un percorso diretto dall’altoparlante, oltre ad essere il più breve, è quello che impiega il minor tempo. L’altoparlante però, irradia il suono anche in altre direzioni che lo fanno rimbalzare sulle varie superfici della stanza. Queste riflessioni, compiendo quindi un tragitto maggiore prima di raggiungere il microfono, impiegano un tempo maggiore prima di arrivare a destinazione. Nel caso di un impulso, questo arriverà prima delle riflessioni, che arriveranno invece ritardate. Questo ritardo, è determinato dal maggior tempo necessario al suono, a compiere un percorso maggiore. Minore è il ritardo, minore è il tempo impiegato dal suono per raggiungere la superficie più vicina (se, per esempio, la superficie più vicina fosse situata a 1 m. di distanza, il suono riflesso raggiungerebbe il microfono circa 3 ms più tardi rispetto al suono diretto proveniente dall’altoparlante).

Se dovessimo analizzare solo i primi pochi ms della risposta all’impulso, vedremmo la parte corrispondente all’arrivo iniziale, che proviene direttamente dall’altoparlante, senza il contributo della stanza. Analizzando in questo modo, una piccola porzione della risposta all’impulso, eseguiremmo una finestratura della risposta (nelle immagini della risposta all’impulso, pochi righe sopra, la traccia blu mostra la finestra). Calcolando una FFT per quella porzione della IR (risposta all’impulso), potremmo vedere la funzione di trasferimento per quell’istante che corrisponderebbe alla funzione di trasferimento del solo altoparlante. Tuttavia, c’è uno svantaggio. Infatti, calcolando una FFT di un segnale breve, potremmo vedere solo la risposta fino a un limite che dipende da quanto lungo era il segnale in esame. Se avessimo un intero secondo di segnale da analizzare, potremmo avere una risposta in frequenza che scende fino a 1Hz mentre, se avessimo un segnale che dura solo 1/10 di secondo, la risposta scenderebbe fino a 10Hz. Generalmente, se la lunghezza del segnale da analizzare, vale T secondi, la frequenza più bassa vale 1/T. Così se la nostra finestra durasse 3ms, la risposta in frequenza scenderebbe solo fino a 1/0.003 = 333Hz. Così, per vedere le risposte a bassa frequenza senza le influenze della stanza, la superficie più vicina deve essere la più lontana possibile.. Per regolare le impostazioni della finestra in REW, cliccare sul pulsante IR Windows. Per impostazione predefinita, REW usa impostazioni della finestra che includono più di 0.5s della risposta all’impulso, in modo che gli effetti della stanza siano visibili.


Waterfall (grafico a cascata)

I grafici relativi alla SPL, alla Fase e all’Impulso, sono i più utilizzati per lo studio della funzione di trasferimento che abbiamo catturato, ma esiste un altro grafico che ci fornisce utili informazioni sul comportamento della stanza rispetto al suono in essa riprodotto. Tale grafico è detto Waterfall, e mostra come lo spettro di una sezione della risposta all’impulso cambia, man mano che il tempo progredisce. Esso è ottenuto, finestrando una parte iniziale della risposta, tipicamente pochi centesimi di ms guardando alle risposte della stanza, e la FFT di quella sezione finestrata. La FFT, produce la prima fetta del grafico a cascata. Spostiamo quindi leggermente la finestra lungo la risposta all’impulso, per ottenere la seconda fetta del grafico. Spostiamo ancora leggermente la finestra, per ottenere la terza fetta, poi la quarta e così via. Man mano che ci muoviamo in avanti sul grafico a cascata, iniziamo a perdere il contributo iniziale dato dall’altoparlante e iniziamo a vedere il contributo dato dalla stanza. La risposta di quest’ultima, è più forte a frequenze dove ci sono risonanze modali, che sono frequenze alle quali il suono rimbalza avanti e indietro tra le pareti della stanza, rinforzandosi e producendo uno stabile e lento decadimento. Queste frequenze sono mostrate nel grafico come creste. Più le creste sono alte, peggiori sono le risonanze modali, con lunghi tempi di decadimento.

Waterfall.png

Questa è stata una veloce introduzione ai concetti che stanno alla base della teoria dei segnali e delle misure. Se siete riusciti a restare incollati fino alla fine, ben fatto! Ora avete le informazioni necessarie per comprendere meglio come REW esegue le misure.


Indice dei contenuti - Torna su

Copyright © 2010 John Mulcahy All Rights Reserved