Dither: questo sconosciuto

Si sente spesso parlare di dithering come di un misterioso “processo di conversione da 24 a 16 bit” e di “dither che suonano meglio di altri”. Cercherò di chiarire meglio il concetto e di spiegare quando e perché è necessario utilizzarlo.

Intanto: cosa sono questi bit e perché dobbiamo ridurli??

La risoluzione di un file audio digitale nel sistema PCM (Pulse Code Modulation) si misura tramite due variabili. La prima è la frequenza di campionamento, ovvero il numero di volte al secondo che il nostro sistema misura l’audio in ingresso. Per lo standard CD questa è fissata a 44.100 Hz, il che significa che l’audio viene misurato 44100 volte al secondo. Questo, secondo il teorema di Nyquist, ci da un risposta in frequenza massima di 22.050 Hz (parleremo in dettaglio di frequenze di campionamento e oversampling in un altro post). Il secondo valore rappresenta la risoluzione del campione che viene preso ad ogni ciclo ed è espresso in bit, nel caso del CD sono 16 ma la maggior parte delle workstation audio lavorano a 24 o 32 bit. Questo valore, che esprime la capacità di dettagliare la dinamica del segnale, è quello che ci interessa: il segnale di dithering infatti viene applicato proprio per risolvere un problema legato alla riduzione del valore dei bit, ad esempio per esportare un brano dal nostro software a 24 bit in un file a 16 bit per la masterizzazione di un CD.

Ridurre il range dinamico del nostro segnale è possibile anche senza l’uso di un dither, una pratica nota come “troncamento”, ma genera un errore che in alcuni casi può essere facilmente udibile.

Prendiamo per esempio una forma d’onda molto semplice, una sinusoide a 1000Hz campionata a 16 bit:

1khz 16bit

Dovendo ridurre il numero di bit per forza di cose dovremo approssimare alcuni punti al valore più vicino sulla nuova scala. Il problema nasce dal fatto che questa approssimazione, detta “errore di quantizzazione” è per sua natura regolare. La regolarità di questo errore è ben percepibile dall’orecchio umano come un’armonica non presente nel segnale originale.

1khz 8bit

Il sistema migliore per prevenire questo problema è l’applicare un rumore casuale che spezzi la regolarità dell’errore di quantizzazione: in questo modo avremmo eliminato il problema aggiungendo solamente un po’ di rumore di fondo a bassissimo livello.

Dato il grande rendimento dei convertitori di oggi nel rapporto segnale/disturbo questo segnale aggiunto è praticamente ininfluente ma risolve il problema in modo efficiente. Le varie tipologie di dither si riferiscono all’algoritmo utilizzato per la generazione casuale dei valori, per esempio il “dither triangolare” ha un algoritmo che genera valori prevalentemente nella parte centrale tra due numeri: il termine “triangolare” si riferisce proprio alla rappresentazione grafica di questa probabilità, più alta al centro e più bassa ai lati.

Capito di cosa si tratta vediamo quando questo si rende necessario.

Abbiamo preso in analisi un segnale semplice, una forma d’onda sinusoidale nella quale gli errori di quantizzazione sono bene evidenti. Nella vita reale però la musica non è quasi mai fatta di suoni così semplici ma di segnali molto più complessi che sono già di per sé decorrelati. E’ per questo che spesso si sente dire che l’effetto del dither è più evidente sulle code dei riverberi e sulla musica classica, dove è normale trovare magari un violino da solo che suona una parte molto bassa in dinamica e che quindi ripropone uno schema simile a quello proposto all’inizio. Sicuramente sarà più difficile, se non impossibile, percepire questo effetto sopra un brano rock con una dinamica e una complessità armonica altissima.

In ogni caso, viste le esigue controindicazioni, è buona pratica aggiungere il segnale di dithering ad ogni cambiamento della profondità dei bit, che deve essere comunque l’ultimo processo della catena. Alcune workstation hanno già integrato questo processo senza bisogno di aggiungere nessun plugin ma è bene verificare le specifiche di ogni sistema.

Waves IDR

[esempio di Dither (Waves IDR) utilizzato per l’esportazione a 16 bit per la stampa di un CD Audio]

Per approfondire: “Principles of Digital Audio” di Ken C. Pohlmann (ed. McGraw-Hill)

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *