Audio Digitale
From Audacity Manual
L'audio digitale converte i suoni analogici in un formato che può essere memorizzato su computer e manipolato. Audacity è un programma software che permette di modificare, miscelare e applicare affetti a registrazioni audio digitali.
L'audio digitale
Tutti i suoni che ascoltiamo con le nostre orecchie sono variazioni di pressione nell'aria. Cominciando dalla dimostrazione di Thomas Edison con il primo fonografo nel 1877, è stato possibile catturare queste variazioni di pressione in un mezzo fisico e quindi riprodurle succesivamente rigenerando le stesse variazioni di pressione. Le variazioni di pressione audio, o forme d'onda, somigliano a qualcosa del genere:
Gli strumentidi registrazione analogica, come i dischi in vinile, i nastri e le cassette audio, rappresentano direttamente la forma d'onda. La registrazione analogica può riprodurre una impressionante gamma di suoni, ma altresì è afflitta da problemi di rumore. In particolare, ogni volta che viene copiata una registrazione analogica, compare un ulteriore rumore, riducendone la fedeltà. Questo rumore può essere ridotto ma non completamente eliminato.
La registrazione digitale funziona in maniera diversa: essa campiona la forma d'onda in punti temporali uniformemente intervallati, rappresentando ciascun campione con un numero preciso. Le registrazioni digitali, memorizzate su un compact disc (CD), su un nastro digitale audio (DAT), o su un personal computer (PC), non si degradano nel tempo e possono essere copiate perfettamente senza introdurre ulteriore rumore. La figura seguente illustra un esempio di forma d'onda audio:
L’audio digitale può essere modificato e miscelato senza che venga introdotto ulteriore rumore. Inoltre, è possibile applicare la maggior parte degli effetti digitali alle registrazioni audio digitalizzate per simulare il riverbero, migliorare certe frequenze, o cambiare la tonalità. Audacity è un programma software che permette di modificare, miscelare, e applicare numerosi effetti alle registrazioni audio digitali.
La capacità di Audacity di riprodurre o registrare l’audio direttamente dal vostro computer dipende dallo specifico hardware del vostro computer. La maggior parte dei computer desktop dispone di una scheda audio con porte da 1/8" (3,5 mm) in cui inserire un microfono o altre sorgenti di registrazione, e altoparlanti o cuffie per ascoltare l’audio. La maggior parte dei computer laptop dispone di altoparlanti e microfoni incorporati. La scheda audio che è presente nella maggior parte dei computer non è di qualità particolarmente elevata; se siete interessati a una registrazione di alta qualità, vedete Qualità della registrazione per avere maggiori dettagli. Per informazioni su come impostare Audacity per la riproduzione e la registrazione, vedete Impostazioni e configurazione di Audacity.
Qualità dell'audio digitale
La qualità di una registrazione di un audio digitale dipende principalmente da due fattori: la frequenza di campionamento e il formato di campionamento o profondità bit. Incrementando la frequenza di campionamento o il numero di bit in ciascun campione si incrementa la qualità della registrazione, ma si incrementa anche lo spazio occupato dai file audio su un computer o un CD.
Frequenza di campionamento
La Frequenza di campionamento è misurata in hertz (Hz), o cicli per secondo. Questo valore rappresenta semplicemente il numero di campioni catturati per secondo allo scopo di rappresentare la forma d’onda; maggiori sono i campioni per secondo, più elevata è la risoluzione, e quindi più precisa è la forma d’onda. L’orecchio umano è sensibile ai suoni con frequenze comprese approssimativamente tra 20 Hz e 20.000 Hz. I suoni al di fuori di questo intervallo non sono fondamentalmente udibili, sebbene Rupert Neve abbia soggettivamente provato l’esistenza di una fedeltà psicoacustica che può essere sentita al di sopra del supposto limite di 20.000 kHz.
Catturare un audio a una particolare frequenza richiede una frequenza di campionamento almeno due volte superiore a questa frequenza (conosciuta come frequenza Nyquist). Perciò una frequenza di campionamento di 40.000 Hz è il minimo assoluto necessario per riprodurre l’audio nell’intervallo dell’udito umano, sebbene frequenze più alte (denominate di sovracampionamento) possano migliorare ulteriormente la qualità evitando ogni artefatto intorno alla frequenza Nyquist. La frequenza di campionamento usata nei CD audio è di 44.100 Hz. La parola umana è comprensibile anche se sono eliminate le frequenze al di sopra di 4.000 Hz; infatti i telefoni trasmettono solo frequenze comprese tra 200 Hz e 4.000 Hz. Perciò una comune frequenza di campionamento per le registrazioni audio è di 8.000 Hz, che è talora denominata qualità parola. Da notare che un filtraggio completo (denominato filtro anti-aliasing) è richiesto al di sopra della frequenza Nyquist allo scopo di impedire che il segnale al di sopra di questo punto di taglio (cut-off) sia riportato nell’intervallo udibile dal convertitore digitale, creando degli artefatti di distorsione del rumore.
Le frequenze di campionamento più comuni, misurate in kilohertz (KHz, o 1.000 Hz), sono 8 KHz, 16 KHz, 22.05 KHz, 32KHz, 44.1 KHz, 48 KHz, 96 KHz e 192 KHz. Audacity supporta ognuna di queste frequenze di campionamento, tuttavia la maggior parte delle schede audio dei computer sono limitate ai 48 KHz o ai 96 KHz. Inoltre, la frequenza di campionamento di gran lunga più comune è quella di 44.1 KHz (44100 Hz).
Nella figura seguente, la metà sinistra della forma d’onda presenta una bassa frequenza di campionamento, mentre la metà destra ha un’alta frequenza di campionamento (cioè alta risoluzione):
Formato di campionamento
L'altra misura della qualità audio è il formato di campionamento (o profondità bit), che è usualmente misurata dal numero di bit usati per rappresentare ogni campione. Più bit sono usati, più precisa è la rappresentazione di ogni campione. Incrementando il numero di bit si incrementa anche il massimo intervallo dinamico della registrazione audio, cioè la differenza di volume tra il suono più forte e quello più debole che possono essere rappresentati. L'intervallo dinamico è misurato in decibel (dB). L’orecchio umano può percepire suoni con un intervallo dinamico di almeno 90 dB. Tuttavia, ogni volta che è possibile, è una buona idea registrare l’audio digitale con un intervallo dinamico superiore ai 90 dB, in modo che i suoni molto deboli possano essere amplificati per la massima fedeltà. Da notare che sebbene i segnali registrati a bassi livelli possano essere aumentati (cioè normalizzati) per avvantaggiare l’intervallo dinamico disponibile, la registrazione dei segnali di basso livello non userà tutta la profondità bit e questa perdita di risoluzione non può essere ripristinata semplicemente normalizzando il livello complessivo della forma d’onda digitale.
I formati di campionamento più comuni e i loro rispettivi intervalli dinamici comprendono:
- 8-bit intero: 45 dB
- 16-bit intero: 90 dB
- 24-bit intero: 135 dB
- 32-bit a virgola mobil: dB quasi infiniti
Altri formati di campionamento come ADPCM si avvicinano ai 16-bit audio con campioni compressi di 4-bit. Audacity può importare molti di questi formati, ma sono raramente usati per la presenza di più nuovi e migliori metodi di compressione.
I CD audio e la maggior parte dei formati file audio usano 16-bit interi. In maniera predefinita, Audacity usa internamente campioni di 32-bit a virgola mobile, mentre quando lavorate su un progetto ed esportate il vostro mixaggio finale vengono usati 16-bit interi. Questo offre una migliore qualità nei programmi audio che usano puramente campioni audio di 16-bit o 24-bit. Il formato di campionamento predefinito di Audacity può essere configurato nella scheda Qualità delle Preferenze o individualmente impostato per ciascuna traccia nel Menu a discesa Traccia.
Nella figura seguente, la metà sinistra della forma d’onda ha un formato di campionamento con pochi bit, mentre la metà destra ha un formato di campionamento con più bit. Se pensate alla frequenza di campionamento come lo spazio tra le linee verticali della griglia, il formato di campionamento è lo spazio tra le linee orizzontali della griglia.
Dimensione dei file audio
I file audio sono molto grandi, molto più grandi di molti file con cui probabilmente lavorate (a meno che non lavoriate con file video). Per determinare la dimensione di un file audio non compresso, moltiplicate la frequenza di campionamento (esempio, 44100 Hz) per il formato di campionamento in bit rate (esempio, 16-bit) per il numero di canali (2 per stereo) per il numero di secondi. Un CD stereo da 74 minuti completamente pieno occupa oltre 6 miliardi di bit. Dividete il numero per 8 e avrete il numero di byte; un CD audio è meno di 800 megabyte (MB). Vedasi compressione audio più avanti.
Clipping
Un limite dell’audio digitale è che non può gestire segnali audio che superano il livello massimo per cui è stato progettato per essere gestito. Quando un segnale registrato supera il livello massimo, i campioni al di fuori dell’intervallo sono tagliati al massimo valore, come mostrato nella figura seguente:
Un audio registrato con questo clipping sarà distorto in modo decisamente fastidioso. Sebbene vi siano alcune tecniche per eliminare piccole quantità di rumore dovuto al clipping, è sempre preferibile evitare il clipping durante la registrazione. Modificate il volume nella vostra sorgente di input (microfono, lettore di cassette, lettore di dischi) e impostate il controllo del volume di input di Audacity (nella Barra Mixer) in modo che la forma d’onda sia la più ampia possibile (per la massima fedeltà) ma senza clipping.
L'audio compresso
Poichè i file audio sono molto grandi, la riduzione della frequenza di campionamento era tipicamente utilizzata ogni qualvolta fosse possibile. Nel 1991, lo standard MP3 (MPEG I, layer 3) ha cambiato ogni cosa. MP3 è una tecnica di compressione con perdita che può ridurre notevolmente la dimensione del file audio digitale con un effetto sulla qualità sorprendentemente piccolo. Un secondo di audio di qualità CD occupa 1.4 megabit, mentre un comune bit rate per i file MP3 è 128 kilobit, con un fattore di compressione superiore a 10x! MP3 lavora "eliminando" abilmente i dettagli della forma d’onda a cui l’udito umano non è sensibile, sulla base di un "modello psicoacustico" su come le nostre orecchie e il nostro cervello elaborano l’audio. Non tutti i file MP3 sono creati allo stesso modo; differenti modelli psicoacustici porteranno a differenti quantità di distorsione percettibile nel suono.
Con un buon impianto hi-fi, chiunque può udire la differenza tra un MP3 a 128k e un file audio non compresso di un CD. I file MP3 a 192k, 256k e 320k sono più diffusi tra gli audiofili che preferiscono una qualità elevata, con artefatti al limite dell’udibile.
Sono disponibili molti altri formati file audio compressi con perdita. Audacity supporta completamente il formato Ogg Vorbis, che è simile al formato MP3 ma è uno standard completamente open, libero da diritti. Con il passare del tempo i file Ogg Vorbis hanno superato la qualità del formato MP3, e questo formato è più flessibile, per cui sono possibili molti più miglioramenti. Ogg Vorbis sarebbe una scelta ottimale per il vostro audio, tuttavia la realtà è che la maggior parte dei dispositivi come iPod e gli altri lettori portatili supportano il formato MP3 ma non ancora il formato Ogg Vorbis.
Altri ben conosciuti metodi di compressione comprendono ATRAC, usato dai registratori Sony Minidisc, Windows Media Audio (WMA), e AAC.