Nozioni di base sull’audio digitale II
Questo articolo è una continuazione del precedente Digital Sound Basics e si consiglia di leggerlo prima di procedere.
Nell’articolo precedente abbiamo visto come un’onda sonora viene memorizzata come numeri binari o suono digitale. Ma quanto spazio ho bisogno per memorizzare una canzone?
Spazio di archiviazione
Come abbiamo visto, la cosa più importante è la dimensione di ogni campione (quanti bit sono usati in ogni campione) e il numero di campioni che vengono presi. Più questi due importi sono alti, più spazio è necessario.
Se prendiamo come riferimento la qualità del CD, abbiamo che ogni campione ha bisogno di 16 bit (16b) o, che è lo stesso, 2 byte (2B).
In un secondo di suono vengono prelevati 44.100 campioni, quindi avremo bisogno di 88.200 byte per memorizzare un secondo di audio con questa qualità.
La maggior parte dei CD era lunga 74 minuti, ovvero 88.200 byte × 60 secondi/minuto × 74 minuti = 391,608 milioni di byte, o 391,6 MB (373,5 MiB).
Ma non dimentichiamo un piccolo dettaglio… la musica su un CD è stereo. Ciò significa che abbiamo due onde sonore, una per la sinistra e una per la destra, che non sono le stesse (se fossero le stesse sarebbero mono). Quindi abbiamo bisogno del doppio, 783,2 MB (746,9 MiB). E questa era la dimensione normale di un CD.
Ma pensiamo, questo era scandaloso per l’epoca (fine anni ’70 e primi anni ’80). Per non avere un’idea, il Macintosh originale aveva una capacità del disco di 400 kB, ovvero sufficiente per memorizzare poco più di 2 secondi di audio di qualità CD.
I floppy disk da 3,5” erano in grado di memorizzare 1,4 MB (circa 8 secondi) e continuarono ad essere utilizzati fino ai primi anni 2000. Gli hard disk degli anni ’90 non arrivavano a memorizzare il contenuto di un CD o forse era solo all’inizio. per essere un modello che lo ha superato, ma ad un prezzo proibitivo per archiviare musica.
Suono compresso
La soluzione era ridurre lo spazio di archiviazione necessario, in modo che con meno byte potessimo archiviare la stessa quantità di musica.
Nasce così il popolare formato audio MP3, diventato molto popolare tra la fine degli anni ’90 e l’inizio degli anni 2000. Il suono veniva solitamente memorizzato utilizzando 64 kb/s (su un CD audio era 705.6 kb/s) per un canale audio, 128 kb/s. s per stereo (su un CD audio da 1.411 kb/s). Si tratta di una riduzione di 9 volte lo spazio richiesto.
Questo è ciò che è noto come compressione con perdita (con perdita in inglese). Si basa sul fatto che parte dell’informazione dell’onda originale può essere persa perché tale perdita difficilmente avrà un impatto sull’ascoltatore, cioè difficilmente se ne accorgerà. Quindi lo spazio richiesto (e la larghezza di banda per trasmettere) è stato ridotto a costo di perdere un po’ di qualità.
All’inizio degli anni 2000 nasce il formato AAC (Advanced Audio Coding), che è un formato standard internazionale ISO/IEC 13818-7. La sua efficienza è molto superiore a quella dell’MP3, oltre a utilizzare un bit rate variabile (VBR) che gli consente di adattarsi in ogni momento della canzone e di utilizzare più o meno bit per codificarla. Ciò significa che per la stessa qualità è necessario utilizzare metà delle informazioni.
Questo è il formato che Apple ha scelto per i suoi iPod, anche se essendo uno standard puoi trovarlo come formato predefinito per molti dispositivi, come Nintendo, PlayStation, XBox, ecc… Inoltre, supporta fino a 48 canali audio, quindi è anche uno standard per i file video MP4 (film, documentari…) dove supporta senza problemi il tipico audio Dolby 5.1 o 7.1 per i film.
All’inizio del negozio di musica iTunes, iniziarono a essere venduti file AAC codificati a 64 kb / s per canale, cioè a 128 kb / s. Successivamente, all’inizio degli anni 2010, è passato a 128 kb/s per canale (256 kb/s in stereo).
Pertanto, il suono compresso con perdite può perdere parte delle informazioni in cambio di un significativo guadagno di spazio (sia per l’archiviazione che per la trasmissione). La musica compressa con perdita di dati è di qualità inferiore rispetto al file originale? Ovviamente, la domanda è, da che punto non siamo più in grado di distinguere la differenza.
Suono senza perdite
Il suono non compresso traduce i campioni prelevati dall’onda così come sono, come nel caso dei CD audio, senza perdite dal momento in cui è stato digitalizzato.
Sono usciti anche formati audio compressi senza perdita, cioè permettono la compressione in modo che il file occupi meno ma le informazioni contenute non vengano affatto alterate (come se fosse un file.zip) sebbene la compressione che ottengono sia molto inferiore a quella con perdita compressione, stiamo parlando di comprimere l’originale a metà. In questo caso abbiamo formati come ALAC (Apple Lossless Audio Codec) della stessa Apple o FLAC (Free Lossless Audio Codec) di Xiph.org, anche se ce ne sono di più.
Oggi abbiamo dischi in grado di memorizzare molte più informazioni rispetto a 20 anni fa, connessioni molto più veloci, quindi l’utilizzo di formati audio lossless non ha più un costo così elevato per l’utente.
Il file audio non è l’unica cosa importante
Ci siamo concentrati su come memorizziamo i dati e su come raggiungono il nostro giocatore. Ma le nostre orecchie non capiscono gli 1 e gli 0 digitali. Per ascoltare l’audio dobbiamo riconvertirlo in analogico (DAC) e portarlo alle nostre orecchie.
Pertanto, il dispositivo di conversione digitale-analogico svolge un ruolo importante. Se ammorbidisci l’onda, elimini le distorsioni, ecc… genererà un’onda analogica molto migliore, di qualità molto più elevata. Inoltre, il cavo che viaggia alle nostre cuffie o ai nostri altoparlanti, se è schermato per ridurre le interferenze (ricordiamo che una volta nel mondo analogico, siamo completamente esposti) e, soprattutto, la qualità degli altoparlanti stessi.
Possiamo avere un file audio originale, sia analogico che digitale, di qualità molto buona, ma che non è in grado di viaggiare e di essere riprodotto fedelmente attraverso gli altoparlanti, quindi la qualità con cui raggiungerà le nostre orecchie sarà molto peggiore.
Pertanto, il dispositivo del lettore è fondamentale e, soprattutto, gli altoparlanti, più che se la musica arriva in formato analogico o digitale, senza perdita di dati o compressione con perdita di dati. È inutile inserire più dati in un file se il sistema di riproduzione audio non è in grado di riprodurlo fedelmente.
Qual è la qualità audio corretta?
Come abbiamo visto con gli schermi, l’aumento della risoluzione ha reso l’immagine migliore, più fedele alla realtà. Ma arriva un punto in cui non si nota più risoluzione, possiamo aumentarla e la qualità dell’immagine aumenterà, ma non aiuterà.
All’inizio, piccoli aumenti di qualità (risoluzione o frequenza di campionamento) fanno una grande differenza nella percezione dell’ascoltatore, ma man mano che aumenta, ogni volta, la differenza di percezione è minore. Inoltre, teniamo presente che molte apparecchiature audio non hanno una qualità sufficiente per trasferire quel file così com’è all’essere umano.
Nei file audio AAC, passare da 128 kb/s a 256 kb/s è già difficile da distinguere per molte persone, sia per la loro sensibilità e/o abitudine, sia per l’attrezzatura che usano per riprodurre. E continua a salire da qui e vai al suono non compresso, o una frequenza di campionamento più alta o una risoluzione più alta è qualcosa che aumenterà molto la dimensione dei file ma che poche persone, e solo con una buona attrezzatura, noteranno.
Anche se conosciamo già il potere del marketing. Ricordo, quando ero piccolo, quanto erano stupiti gli acquirenti di nuovissimi televisori stereo con questa caratteristica, quando la trasmissione televisiva era in mono.
Ti incoraggio a provare, fare l’esperimento, da un file della massima qualità possibile o da un CD. Prova a comprimerlo con qualità diverse e poi, senza sapere quale sia quale, ascolta per vedere se riesci a notare le differenze. Quella qualità da cui non ti accorgi più nulla, è quella giusta per te.