Tnt village
tntvillage.scambioetico.org · Statuto T.N.T.      Aiuto      Cerca      Utenti      Calendario

Questo sito non utilizza cookies a scopo di tracciamento o di profilazione. L'utilizzo dei cookies ha fini strettamente tecnici.

Sostieni movimentopirati.org

 

  Discussione chiusaInizia nuova discussione

> [GUIDA] Compressione audio, formati audio LOSSY e LOSSLESS
Cer8
  Inviato il: Jan 11 2011, 07:04 PM
Cita questo messaggio


\"100rel\"

Group Icon

Gruppo: Domiciliati
Messaggi: 1256
Utente Nr.: 409258
Iscritto il: 27-January 10



LA COMPRESSIONE AUDIO


Guida a cura di JollyRoger

La compressione audio è una tecnica che permette di ridurre le dimensioni di un file audio o la banda passante richiesta per una trasmissione audio, anche di molto.
Un file è una sequenza di cifre binarie (bit) utilizzata come veicolo di informazione. Comprimere significa ridurre il numero delle cifre che costituiscono la sequenza mantenendo l'informazione in un intorno dell'informazione originaria (ossia facendo in modo che la nuova informazione approssimi quella precedente).
Il compact disc audio è la versione originale dei CD, da cui sono derivati tutti gli altri formati. La struttura fisica del disco ed i protocolli di memorizzazione dei dati è descritta nel Red Book (letteralmente: "libro rosso"), redatto da Sony e Philips nel 1980, anno in cui cominciò la vendita dei CD.
Le specifiche prevedono una capacità standard per un CD Audio di 747 MB, equivalenti, tenendo conto dello spazio occupato per la correzione di errore, a 74 minuti di musica stereofonica campionata a 44,1 kHz.
Su un compact disc il suono è memorizzato in formato digitale: l'andamento della pressione sonora è misurato (campionato) ad intervalli regolari e il valore è descritto da una sequenza di 16 bit. I bit sono incisi sul disco in un'unica traccia lunga oltre 5 Chilometri sotto forma di zone più o meno riflettenti (pits e lands) la luce.
Se si prova a consultare il contenuto di un CD musicale si vedono tanti file con estensione .CDA. Se però si osserva la dimensione di uno di questi file, si nota che sono lunghi pochi byte. I file .CDA non sono esattamente dei file audio, ma contengono soltanto i riferimenti sulla durata della traccia audio vera e propria contenente la codifica digitale del file audio e forniscono al riproduttore audio dei riferimenti per la traccia che si trova sul CD.

I motivi della compressione sono:
  • occupare minor spazio in fase di immagazzinamento
  • impiegare minor tempo in fase di trasferimento dati.
Il costo è l'aumento dei tempi di lettura/scrittura legati rispettivamente a tempi di decompressione/compressione, anche se in realtà al giorno d'oggi esistono diversi software che permettono di comprimere/decomprimere in maniera molto rapida.
Nel caso di file audio si ha un costo anche e soprattutto in termini di qualità dell'audio.

Esistono due tipi di compressione:
  • con perdita (LOSSY): quando l'informazione contenuta nel file compresso è minore di quella contenuta nel file di origine;
  • senza perdita (LOSSLESS): quando l'informazione contenuta nel file compresso è identica a quella contenuta nel file di origine.
La prima permette compressioni maggiori, ma a scapito della qualità sonora.

Analizziamo nel dettaglio i diversi formati.

Formati audio LOSSY (con perdita)


I metodi di compressione lossy in generale tendono a scartare le informazioni inutili, mantenendo solo quelle essenziali.
I formati lossy nascono dall'idea che i suoni, o meglio le frequenze contenute in un brano musicale, non vengono tutte percepite dall'orecchio umano. Si vanno allora a "tagliare le alte frequenze, che si ritiene siano quelle meno distinte dal nostro orecchio. Ovviamente più frequenze si "tagliano" più lo spazio occupato dalla traccia audio diminuisce, e quindi diminuisce anche la qualità del risultato.
La riconversione, partendo dai formati lossy, non permette di riportare la traccia audio al livello di qualità originale. E questo in quanto non consente di ripristinare (almeno non del tutto) le frequenze "tagliate". In realtà esistono software che permettono di ripristinare alcune di queste alte frequenze, ma logicamente più di tanto non è possibile fare.

Ecco un elenco dei codec e dei principali formati musicali lossy:

MP3 (o, più esattamente "MPEG-1/2 Audio Layer 3")
    è un algoritmo di compressione audio in grado di ridurre drasticamente la quantità di dati richiesti per riprodurre un suono, rimanendo comunque una riproduzione fedele del file originale non compresso.
    Alcuni stimano un bitrate a 128 kbps come 'Cd Quality'; in realtà, le frequenze che vengono tagliate per risparmiare spazio sul disco rigido non sono tanto 'inaudibili'. A 192 i risultati cominciano ad essere buoni, e solo a 320 kbps si può parlare di CD Quality.
    Un brano MP3 a 128 kbps occupa uno spazio pari a 1/11 rispetto allo stesso in formato cd audio. Un album di 600 MB in formato wav, andrà ad occupare circa 50 MB in MP3 128 kbps.
    Per convertire una traccia audio in mp3, è bene usare il codec mp3 Lame (gratuito), presente in tutti i migliori programmi di conversione.
WMA (Windows Media Audio)
    è uno standard per file audio inventato dalla Microsoft. Formato di compressione audio molto simile a un MP3. I file compressi in questo formato sono di circa il 20% più piccoli degli MP3.
OGG (Vorbis)
    Vorbis è un algoritmo open source per la compressione audio digitale di tipo lossy, diretta antagonista di altri standard come MP3, VQF, AAC. A parità di qualità percepita, permette una maggiore compressione rispetto al formato MP3, ottenuta mediante avanzate ricerche di psicoacustica.
MPC (MusePack)
    è un formato di compressione audio open source. Presenta molte analogie con lo standard MP3, ma la sua qualità è migliore a parità di bitrate. È noto anche come MPEGplus, MPEG+ o MP+, ..
    Musepack è ottimizzato principalmente per l'encoding con un bitrate di 175-185 kbit/s. Pochissimi miglioramenti sono stati fatti per i bitrate inferiori (come 128 kbit/s). Nonostante tutto, numerosi test hanno verificato una buona resa in tutti i livelli di bitrate.
AAC (Advanced Audio Coding)
    Il formato AAC è un formato di compressione audio creato dal consorzio MPEG (Moving Picture Experts Group) e incluso ufficialmente nell'MPEG-4. L'AAC fornisce una qualità audio superiore al formato MP3 con una codifica più compatta. Attualmente viene utilizzato principalmente da Apple nei suoi prodotti dedicati all'audio (iTunes), difatti Apple usa una variante dell'AAC che gestisce i diritti d'autore per vendere musica attraverso il proprio negozio di musica on-line iTunes Store. Una compressione a 128 Kbps, lo standard di iTunes Store, corrisponde a quella di un MP3 a 192 Kbps a bitrate costante.
    La qualità è estremamente elevata, seppure i tempi di conversione sono un po' più lenti rispetto agli altri formati.
AC3 (Dolby Digital)
    Il Dolby Digital è un sistema di codifica audio multicanale sviluppato da Dolby Laboratories Inc ed utilizzato al cinema, nella TV digitale, nei Laser Disc, DVD ed in altri supporti di riproduzione o tramsissione audio digitale.
    Il Dolby Digital lavora da un minimo di 96 kbps ad un massimo di 640 kbps. Al cinema il Dolby Digital viene utilizzato con appena 320 kbps di banda, poiché stampato nel poco spazio disponibile fra i fori di scorrimento delle pellicole. Generalmente su DVD viene utilizzato con un bitrate di 192 kbps per codificare segnali stereo (2.0, 2.1) o stereo surround, e con un bitrate compreso fra 384 e 448 kbps per i segnali 5.1. Sebbene i decoder in commercio possano lavorare fino a 640 kbps, tale possibilità non è permessa nella codifica Dolby Digital dei DVD-Video, pertanto ad oggi non viene utilizzata.


Formati audio LOSSLESS (senza perdita)


I formati lossless invece cercano di diminuire lo spazio occupato dalla traccia senza andare a toccare il suono; la percentuale di compressione sarà decisamente inferiorerispetto ai lossy, ma non ci sarà perdita di qualità. Se riconvertito partendo dal formato lossless, il suono sarà identico a prima.

Ecco un elenco dei codec e dei principali formati musicali lossless:
WAV o WAVE (WAVE form audio format)
    WAV (o WAVE) è un formato audio sviluppato da Microsoft e IBM per personal computer IBM-compatibile.
    In un brano musicale WAV, la batteria, il pianoforte, la chitarra, il basso o la voce si sentono allo stesso modo indipendentemente dal PC su cui il file viene ascoltato (a parità di qualità acustica dei componenti hardware, naturalmente).
FLAC (Free Lossless Audio Codec)
    è un diffuso codec audio libero di tipo lossless, cioè senza perdita di qualità. A differenza delle codifiche lossy, infatti, come l'ogg vorbis, l'mp3 o l'AAC, la compressione non rimuove informazioni dal flusso audio, ed è quindi adatto sia all'ascolto normale che per l'archiviazione. Il formato FLAC attualmente ha un buon supporto da parte di vari software audio.
    FLAC diversamente dalla maggiorparte degli algoritmi di compressione lossless (come ZIP e gzip, per esempio), raggiunge compressioni importanti, dell'ordine del 30-50%. Gli algoritmi lossless tradizionali raggiungono soltanto un 10-20%.
APE (Monkey Audio)
    Formato no lossy che permette di ridurre di circa il 50% lo spazio occupato dalla nostra musica (in certi casi anche di più) senza alcuna perdita in qualità. In questo modo, un album che in formato wav occupa circa 600 MB, viene ad occupare in media 300 MB.
ALAC (conosciuto anche come Apple Lossless Encoder, ALE, o Apple Lossless Audio Codec)
    è un codec audio sviluppato da Apple Inc. allo scopo di ottenere una compressione lossless. Apple Lossless Encoder memorizza i dati in un contenitore MPEG-4 con estensione .m4a. Non è una variante del AAC, dato che utilizza un metodo di compressione simile a quello utilizzato da altri codec lossless come il FLAC. iPod dotati di un firmware recente sono in grado di riprodurre la musica memorizzata con questo codec. Il codec non prevede una gestione dei diritti digitali (DRM) dato che questi vengono normalmente applicati al contenitore MPEG-4 o al file QuickTime che contiene la musica.
LA (Lossless Audio)
    Il formato no-lossy che comprime di più. La conversione in questo formato è lentissima, però ottiene la migliore compressione in assoluto. E' poco diffuso, dato che probabilmente qualche MB guadagnato sull'ape non vale le lunghe attese in più (e un minor supporto da parte degli altri software).
WV, WVC (Wavpack)
    E' un valido formato di compressione open source, che permette sia risultati lossless, lossy e ibridi. La velocità di compressione è altissima, e il grado di compressione buono (l'album di riferimento occuperà circa 320 MB). Interessante anche il formato ibrido, in cui al file lossy si affianca un altro file, che permetterà di ricostruire interamente il file originale in maniera lossless nel caso lo volessimo ripristinare.


Rip di Cd


Un Cd può venire estratto in tracce singole oppure in un unica traccia. Ci sono casi in cui risulta conveniente estrarre l'intero CD in un unica traccia: ad esempio nel caso di CD live o di mix.
Il file audio che si ottiene (contenente l'intero album, con le tracce "fuse" insieme), è accompagnato da un file particolare, con estensione .cue (cue sheet), che contiene i dati utili alla divisione in tracce per l'ascolto traccia per traccia (con Foobar2000 o Winamp+mp3cue plugin), la masterizzazione in tracce separate o la divisione fisica del file (split) nel suo formato originale, laddove sia possibile.
    Gap e CUE Sheet (file .cue)
Ascoltando un CD nel vostro impianto stereo avrete sicuramente notato che spesso tra una traccia e l'altra il vostro display indica un tempo negativo... proprio in quell'istante state ascoltando l'informazione audio contenuta nel gap. Per intenderci, i gaps sono quelle porzioni di informazione sonora situata tra due tracce consecutive. In realtà, se vogliamo, può anche esserci un gap all’inizio della prima traccia ma tralasciamo questo caso. In italiano si potrebbe tradurre "gap" con "pausa" anche se in realtà il contenuto di un gap può anche non essere necessariamente silenzio.
La memorizzazione della "struttura" del nostro CD può essere è affidata ai files CUE, ovvero semplici files di testo ASCII che contengono delle istruzioni interpretate direttamente dai programmi di masterizzazione.
Vediamo ora un esempio di come si presenta un tipico file CUE:

REM DISCID 950B630D
REM COMMENT "ExactAudioCopy v0.95b4"
PERFORMER "Pearl Jam"
TITLE "Yield"
FILE "01 Brain Of J.wav" WAVE
TRACK 01 AUDIO
TITLE "Brain Of J"
PERFORMER "Pearl Jam"
FLAGS DCP
PREGAP 00:00:50
INDEX 01 00:00:00
FILE "02 Faithfull.wav" WAVE
TRACK 02 AUDIO
TITLE "Faithfull"
PERFORMER "Pearl Jam"
FLAGS DCP
INDEX 01 00:00:00
FILE "03 No Way.wav" WAVE
TRACK 03 AUDIO
TITLE "No Way"
PERFORMER "Pearl Jam"
FLAGS DCP
INDEX 01 00:00:00
.......


Codec


Un codec è un programma o un dispositivo che si occupa di codificare e/o decodificare digitalmente un segnale (tipicamente audio o video) perché possa essere salvato su un supporto di memorizzazione o richiamato per la sua lettura.
Tale programma può essere installabile/aggiornabile (su personal computer o apparecchiature multimediali predisposte) oppure essere integrato in un componente hardware dedicato (ad es. nei lettori CD o DVD casalinghi o in alcune schede video/audio per PC).
Oltre alla digitalizzazione del segnale, i codec effettuano anche una compressione (e/o decompressione in lettura) dei dati ad esso relativi, in modo da poter ridurre lo spazio di memorizzazione occupato a vantaggio della portabilità o della trasmissività del flusso codificato.
I codec si dividono in base alla modalità in cui effettuano la compressione:
* con perdita di informazione (lossy)
* senza perdita di informazione (lossless)
Per realizzare tale compressione si fa ricorso alla riduzione della precisione dei colori dei singoli pixel (codec video) o delle frequenze da riprodurre (in alcuni codec audio vengono soppresse le frequenze non udibili dall'orecchio umano), alla eliminazione delle ridondanze o alla scrittura delle sole differenze (codec video) rispetto ad una immagine di riferimento.
Esistono vari tipi di codec, differenti tra loro per il tipo di segnale su cui devono operare e per l'algoritmo di codifica/compressione in essi implementato.
Nel sistema operativo Windows, i codec sono delle librerie con estensione .dll, che i vari player audio e video gestiscono come dei plug-in. Il codec permette di ascoltare formati proprietari e aperti da qualunque lettore di file, mantenendo separati il livello fisico del formato da quello logico della sua rappresentazione.

Bitrate


I file multimediali sono per loro natura connessi al tempo che scorre. In altri termini ad ogni secondo è associato un certo contenuto informativo e quindi una certa sottosequenza di cifre binarie. Il numero di cifre binarie che compongono queste sottosequenze è detto bitrate. In altre parole il bitrate è il numero di cifre binarie impiegate per immagazzinare un secondo di informazione. Questo può essere costante per tutta la durata del file o variare all'interno di esso. Ad esempio i cd musicali vengono campionati (registrati) ad una frequenza pari a 44.100Hz. Da ciò si evince che ogni secondo si hanno 44.100 valori registrati dall'ipotetico microfono che vanno poi moltiplicati per i 2 canali del suono stereo che vanno a loro volta moltiplicati per 2 poiché la registrazione avviene a 16 bit (pari appunto a 2 byte). Quindi avremo:
44.100 x 2 x 2 x 60 (secondi) = ~10 MB ogni minuto
Il bitrate si esprime in kilobit per secondo (kbps) e in LAME varia da 32kbps (il minimo) a 320kbps (il massimo).
La compressione, diminuendo la lunghezza globale del file, diminuirà di conseguenza la lunghezza media delle sottosequenze ossia diminuirà il bitrate medio. Il bitrate medio diventa dunque in questi casi l'indice dell'entità della compressione. Ad esempio se il file di origine possedesse un bitrate di 1411 Kbps (bitrate dei brani presenti su CD Audio) e il file compresso possedesse un bitrate medio di 320 Kbps, allora avremmo ridotto di un fattore pari a circa 4.5.
Una compressione lossy effettua un compromesso fra la perdita d'informazione e la dimensione del file finale, mentre una lossless deve bilanciare la dimensione del file finale con i tempi di esecuzione dell'algoritmo.

Esistono attualmente 3 tipologie di implementazione del bitrate in mp3 :
CBR - Costant BitRate [bitrate costante] è la modalità più semplice, più usata e ormai meno efficace (tranne nel caso di bitrate massimo, per esigenze di archiviazione e senza badare alle dimensioni file). Il bitrate rimane costante in ogni frame e questo significa che l'encoder utilizzerà sempre la stessa quantità di bit per codificare ogni passaggio musicale. In pratica i passaggi più complessi avranno una qualità inferiore di quelli semplici visto che saranno codificati con un numero sempre uguale di bit, mentre ne servirebbero di più per i passaggi complessi e di meno per quelli semplici. Un grosso vantaggio di questa modalità è che la dimensione del file risultante è sempre proporzionale alla durata del pezzo e facilemente valutabile.
ABR - Average BitRate [bitrate medio] è una modalità che ha una resa superiore al CBR e consiste in una sorta di bitrate "variabile". L'encoder codificherà i passaggi che lo necessitano con più bit e quelli più semplici con meno, cercando di mantenere nell'intero file il bitrate MEDIO impostato. In questo modo la dimensione del file sarà sempre abbastanza prevedibile e proporzionale tuttavia si ha un vantaggio in qualità rispetto a cbr in quanto i bit risparmiati nei passaggi musicali semplici saranno utilizzati per aumentare la risoluzione di quelli più complessi.
VBR - Variable BitRate [bitrate variabile] è una modalità dove c'è un bitrate realmente variabile. Impostando un indice di qualità e un bitrate massimo e minimo l'encoder codificherà ogni frame utilizzando il bitrate più appropriato, quindi per i passaggi musicali via via più complessi verrà utilizzato un bitrate sempre più alto o massimo e per i passaggi musicali più facili verrà utilizzato più basso. Piccolo esempio, i silenzi o i passaggi con poca dinamica verranno codificati con un bitrate inferiori, i passaggi più articolati e difficili con il bitrate massimo etc.


In caso di dubbi o problemi riguardanti la guida, postate pure in quest'area: LINK


Messaggio modificato da mercury il Jul 18 2017, 05:12 PM

Messaggio Privato
Top
Utenti totali che stanno leggendo la discussione: 0 (0 Visitatori e 0 Utenti Anonimi)
Gli utenti registrati sono 0 :
 

Opzioni Discussione Discussione chiusaInizia nuova discussione

 

Scambio etico - ethic share
 Debian powered site  Nginx powered site  Php 5 powered site  MariaDB powered site  xml rss2.0 compliant  no software patents  no software patents