This wiki, on valeriocipriani.com, uses cookies to give you the best experience on our websites. By continuing to use valeriocipriani.com, we assume that you accept our use of cookies.
Read more about cookies.

File video del Computer

From DarkForge's Wiki
Jump to navigation Jump to search

Un file video del computer, è un file che contiene audio e video. I file video sono composti da molti componenti, e questi componenti sono estremamente , il che significa che possono essere facilmente scambiati con altri componenti compatibili lasciando le altri parti del file intatte. Questa pagina vuole spiegare i differenti tipi di componenti accompagnando degli esempi semplici e chiarificatori.

NOTA: Questa pagina contiene dei giudizi soggettivi dell'autore basati sull'esperienza.

Il Contenitore

Il contenitore è la parte del file che tiene tutto insieme. Tu metti tutto insieme dentro il contenitore (Audio, Video, etc...), a livello logico è un po come immagazzinare file differenti in un archivio zip.

I contenitori sono usati per una serie di ragioni:

  • Permettere ai player di avere una visione generale dei contenuti;
  • Permettere l'aggiunta di funzioni addizionali al file, come:
    • Indicizzazione dei segnali;
    • Metadata (informazioni sei segnali contenuti);
    • Possibilità di ripristinare un errore;
    • Capitoli e altre forme di navigazione;
    • Streaming

Diversi tipi di contenitore

AVI

Avi sta per: Audio Video Interleave. Questo è probabilmente il contenitore più usato, per il fatto che può essere riprodotto con quasi tutti i player e su ogni tipo di piattaforma/sistema operativo. E' stato creato dalla Microsoft nel 1992.

l'AVI è stesso descritto come la 'colonna portante' dei contenitori, questo perchè supporta le ultime funzioni ed è il più vecchio e comune contenitore. Alcuni ancora preferiscono questo contenitore rispetto agli altri, questa persona ha spiegato che l'AVI supporta molte delle funzioni che i nuovi contenitori hanno (come MKV e MP4), comunque questo supporto, nell'Avi, non è comune o addirittura scadente. Nonostante questo, se non necessiti delle ultime funzioni che i contenitori più avanzati hanno, AVI dovrebbe essere la tua scelta migliore.

Valutazione: Buono (se tutto quello che vuoi immagazzinare è un xvid+mp3, non c'è motivo per cui dovresti volere un contenitore migliore)

FLV

Flv sta per: Flash Video. E' il contenitore usato dal Flash per il segnale video. Sono in questo formato i video caricati in siti come youtube. Quasi sempre la traccia audio è codificata in MP3 e il video in h263/h263+ o VP6, può probabilmente contenere altri formati, ma non ci sono buoni motivi per farlo. Dato che questo non dovrebbe essere un formato in cui codificare i video (a meno chetu non voglia un video flash), non ci sono valutazioni su questo contenitore.

OGM

Ogm sta per: Ogg Media. Originariamente sviluppato da Tobias Waldvogel per essere usato con lo stupefacente nuovo codec audio (in quegli anni) con il tipico formato video MPEG-4 ASP. COnsiderato da molti un "hack" del contenitore Ogg per essere usto con determinati formati video. Il formato è stato estremamente popolare per un breve periodo dato che permetteva l'uso di capitoli, tracce audio multiple, e sottotitoli soft (softsubs). Lo sviluppatore originario ha lasciato lo sviluppo, che è stato continuato da Xiph Project. Tuttavia la loro posizione è ancora ambigua, e sembra che stiano ignorando il contenitore. Il contenitore perde parte della sua utilità data l'ascesa del contenitore Matroska (MKV), che eguaglia e in alcuni casi fa meglio rispetto all'Ogm ma con molto meno overhead.

Valutazione: Meno funzioni del Matroska, ma con più overhead. A meno che tu non abbia un particolare player che riproduce gli Ogm ma non Mkv o simili, pobabilmente non dovresti usare questo.

MKV

Mkv sta per: Matroska Video. Pobabilmente è il migliore contenitore per riproduzione, puoi fare quasi tutto con questo. Permette l'uso di tutti i formati video con facilità, usare qualsiasi formato audio o sottotitoli, e permette l'uso di funzioni avanzate come l' "encoding vfr", capitoli, e softsubs. Una comune idea sbagliata è che questo contenitore richieda maggiore uso di CPU per essere decodificato, rispetto all'Avi ad esempio. Questo è vero, ma l'uso in più di CPU è talmente minimo che sono praticamente identici. Il Matroska offre meno overhead dopo l'operazione di mux (unire audio e video), questo diminuisce la dimensione del file e permette di codificare con bitrate maggiori l'audio e il video.

L'homepage di questo contenitore è matroska.org, contiene interessanti informazioni e guide per gli utenti interessati all'utilizzo di questo contenitore in particolare.

Valutazione: Uno dei migliori contenitori in circolazione.

MP4

MP4 sta per: MPEG-4 File Format. La prima versione di questo contenitore è stata finalizzata nel 1998 e standardizzato nel 1999. E' stato il primo file formato MP4 sviluppato da MPEG inizialmente destinato per i web video e hardware portatili (come i mobil phone). La versione 1 è stata superata dalla versione 2 subito dopo, alla fine del 1999 (standardizzata nel 2000) ed è totalmente retro compatibile dato che l'MP4 è stato esteso e costantemente sviluppato.

Oltre al supporto degli ultimi standard MPEG, è anche retro compatibile con vecchi formati. Nell'MP$ si può contenere:

Dal punto di vista dell'Audio puoi immagazzinare:

  • SLS (scalable lossless extension to AAC)
  • AMR (tramite .3gp)
  • CELP & TwinVQ (per bassi bitrate/dialoghi)
  • SAOL (MIDI)
  • ALAC (formato Apple Lossless)
  • ALS (formato lossless standardizzato MPEG4)

Ha anche un proprio formtato softsub, testo 3GP. Ultimo ma non per merito, Supporto immagini formato MP4 JPEG & PNG.

L'MP4 ha anche uno spazio dove immagazzinare informazioni sulla traccia, autore etc. Per uso privat odel segnale potresti anche unire (mux) Vorbis, AC3. Questo non è uno standard e non è detto che i player lo supportino. Se vuoi questo tipo di funzioni, è tempo di usare l'MKV. L'MP4 supporta anche i menù.

Alcune domande frequenti sull'MP4: doom9.

Valutazione: Supporta meno formati dell'MKV, ma supporta i più comuni, formati d'uso di massa, e standard ISO che assicurano l'interoperabilità. L'MP4 è supportato commercialmente nei player, ma stranamento il supporto in decoding è tutta un altra questione. Se vuoi una nativo MPEG-4 ASP o H.264 con MP3 o audio AAC, o vuoi effettuare un transmux in file .ts o .mpg, MP4 ti offre questo. Se vuoi qualcosa di più, usa MKV.

MOV

Mov sta per: Quicktime Movie Format. Questo formato è proprietà della Apple. Supporta molte delle cose che l'mp4 fa.

Valutazione: Non usarlo per nessun altra cose che per l'ipod.

La traccia video

Il segnale video contiene i dati per gli attuali fotogrammi che sono riprodotti ("file video" si riferisce sia all'audio che al video, ma "segnale video" si riferisce alla compnente immagini del "file video"). Fondamentalmente consiste in istruzioni su come visualizzare una sequenza di immagini.

Molti formati video hanno limitazioni riguardo a cosa può essere visualizzato. Molte codifiche video danno il meglio quando le dimensioni dei frame sono Mod16.

Encoder video

Una breve introduzione su come funziona un encoder video

I video codec generalmente usano tre tipi di frame differenti: I, P e B-frame.
  • I-frame: (I sta per intra, e significa dentra) sono i keyframe. Sono come dei jpg (anche se l'unica cosa simile è che sono immagini compresse) del particolare frame in questione, e sono fatti per suddividere il video in piccole aree, e come riferimento per altri frame. Questi frame non dipendono da altri frame per essere decodificati.
  • P-frame: sono frame predetti (ecco perchè P frame). Questo vuol dire che sono composti da due parti, la prima è il contenuto originale, quindi come con gli I-frame, parte (non tutto) del frame è immagazzinata come nei jpg. Le altre parti sono da dove l'etichetta 'predetto' entra in gioco - sono prese da precedenti frame. Questa è la parte difficile. Immagina una parte in un frame, e immagina che si muova a sinistra. Bene le il primo frame era un I-frame, puoi creare il secondo come P-frame. Dunque potresti 'dire': "prendi le informazioni dal frame #01 e muovilo tutto di 4 pixel a sinistra. Dopo aggiungi questi nuovi dati a destra". Ora abbiamo un P-frame.
  • B-frame: sono semplicemente un estensione logica dei P-frame, con B intendiamo Bi-direzionali. B-frame sono predetti sia dai frame passati che futuri, e possono mantenere il contenuto originale. Finché non prendi dimestichezza con queste cose prendile per vere.

Piccolo focus sulla Differenza tra Standard e Codec:

Standard sono una serie di specifiche che servono in qualità di descrizioni su come un formato video (o simili) dovrebbe lavorare.
Encoder (o codec) sono implementazioni di uno standard.
Hai capito la differenza? Significa che quando uno standard, come MPEG-4 ASP è prodotto, un numero di gruppi differenti producono i loro encoder, come DivX e XviD. Si, stai leggendo bene. Una codifica DivX produrrà un file che potrà essere riprodotto dalo stesso decoder che è richiesto per il XviD. La vita reale non è mai cosi bella, e differenti encoder useranno funzioni differenti, cambiando molto dallo standard, e questo potrebbe causare un incompatibilità tra i vari codec. Un esempio pratico:
  • Quicktime h264 usa solo le funzioni base definite dall'MPEG-4 AVC. Un encoder come x264 le usa tutte. Questo differenze sono alla base della superiorità di un codec rispetto ad un altro, anche in termini di compatibilità.

MPEG

Da molto questo è il gruppo più comune di standard per i formati video, sono questi pubblicati da lgruppo MPEG (Motion Pictures Experts Group). Alcuni formati sono elencati qui sotto.

MPEG-1

Probabilmente il più vecchio tra gli standard video che ancora esiste. Creato per salvare i video sui CD (VCD) ed altri apparecchi. L'uso più comune è a 352x240 @ 1.5mbits/sec, che è chiamata anche "Qualità VHS"

MPEG-2

Concepito per avere una qualità superiore dell'MPEG-1, ma a più alti bitrate. In altre parole, se si guarda per bitarate sotto 1.5mbits, ci sarebbe una minima differenza, ma per altri bitrate più alti, l'MPEG-2 darebbe sicuramente qualità migliori. Questo formato è quello usato nei DVD, SVCD e KVCD. Interessante anche per essere uno dei pochi formati video in cui uno spazio colore diverso da YV12 è visto allo stato originale, l'MPEG2 a volte utilizza YUY2.

MPEG-4 SP

SP sta per Simple Profile.
Un ritaglio della versione MPEG-4 ASP descritta qui di seguito. Rimuove molte delle più belle funzioni e inoltre ora è quasi obsoleta. Alcune nome celebri tra gli encoder sono Sorenson (usato in QuickTime) e 3ivx. Microsft ha provato a produrre un'implementazione di questo codec (come Microsoft Video V1/V2) ma non furono conformi e furono quasi ignorate del tutto.

MPEG-4 ASP

ASP sta per Advanced Simple Profile.
Da molto è il formato più comune e usato per filmati e animazioni. Le due più grandi implementazioni sono DivX e XviD. Le richieste di CPU per questi codec sono basse in confronto ai pc ora in circolazione, e la qualità di prodotto è ancora ragionevole.

Implmentazioni comuni:

  • XviD: La migliore implementazione in circolo, e probabilmente migliore delle altre versioni commerciali. Praticamente supporta tutte le cose delle specifiche ASP. Decisamente è il migliore tra questi.
  • DivX: Spesso usato dai principianti che si avvicinano alla codifica, ma generalmente XviD è molto migliore a livello di risultati. Ricorda che il player che integrano nel pacchetto NON serve a nulla, è solo una sorta di specchio per le allodole.
  • LMP4: Forma contratta di Libavcodec MP4, un encoder simile a XviD, ma la qualità è inferiore. Implementato in mencoder e in alcune altre parti.

MPEG-4 AVC

AVC sta per Advanced Video Coding.
Wikipedia ha un interessante articolo sull'MPEG4-AVC in inglese (completo) e in italiano (parziale), codec detto anche h264, oppure AVC. E il successore dell'MPEG4-ASP. Fornisce notevoli miglioramenti nella compressione (un opzione singola può portare a un aumento dell'efficienza del 20%).

Implementazioni comuni:

  • x264: Molto simile all'XviD - è l'unico encoder di questo standard ad essere Open Source, ed è superiore agli altri encoder commerciali della sua categoria. L'x264 supporta molte delle opzioni di profilo alto (vedi la pagina Wikipedia per associare le funzioni con il relativo livello di profilo QUI). L'encoder per eccellenza di alta qualità per uso personale, anche perchè è l'unico encoder CLI ad essere stato reso disponibile al pubblico, e da non dimenticare ciò che detto in precedenza, supporta la maggior parte degli aspetti dello standard e codifica nel miglior modo in termini di qualità. Questa è la sua homepage: x264.nl, cerca MeGUI, queste sono le wiki per usare il programma GUI per codificare.
  • Nero AVC: Il secondo miglior codec pubblicamente disponibile. Ha meno della metà delle opzioni dell'x264, ma include una bella interfaccia grafica che aiuta gli utenti alle prime armi a fare le scelte giuste, anche se il prodotto finale è inferiore a quello ottenuto con l'x264. E' parte della Nero Suite, questa è la homepage: nero.com
  • Apple h264 Il peggiore tra questi, anche se rimane un po meglio dell'XviD. Maggiori informazioni sui profili usati Qui (inglese). Homepage: apple.com/quicktime

h26_

Il set di specifiche video sviluppate dall'istituto di standard ITU-T.

h263

Fondamentalmente un sottogruppo dell'MPEG-4 ASP. Spesso lo si trova nel contenitore .3gp per telefoni mobili.

h263+

h263 con alcune aggiunte più varie. Alcune delle aggiunte non sono compatibili con l'MPEG4-ASP. Questo vuol dire che l'h263+ è più raro dell'h263, lo si trova in software proprietari, e in alcuni telefoni mobili (contenitori .3gp).

h264

Un altro nome per dire MPEG-4 AVC.

Snow

Un codec 'sperimentale' che usa un metodo di immagazzinamento del video totalmente diverso dagli altri. La qualità probabilmente si aggira intorno a quella dell'xvid. Apparentemente c'è un alto potenziale dietro questo tipo di compressione - un ex sviluppatore dell'x264 che adesso sviluppa questo codec sostiene che farà strada.

Un ultimo aspetto molto interessante è che dato che i dati sono immagazzinati differentemente rispetto agli altri, anche gli artefatti che si verificano quando l'encoder riduce la qualità sono totalmente diversi.

La discussione riguardo a questo in doom9 (topic inattivo e in inglese)

Theora

Un codec gratuito che fu creato quando fu rilasciato il codice sorgente del VP3 da On2 e lo rese disponibile per utilizzi liberi. Lo sviluppo è abbastanza lento, vicino all'essere fermo. Il più grande vantaggio di questo formato è che è completamente gratuito per ogni tipo di utilizzo. Lo svantaggio è che la qualità comparata con gli ultimi codec è inferiore e inoltre gli unici player in windows che lo leggono sono ffdshow / VLC / mplayer. Complessivamente si colloca nella stessa posizione del VP3, che si piazza leggermente sopra l'MPEG-1 ma di molto sotto gli ultimi codec come l'MPEG-4 AVC o il VC-1

On2

On2 è una compagnia che fa specifiche e codec video e le sviluppa. Dato che sono una compagnia privata, le specifiche che fanno sono private e chiuse al pubblico. Hanno tre video codec.

Sito ufficiale

VP3

Vecchio, raro, praticamente non usato. Era basato sul codec Theora, e la qualità è simile a quella dell'MPEG-1.

VP6

Il codec successivo al VP3, che è diventato uno dei codec ufficiali del formato Video Flash (.flv), e che può essere decodificato dal Flash. E' usato, anche se invece la maggiorparte degli utenti ha usato h263. Adesso che l'MPEG-4 AVC è un formato supportato dai Video Flash, questo sparirà lentamente.

Sito ufficiale

VP7

L'ultimo codec di On2, loro sostengono che la qualità ottenuta è simile a quella dell'MPEG-4 AVC e del VC-1. Nessuno si è mai interessato a questo codec da testarlo e fare paragoni. C'è un encoder/decoder gratuito nel loro sito.

Sito ufficiale

WMV

Il gruppo di codec Windows Media Video, sviluppato da Microsoft. Leggi l'articolo su Wikipedia (inglese) per maggiori informazioni sui vari formati (incluso VC-1) che ha formato la famiglia dei WMV. Generalmente gli unici encoder er tutti questi standard sono quelli ufficiali Microsoft.

MS MPEG, Microsoft Video, etc

Una varietà di modifiche datate alle specifiche dell'MPEG ufficiale (maggiormente), che esistette da prima che il nome WMV nacque. Ormai non si vede in giro, ma ci sono encoder VfW per windows ancora in circolazione. Alcuni nomi di codec: Microsoft H.261/3 Video Codec, Microsoft Video 1/2, MS MPEG Video 1/2 (probabilmente uguale a quello prima).

WMV7/8/9

Il primo codec video della Microsoft arrivo intorno al 2000. Questi sono i codec usati nei file .wmv, quindi relativamente comuni. La qualità è comunque inferiore alle alternative (vedi: xvid & x264). La qualità è abbastanza scadente ma c'è da dire che dove c'è windows come OS, c'è un decoder per vederlo, e c'è un supporto playback in Linux, ad esempio tramite libavcodec.

VC-1

Un estensione del WMV9 che ha aggiunto alcune funzioni per il mondo della video diffusione (in altre parole, encoding pienamente interlacciato (WMV9 supporta solo l'interlacciato nel formato colori 4:1:1)). Dicono che la qualità è simile a quella dell'MPEG-4 AVC, ma si è dimostrato non vero. VC-1 è effettivamente un derivato delle funzioni AVC (ma totalmente incompatibile con questo), ed è priva di molte tecniche buone di encoding. Molti test hanno situato la qualità al pari o migliore dell'xvid, che è ben al di sotto dell'h264 trovato su dischi HD DVD e Blu-Ray.

La traccia audio

Il segnale/i audio contengono i dati audio del file video. I formati audio sono simili ai formati video in termini di standard ed encoder, quindi leggi il focus nel paragrafo dell'Encoder video per capire la differenza tra Standard ed Encoder.

Codec audio

Ecco una lista di codec audio:

MPEG-1 Layer 2 & 3

Entrambi sono formati lossy:

Layer 2: AKA MP2. Abbastanza raro, forse perchè le persone pensano che non sia meglio dell'MP3. Invece, (articolo in inglese su Wikipedia) per bitarete superiori a 256kbits la qualità del suono è migliore.

Codificato con TooLAME (toolame.sourceforge.net) o ffmpeg.

Layer 3: Conosciuto come MP3, è l'.avi dei formati audio - può essere riprodotto con qualsiasi cosa. La qualità audio è abbastanza scadente rispetto agli altri formati, ma dato che le dimensioni dei file sono ridotte, le persone sono felici di aumentare un po il bitrate per recuperare parzialmente la perdita. Codificato con LAME (LAME Ain't an MP3 Encoder - si hai letto bene, significa Lame non è un encoder mp3, esaustiva spiegazione). Usalo ignorando che Lame sia un encoder mp3 e lo userai onorevolmente).

Sito ufficiale: lame.sourceforge.net.
Download: rarewares.org/mp3.

AAC

AAC sta per Advanced Audio Coding il che significa MPEG-4 Part 3 e anche MPEG-2 Part 7 (quindi una serie di nomi). Consulta la pagina della wikipedia (inglese) per saperne di più. L'AAC è un codec lossy come l'MP3 ma la sua qualità è superiore, e probabilmente la migliore in generale rispetto agli altri codec.

Ci sono alcuni profili differenti con i quali puoi codificare:

  • Main: La versione 'normale' dell'AAC, ma nessuno la implementa quindi la puoi Ignorare.
  • LC (Low Complexity): La vera versione normale e più comune degli ACC è questa.
  • HE (High Efficiency): Quando inizi a codificare a bitrate inferiori a 64-96kbits (in stereo) (la regola comune, anche se Nero lo fa intorno a 75-80kbits), puoi iniziare ad usare il profilo HE, che aumenterà la qualità audio a questi bitrate. L'HE codifica la seconda metà (la metà alta) dello spettro di frequenza con una tecnica chiamata Spectral Band Replication (SBR). Fondamentalmente la codifica differentemente rispetto alla metà bassa, anziche normalmente come un segmento separato. L'efficienza massima è aumentata, ma diminuisce la qualità massima.
  • HEv2 (High Effiency version 2): Se si riduce il bitrate maggiornamente (intorno a 40kbits), puoi iniziare ad usare l'HEv2, che anche in questo caso vi garantirà maggiore qualità a questi bitrate. Viene introdotta un'altra tecnica di encoding chiamata Parametric Stereo (PS). Invece che codificare ogni canale separatamente, PS codifica un canale 'principale', e codifica gli altri canali come differenze da questo. Ancora una volta, massima efficienza aumentata ma massima qualità ridotta.
  • LTP (Long Term Prediction): Un'altra tecnica magica di compressione che è particolarmente utile per la voce (o qualsiasi cosa abbia suoni ripetuti). Come per il primo profilo non è usato, ed è buona cosa ignorarla.

Il supporto dei profili sopra elencati degli encode & decoder AAC varia. Generalmente potrai fare affidamento sul supporto LC, ma non sul HE e HEv2 me sono spesso ignorati. I decoder per computer dovrebbero supportarli tutti e tre (LC, HE, HEv2), ma le cose possono cambiare. Ad esempio, gli apparecchi apple riproducono solo gli LC. D'altra parte, l'AAC implementa il 'grazioso degrado', il che significa che se un decoder tenta di riprodurre un file codificato con un profilo non supportato, qualcosa dovrebbe uscire:

  • Contenuto HE decodificato da un decoder LC: sentirai solo la parte bassa (50%) dello spettro di frequenza.
  • Contenuto HEv2 decodificato da un decoder LC: sentirai solo un canale.

L'AAC può essere creato con alcuni strumenti. Anche se non lo dicono, molti dei programmi disponibili usano questi strumenti sotto elencati:

  • Nero Digital Audio: Rilasciato nel maggio 2006, supporta i seguenti profili LC/HE/HEv2, gratuito, fantastica qualità in uscita, CLI. cosa vuoi di più? Sito ufficiale: nero.com/enu/nero-aac-codec.html
  • Coding Technology AAC Encoder: Spesso chiamata 'CT AAC' o simili. Molte persone preferiscono in qualità questo codec rispetto a quello della Nero, ma nessun test è stato ancora fatto.
  • FAAC: Free AAC Codec. Inferiore di qualità rispetto agli altri sopra, ma è l'unico codec ACC Open Source. Una volta molto usato, ora non più. Supporta il profilo Main e LTP dell'encoding ACC... Download: rarewares.org/aac.htm

Vorbis

Un codec audio completamente gratuito lossy che si avvicina di molto alla qualità dell'AAC (alcuni sostengono che l'ha superata). Generalmente ci si riferisce a questo codec come Ogg Vorbis, ma noi ci riferiamo al codec da solo, Vorbis, dato che potrebbe essere usato anche in altri formati (e non solo .ogg, anche se spesso è questo il cotenitore più usato). Il Vorbis è curato dall'organizzazione Xiph insieme ad altri strani codec, nessuno dei quali è comune.

AC3

Implementazione dello standard ATSC A/52 della Dolby Studios. Il Dolby Digital AC3 (articolo nelle wiki (inglese)) è un codec audio "lossy" (il che vuol dire che nella codifica si perde qualità), intorno al quale hanno creato una serie di altri codec. E' il formato audio standard dei DVD, e anche di molte tv digitali. Dato che la maggiorparte di fonti sono con audio AC3, il che vuol dire che è la massima qualità a cui possiamo aspirare. Comparato con gli altri codec "lossy", è abbastanza inefficiente ed è uno spreco di spazio. Il massimo bitrate è 640kbits ed il limite a 5 canali.

DD+ (EAC3)

Dolby Digital Plus, o Extended AC3. E' una reincarnazione dell'AC3 per un uso con l'alta definizione. Lo si trova sia sugli HD DVD che sui Blu-ray. E' stata aumentata l'efficienza in compressione, ma dato che il massimo bitrate del segnale è stato aumentato oltre 6mbit (anziché 640kbit) si può ottenere comunque facilmente ottenere qualità lossless. Supporta 13 canali. Articolo in Wikipedia (inglese).

TrueHD

La Dolby mira ad un codec audio lossless di nuova generazione, il supporto di questo è obbligatio per l'HD DVD (che ormai sembra aver perso la corsa) ma opzionale per i Blu-Ray (che sembrano avere il predominio). Supporta 14 canali, 192kHz di frequenza di campionamento e 24bit profondità. E' limitato rispettivamente a 8/96/24 nel formato della prossima generazione di dischi. I bitrate sono eccessivamente elevati, arrivando fino a 18mbits, anche se per un uso normale, non verranno mai superati i 6mbit. Articolo su Wikipedia (inglese).

DTS

DTS sta per Digital Theater Systems, ed è un codec audio con bitrate estremamente elevati che raramente si trova in circolazione. Il DTS è un codec ufficiale che può essere usato nei DVD standard, comunque non è detto che l'audio DTS sia supportato e quindi decodificato da tutti i player. Sia HD DVD che Blu-Ray hanno il supporto per questo formato. Ha due tipologie: huge (768 kbps) e ginormous (1,536 kbps). Attualmente comparare questo codec con l'AC3 è difficile, in quanto sono differenti. Articolo sulle Wikipedia (inglese).

DTS ES

DTS Extended Surround. Fondamentalmente simile al DTS, semplicemente con un canale in più. Il canale aggiunto è un secondo canale 'centrale'. Ha due variabili o "profili" ma entrambi sono abbastanza rari. Il primo è chiamato Matrix, e in questo il canale aggiuntivo è modulato all'interno degli altri canali (ricordate il dolby pro logic? stessa cosa). E il secondo profilo è il Discrete, il canale aggiunto come un canale separato, totalmente distinto dagli altri. Entrambi sono retro compatibili. Articolo su Wikipedia (inglese).

DTS-HD MA

DTS High Definition Master Audio. E' una versione aggiornata del DTS ES che è anche lossless. E' molto simile al DTS ES, c'è all'interno una normale traccia DTS all'interno che è riprodotta nel caso in cui il decoder non lo supporta. 'Questa' è la versione lossless, che supporta 8 canali, 96kHz di frequenza di campionamento e 24bit di profondità. Il bitrate di qeusto formato arriva fino a 25mbit. Il supporto di decodifica è opzionale sia negli HD DVD che nei Blu-Ray, quindi c'è un'ottima possibilità che questo formato non vedrà mai la luce. Articolo su Wikipedia (inglese)

DTS-HD HR

DTS High Definition High Resolution. E' stato realizzato nel momento in cui la società produttrice ha realizzato che nessuno avrebbe supportato il DTS-HD MA. Questo formato supporta 8 canali con frequnza di campionamento a 96 kHz e 24bit di profondità. Sembra un codec simile a quello sopra! E' semplicemente NON lossless. E che differenza fa? Circa 19mbits. Il bitrate ora si riavvicina al sano 6mbits. Articolo su Wikipedia

Flac

FLAC sta per Free Lossless Audio Codec ed è un formato file per la compressione dati audio lossless sviluppato inizialmente da Josh Coalson.
Ha il suppoto dei tag, cover art e fast seeking. E' free, open source e la sua natura lo rende supportato da diverse applicazioni, ma il supporto in riproduzione di Flac sui supporti audio portatili e su sistemi audio dedicati è ad oggi molto limitato. Flac esegue una compressione senza sacrificare l'integrità della sorgente. Una sorgente codificata in questo codec, può essere decompressa recuperando la qualità iniziale. Ogni fonte audio codificata con questo codec vede una riduzione della dimensione del 40-50% (46% da quello che dicono loro).

Atrac

ATRAC sta per Adaptive Transform Acoustic Coding ed è una famiglia di algoritmi di compressione audio di proprietà della sony che fu inizialmente lanciata con i Minidisc nel lontano 1992. Ufficialmente la sony afferma che il codec ATRAC3plus a 64 kbit/s fornisce una qualità comparabile ad un mp3 a 128 kbit/s, il che posiziona questo codec nello stesso gruppo dell'AACplus, mp3PRO e Windows Media Audio

I sottotitoli

In questo caso con "Sottotitoli" ci riferiamo ai softsubs. Sono dei sottotitoli sovrapposti al video durante le riproduzione, in totale opposizione agli hardsubs che sono codificati direttamente dentro il video. I Softsubs hanno diversi vantaggi (sono elencati solo i principali):

  • Puoi avere più di un segnale di sottotitolo, ergo sottotitoli multipli(lingue differenti, stili differenti);
  • I sottotitoli si possono attivare e disattivare;
  • Il video non intergisce con i sottotitoli, permettendo una qualità di compressione maggiore.

Tipologie di sottotitoli

SRT

SubRipText. E' un formato di sottotitoli sottoforma di testo base. Permette di colorare con esadecimali, il grassetto e il corsivo. Si tratta di un formato molto "scarno", permette all'utente di selezionare il font, dimensione del font, oppure sovrascrivere il colore del font/schema durante la riproduzione, supponendo che il VSFilter è usato èer riprodurre i sottotitoli.

Esempio di codice (Articolo su wikipedia (inglese)):

1
00:00:20,000 --> 00:00:24,400
In connection with a dramatic increase
in crime in certain neighbourhoods,

SSA

SubStation Alpha. Un formato un po' datato che fu sviluppato data la necessità di un formato di sottotitoli digitale più performante, era usato in maniera "massiccia" dagli amanti dei sottotitoli. Lo sviluppo dell'SSAv4 finì diversi anni fa con la sparizione dello sviluppatore, e fu sostituito dall'ASS (SSAv4+). Permette una serie di belle funzionalità:

  • Definire grassetto, corsivo, tipo del font, dimensione del font, colore del font, tipologia di codifica del font, allineamento (posizionamento molto semplice) del testo.
  • Gli stili sono usati per raggruppare insieme le linee di testo e mantenere gli stessi "stili". Si specificano tutti i parametri sopra elencati e anche larghezza del campo, profondità d'ombra, schema/colore ombra, e margini.
  • Effetti base di karaoke.
  • E' possibile stabilire per ogni linea "il tempo" (inteso come posizionamento nel tempo)e posizionamento, possone essere mostrate linee multiple di testo.

Esempio di stile e codice:

Style: Default,Arial,40,16777215,16777215,16777215,-2147483640,-1,0,1,1,1,2,30,30,25,0,0
Dialogue: Marked=0,0:25:50.40,0:25:53.06,*Default,Comment,0000,0000,0000,,Kakarrot-o!!

ASS

AdvancedSubStation Alpha, che chiameremo SSAv4+. Molte persone non realizzano le differenze tra SSA e ASS perchè lo stesso filtro, TextSub/VSFilter, è stato il primo renderer del formato. Cioé, sostituire parte di codice ASS con codice SSA può essere possibile se renderizzati da TextSub/VSFilter. Questo tra le altre cose ha provocato un confusione tra i due formati. Le documentazioni relative all'SSA e all'ASS sono disponibili in questo sito. Gli amanti dei sottotitoli volevano questo formato poichè necessitavano di un formato più performante, e questo SSAv4+ fu proposto e in seguito fu noto come ASS. Di seguito le migliorie apportate al fomrato rispetto all'SSA:

  • Si può definire sottolineature al testo, barrato, larghezza del bordo e profondità dell'ombra (disponibile solo nello stile), bordi sfocati, scalatura del font in altezza e larghezza, definire la spaziaturatra le lettere,rotazione del testo, schema e colore dell'ombra (disponibile solo nello stile), e trasparenza alpha.
  • Assortimenti vari di funzioni che permette ai font trasformazioni di stile nel tempo, o cambi di codice, test animato, posizionamento al pixel, definizione dell'origine del testo, e dissolvenza.
  • Karaoke rimosso
  • Stili aggiornati per le nuove opzioni

Ci sono anche altre parti della documentazione SSA/ASS che non sono mai state implementate nel VobSub/VSFilter. L'unico che merita veramente una nota sono le immagini integrate che permetterebbe di passare le barriere dei sottotitoli basati su immagini e testo in un unico formato. Sembra che mai verrà il giorno.

Esempio di stile e codice:

Style: Batou,Century Gothic,28,&H00C0C0C0,&H00000000,&H00000000,&H7F000000,0,0,0,0,100,100,0,0,1,1,1,2,10,10,10,0
Dialogue: 0,0:13:00.11,0:13:03.77,Batou,,0000,0000,0000,,Both our faces aren't meant for mirrors.

VobSub

Il nome deriva direttamente dalla sorgente dei sottotitoli, VobSub è il nome del formato dei sottotitoli bitmap dopo che sono estratti dal VOB, Video Object file, del DVD. L'applicazione che estrae i sottotitoli era chiamata VobSub (adesso chiamato VSRip) sviluppato da Gabest. VobSubs consiste in un file .idx (l'indice dell'inizio dei tempi, colori, e altre informazioni base) e un file .sub (che contiene le immagini bitmap per i sottotitoli stessi). Diversamente da SRT, SSA, ASS, e TTXT che sono basate sul Testo, il formato VobSubs è bastato sulle immagini e quindi qualcosa di più grande.

Esempio di indice e bitmap:

timestamp: 00:18:40:752, filepos: 0000aa000
Raw picture of a bitmap in a VobSub

TTXT

MPEG-4 Timed Text. Basato sul formato creato da 3GPP (in questo caso sono ugiali). Assomiglia alla struttura XML. Interessante è il fatto che sembra che sia necessario definire righe ad ogni tempo, il che vuol dire che quando non ci sono sottotitoli, deve essere definita una linea vuota.

Esempio:

<TextSample sampleTime="00:03:35.980" xml:space="preserve">Please excuse me.</TextSample>

Informazioni addizionali

Alcuni tra i più avanzati contenitori possono immagazzinare cose extra, come file dei capitoli, font incorporati e simili. Leggi di seguito per saperne di più a riguardo.

Allegati

Matroska (.mkv), eseendo un contenitore molto prestante, permette di includere ogni tipo di file come allegato; file di testo, uno zip con la colonna sonora, o una cover. Con l'uso dell'"Haali's splitter" (lo splitter per eccellenza del Matroska per il DirectShow) puoi visualizzare file allegati nella finestra dell'explorer ed estrarli.

Font incorporati
Disponibile solo con i file Matroska. Quando si esegue il muxing dei sottotitoli SSA/ASS, a volte si usano dei font particolari, che magari non tutti i computer hanno caricati, se aggiungi i font allegati nel file Matroska, VSFilter (il render dei sottotitoli per il DirectShow) sarà capace di andarsi a prendere questi fonti e visualizzare correttamente i sottotitoli.

Inserire i capitoli

Divisione del filmato: I capitoli

Facciamo un esempio esplicativo, differenti formati usano differenti stili di divisione dei capitoli: ecco un esempio dell'ordinazione dei capitoli per Matroska:

<Chapters>
 <EditionEntry>
   <EditionUID>1</EditionUID>
   <EditionFlagHidden>1</EditionFlagHidden>
   <EditionFlagDefault>0</EditionFlagDefault>
   <ChapterAtom>
     <ChapterUID>1</ChapterUID>
     <ChapterFlagHidden>0</ChapterFlagHidden>
     <ChapterFlagEnabled>1</ChapterFlagEnabled>
     <ChapterDisplay>
       <ChapterString>Part A</ChapterString>
       <ChapterLanguage>eng</ChapterLanguage>
     </ChapterDisplay>
     <ChapterTimeStart>00:00:00.000000000</ChapterTimeStart>
   </ChapterAtom>
   <ChapterAtom>
     <ChapterUID>2</ChapterUID>
     <ChapterFlagHidden>0</ChapterFlagHidden>
     <ChapterFlagEnabled>1</ChapterFlagEnabled>
     <ChapterDisplay>
       <ChapterString>Part B</ChapterString>
       <ChapterLanguage>eng</ChapterLanguage>
     </ChapterDisplay>
     <ChapterTimeStart>00:09:48.000000000</ChapterTimeStart>
   </ChapterAtom>
 </EditionEntry>

E qui un esempio dei capitoli in base al formato OGG:

CHAPTER01=00:00:00.000
CHAPTER01NAME=Chapter 1


La logica Matroska anche se in primo luogo complicata è sicuramente ricca di possibilità di espressione, uno strumento completo. Per la spiegazione completa della logica dei capitoli, semplici e innestati, si rimanda direttamente al sito ufficiale: matroska.org