DLP 4K vobulato: come funziona?
Perché questa macchina ha fatto tanto rumore? Beh, semplice, l’abbiamo detto: perché segna l’ingresso della nuova matrice 4K di Texas, inserita su un proiettore che impiega il laser come sorgente. Quindi siamo in presenza di una matrice 3840 x 2160 con un laser, esattamente come il JVC DLA-Z1, di cui questo Optoma diventa diretto concorrente, ovvero abbiamo un match D-ILA vs. DLP? Ma come mai uno costa 35.000 Euro e l’altro solo 5.000 Euro (l’Optoma) se sono praticamente uguali? Calma, calma, non corriamo… La matrice che si trova su questo DLP è costituita da 2716 x 1528 DMD, che “vobulano” (termine orrendo che non fa capire un accidente di cosa si tratti – anzi, sembra una maliziosa allusione a pixel che facciano ben altro – ma che fa molto tecnologico per cui tutti lo impiegano senza addentrarsi nel minimo dettaglio). Sono andato a cercare una spiegazione che potesse introdurre un concetto in italiano senza farlo sembrare ostrogoto: ho la sensazione che a nessuno sia noto quanto fa Texas e che quasi tutti facciano finta di capire, ma che in realtà quello che avviene non sia chiaro per nulla.
L’unica cosa sulla quale tutti sono accordo è la velocità alla quale avvengono le operazioni di questo DMD: la frequenza operativa è di 120 Hz (da non confondere con la cadenza di visualizzazione: a quello ci pensa l’ASIC di controllo), il che permette di presentare due frames diversi ogni 1/120 di secondo, ossia un frame completo ogni sessantesimo di secondo, riuscendo quindi a pilotare display a risoluzione UHD @ 60 Hz, per usare una simbologia nota. Il DMD di cui stiamo parlando si chiama DLP660TE 0.66 4K UHD, e le specifiche le trovate sul sito della Texas. Non vi traduco, per lasciare proprio la parola alla casa madre, come viene descritto:
– 0.66-inch diagonal micromirror array
– Displays 4K Ultra High Definition (UHD) 3840 x 2160 pixels on the screen
– 5.4 micron micromirror pitch
– ±17° micromirror tilt (relative to flat surface)
– Bottom illumination
Attenzione al fatto che TI dice che “presenta 3840 x 2160 pixel sullo schermo”, non che li abbia realmente. Questa è una sottigliezza non da poco, perché per capire ci vuole un po’ di analisi.
Cerchiamo di leggere prima cosa dice (poco, in realtà) il costruttore. Ho trovato questa sorta di spiegazione sul forum della Texas, dove la persona che scrive (stavolta traduco) si chiama Anshul Jain e dice più o meno questo:
“2716 x 1528 DMD con un attuatore ottico a due posizioni realizzano 8.3 milioni di pixels (2716 x 1528 x 2 = 8.300.096), che pareggia lo standard richiesto per classificare I display 4K (8.3 Mpixel, appunto) secondo la Consumer Technology Association (CTA). La risoluzione del DMD è di 2716 x 1528 e due frame da 2716 x 1528 l’uno vengono proiettati in sequenza due volte all’interno di un singolo frame di ingresso, ossia se l’ingresso è a 60 Hz, vengono riprodotti 2 frame da 2716 x 1528 a 120 Hz. Vengono riprodotti sequenzialmente a due volte la frequenza di ingresso due pixel distinti ed unici nel dominio del tempo. Il chip TI prende la sorgente di ingresso 4K (3840 x 2160) e la processa attraverso gli algoritmi video per creare due frame da 2716 x 1528. Questi due frame vengono mostrati in sequenza temporale in un frame singolo, e le posizioni dei pixel si sovrappongono tra i due frame, e questo effetto di sovrapposizione è mitigato dalla velocità del DLP. La differenza con JVC sta nel fatto che questi usano 1920 x 1080 x 2 posizioni, ossia 4.15 Mpixel, mentre DLP usa 2716 x 1528 x 2 posizioni, quindi 8.3 Mpixel effettivi. I procedimenti sono quindi simili, sono che è la quantità di pixel impiegata a fare la differenza in senso numerico”.
Avete capito? Io onestamente non molto. Ad aumentare la confusione si inserisce un altro esponente Texas, che chiosa: “Our implementation lifts from the well established field of Super-resolution Imaging and other proprietary algorithms to move past the limitations of the DMD resolution”.
Quello che ho capito di sicuro è che nessuno in TI dice che la matrice E’ di 3840 x 2160 pixel, ma solo che IL NUMERO COMPLESSIVO dei pixel uguaglia gli 8.3 milioni necessari per parlare di UHD e per poter processare, attenzione, un SEGNALE DI INGRESSO 3840 x 2160 sulla matrice TI (che, ancora una volta, è di 2716 x 1528 pixel). E quindi come fanno? Come dice Nicola D’Agostino, ci sono due “correnti di pensiero”, una che dice che ogni singolo pixel venga spostato in orizzontale, un’altra in diagonale.
Partiamo dalla prima ipotesi: se i pixel vengono spostati LATERALMENTE, si ottiene una matrice da 5432 x 1528: guardate che se li moltiplicate ottenete sempre 8.300.096 pixel, come nel conto che abbiamo letto prima e non ci sono “buchi” di pixel. Lo stesso conto con una matrice UHD fa 3840 x 2160 = 8.294.000, quindi è rispettato il valore complessivo. Ma manca la risoluzione orizzontale, che è scesa da 2160 a 1528…Quindi lo spostamento dovrebbe condurre ad una situazione come questa, in cui l’attuatore sposta il blocco dei pixel verso destra.
Dalla figura non si capisce benissimo, ma dovrebbe risultare abbastanza chiaro che se “sposto” lateralmente la stessa matrice di una posizione, ottengo, sempre in 1/60 di secondo, una immagine complessiva che è composta da 5432 x 1528 pixel, ossia con un eccesso di risoluzione verticale (5432 > 3840) ed una mancanza della orizzontale (1528 < 2160). In altri termini, dopo anni, siamo tornati alla generazione di un quadro tramite due semiquadri interlacciati, ossia… abbiamo reinventato il CRT! Ho parlato con Emidio Frattaroli (direttore di AVMagazine.it), che ha avuto in prova il BenQ W11000 nel quale è possibile “spegnere” il meccanismo di vobulazione per vedere come sia fatto il chip. Bene, Emidio è certo che si tratti del chip di ultima generazione, ossia messo nella naturale disposizione orizzontale. Dato che ne è certo, non ho motivi per dubitarne, ma i dubbi, come vi dirò a breve, mi sono rimasti.
A questo punto la domanda è lecita: ma perché alla Texas avrebbero pensato ad un numero così balzano (2716 x 1528), ed a cosa serve, se mi risulta inutile in una direzione e mancante nell’altra?
Vediamo invece cosa accadrebbe se la corrente di pensiero corretta fosse la seconda. Il singolo elemento viene dunque spostato di un pixel e mezzo di qua e di là, dove il “qua” e “là” significa in diagonale. Tutto ciò avviene in due passaggi da 1/120 di secondo l’uno (e va bene), durante i quali viene proiettata la prima immagine da 4 Mpixel (2716 x 1576 = 4.150.048) e quindi la seconda, sempre da 4 Mpixel; a questo punto un attuatore ottico la sposta in diagonale, ed in questo modo, in due passaggi da 1/120 di secondo si ottiene un’immagine da 8 Mpixel in 1/60 di secondo, ossia la famosa frequenza di 60 Hz (= 60 fotogrammi al secondo).
Ma perché fare questo, e soprattutto, perché questi numeri? Mi è venuto in aiuto un vecchio documento del 2007 della Texas intitolato “The SmoothPicture Algorithm: An Overview” , di David C. Hutchison, Texas Instruments – DLP TV. All’epoca si trattava di passare dai chip 1280 x 720, che erano disposti come abbiamo visto nella figura precedente, ad una risoluzione superiore (1920 x 1080), contenendo però i costi. Problema che anche oggi non appare diverso. Cosa fece allora TI? Ruotò di 45° il DMD, realizzando la disposizione “diamond” (shape, layout o display, come preferite, oppure “a losanga” come preferisce dire Gian Luca, visto che siamo in Italia). Che sarebbe questa (e non fate caso ai numeri dei pixel, perché, per brevità, le figure sono prese dal documento Texas citato):
Ora, la domanda è questa, ossia quella di prima: ma perché alla TI è venuto in mente di usare queste quantità? Qui scatta l’illuminazione delle 3 di notte (o sarà una frontata? 🙂 ), precisamente alle 3:21, orario della mia email a Gian Luca e a Nicola. Potrebbe non avere senso sulla base delle indicazioni di Emidio, o magari potrebbe essere usata da Texas in futuro… chi lo sa?
Consideriamo ovviamente la dimensione di un DMD come un numero puro, ossia adimensionale e pertanto pari ad 1, osserviamo questo semplice fatto. Se metto i DMD nella disposizione tradizionale, la loro lunghezza e larghezza sono, appunto, unitarie e pari ad 1 (ovviamente per il numero dei pixel, che siano 1920 x 1080 o 3840 x 2160 non fa alcuna differenza). Ma se li giro nella configurazione “offset diamond pixel layout” (definizione Texas), che cosa ottengo? Beh, grazie alla trigonometria o più elementarmente al teorema di Pitagora, la dimensione risulta essere pari ad 1 per la radice quadrata di 2, ossia 1.414, sia in verticale che in orizzontale. Se ora prendo le dimensioni della misteriosa matrice Texas da 2716 x 1528 e le moltiplico per 1.414, cosa ottengo? Beh, guarda caso, proprio 3840 x 2160! Questo dunque potrebbe spiegare perché Texas abbia girato in questa configurazione i DMD, perché la potenza di calcolo richiesta per pilotare una matrice 2716 x 1528 è inferiore a quella necessaria ad una 3840 x 2160 (fonte sempre di Nicola D’Agostino, dai suoi passati colloqui con gente della TI), e perché in questo modo riusciamo a rimappare esattamente una matrice a più alta risoluzione senza doverci sobbarcare i costi di una elettronica per ora riservata ad altre applicazioni come il cinema, più remunerative dell’Home Theater! Guardate che lo stesso giochetto è stato applicato in passato: nel documento citato si parlava di matrice diamond da 960 x 540, che risultavano quindi essere pari a 1357 x 763, ossia molto vicine a 1366 x 768 dell’epoca.
Ora, se la disposizione fosse quella della figura precedente, avremmo una perfetta rimappatura della matrice UHD da parte di due semiquadri da “mezza” risoluzione, in quanto il primo semiquadro da 2716 x 1528 occupa posizioni che non collidono per nulla con il semiquadro successivo, che va a riempire esattamente i “buchi” lasciati vuoti per arrivare a 3840 x 2160. In realtà Texas ci continua a dare briciole di informazione e dice che lo shift dell’immagine avviene di un pixel e mezzo, ossia così:
Quindi cosa succede se questa fosse la situazione reale, come io penso che sia? Che avremmo un “circolo di confusione” intorno al pixel, in quanto, come vedete dalla figura, la risoluzione non è quella del singolo pixel, ma esiste una sovrapposizione dovuta al riempimento. L’occhio è ovviamente ingannato dalla frequenza superiore alla sua capacità risolutiva, e quindi il risultato è comunque ottenuto.
Ma quale delle due soluzioni scegliere? Beh, verifichiamolo. Come? Ho usato uno dei pattern che vanno di moda su AVSForum, ossia quelli di Masciola, nella fattispecie quelli della risoluzione orizzontale e verticale.
Intanto come riferimento metto il pattern che adesso vi presenterò ripreso con un LG OLED, che ovviamente ha una risoluzione nativa 3840 x 2160 pixel e quindi risolve tutto perfettamente. Eccolo qui:
Se la soluzione corretta fosse la prima (traslazione orizzontale), quella verticale dovrebbe essere a postissimo, con un numero sovrabbondante di pixel di 5432, mentre su quella orizzontale dovrebbe essere deficitaria.
Se avessimo la perfetta rimappatura a pixel diamond dovremmo vedere tutto perfettamente, ossia ogni singolo pixel. Se invece la soluzione scelta fosse quella dello shift di un pixel e mezzo in obliquo, dovremmo vedere sia in orizzontale che in verticale un’immagine non precisa.
Queste sono le foto che ho ottenuto (l’immagine proviene da un Canon EF 100-400 mm f/4.5-5.6 L IS II USM posto su cavalletto, ed è un jpg non processato (non ho usato il RAW per non svilupparlo nemmeno tramite Lightroom). Sono relative alla risoluzione orizzontale e poi verticale.
Ora, mi pare evidente, abbiamo un problema. L’Optoma non risolve né in orizzontale né in verticale. E quindi? Se l’opzione di Emidio è giusta, con una risoluzione di 5432 pixel dovrei vedere tranquillamente il singolo DMD. Ed invece vedete che ciò non accade.
Ma dato che non c’è una traslazione dell’intero pattern (avremmo allora 5432 x 3056 pixel, ossia 16.6Mpixel e Texas lo avrebbe dichiarato! E d’altronde che l’immagine non abbia questa risoluzione lo si vede in pratica) ma solo la possibilità di uno shift in diagonale, quello che sembra compatibile è l’opzione del diamond pattern con appunto un pixel e mezzo di traslazione, che dovrebbe dare luogo ad una mancanza di risoluzione (a livello del singolo pixel) sia in orizzontale che verticale.
L’ultima cosa che mi viene da pensare è la traslazione in diagonale, sempre di un pixel e mezzo e, forse, questo potrebbe spiegare la mancanza di risoluzione in entrambe le direzioni. Ma viene da chiedersi: e perché mai avrei dovuto traslare prima a destra e poi in alto quando facendo un solo movimento avrei acquistato maggiore risoluzione?
Ultima ipotesi: se andiamo ad ingrandire molto le immagini di sopra riprese dallo schermo, si vede che quando ho scattato con un tempo di circa 1/30 compare una traccia (che dovrebbe essere lo spostamento del perno centrale del DMD che fa un percorso con un angolo di 10-15° circa in diagonale).
E se fosse questo lo spostamento, partendo da un pattern ortogonale e con un piccolo shift di lato sufficiente a parlare di “spostamento in diagonale” e “riempimento della matrice 3840 x 2160” in quanto i pixel non sono uguali anche se molto vicini? Forse questo è l’unico modo per giustificare ciò che vediamo…
La partita rimane aperta: avrei voluto darvi una spiegazione certa, ma mi rendo conto che non mi è possibile. Prendetelo come un tentativo di fare chiarezza cercando di ragionare sui fatti, in attesa che il proprietario della tecnologia sciolga l’arcano.
In pratica, il sistema funziona. Non mi lascerei andare ad affermazioni lette su recensioni d’oltreoceano che apoditticamente sostengono che non abbia senso parlare di risoluzione nativa 3840 x 2160 o altro perché tale distinzione sia stata superata da TI (perché se fosse così vorrei vedere come si vedrebbe una matrice con risoluzione 8.300.096 x 1! Tanto, secondo questo concetto, il totale sono sempre 8 milioni di pixel…), ma ciò che conta è la visione sullo schermo. La percezione di nitidezza esiste e che importa se rinunciamo a qualche pixel “vero”?